【提示学习论文】ProGrad：Prompt-aligned Gradient for Prompt Tuning论文原理

🕗 发布于 2024-04-08 14:09 学习 prompt

Prompt-aligned Gradient for Prompt Tuning（CORR2022 / ICCV2023）

1 Motivation

在这里插入图片描述

经过CoOp微调过的prompt会导致模型更关注背景而不是前景对象，对于分类任务不利

2 Contribution

在这里插入图片描述
提出了一种基于prompt对齐的梯度的引导方法（ProGrad），来应对prompt学习中添加的不正确偏置的问题。在tuning的过程中进行一种正则化，来确保这一步的tuning不和原本的知识（zero-shot CLIP）产生冲突。

一般方向（general direction）：zero-shot CLIP
域特殊方向（domain-specific direction）：CoOp计算得出
- 垂直向量 $G_⊥$
- 平行向量 $G_∥$

3 具体方法

由CoOp进行学习的域特殊方向，加强其在当前数据下的精度的优化方向，但是这可能导致过拟合。用一个一般普通的prompt和zero-shot CLIP的logits计算一个KL散度，这个KL散度回传的梯度作为一般方向。

3.1 交叉熵损失

在这里插入图片描述
$L_{ce}$ ：模型预测 $p(t_i|x)$ 与真实值 $y$ 的交叉熵损失

3.2 KL散度

在这里插入图片描述

$L_{kl}$ ：模型预测 $p(t_i|x)$ 与zero-shot CLIP预测 $p_{zs}(w_i|x)$ 的KL散度

3.3 梯度

将 $L_{ce}$ 的梯度表示为 $G_d =∇_vL_{ce}(v)$
将 $L_{kl}$ 的梯度表示为 $G_g =∇_vL_{kl}(v)$

在这里插入图片描述

$G_d$ 和 $G_g$ 的关系：

夹角小于90°：说明下游知识优化方向与一般知识不冲突，此时安全地更新梯度 $G_{prograd}$ 作为 $G_d$
夹角大于90°：说明下游知识优化方向与一般知识冲突，此时，将 $G_d$ 投影 $G_g$ 的正交方向，避免增加 $L_{kl}$

3.4 ProGrad策略公式

在这里插入图片描述
在本文CoOp中，我们没有使用 $G_d$ 来更新上下文向量，而是使用 $G_{prograd}$ 来优化，可以避免过拟合：

λ=1：将 $G_d$ 投影到 $G_g$ 的正交方向
λ=0：使prograd退化为CoOp

3.5 总体流程

在这里插入图片描述

可学习上下文和类别输入文本编码器，图像输入图像编码器
将文本特征与图像特征计算相似概率，得到 $p$
$p$ 与 $y$ 计算 $CE L oss$ ，得到 $G_d$
$p$ 与 $p_{zs}$ 计算 $K LL oss$ ，得到 $G_g$
将 $G_d$ 和 $G_g$ 反传回去，使用 $G_{prograd}$ 更新可学习参数

原文地址：https://blog.csdn.net/weixin_51293984/article/details/137423337

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：zookeeper之基本命令
下一篇：谷歌（Google）技术面试——在线评估问题（三）

linux网络编程实战
之前找工作的之后写了一些网络编程的笔记和代码，然后现在放到csdn上保存一下。有几个版本的，看看就好。就是简单的实现一下服务端和客户端之间的交互的，还没有我之前上linux编程课写的代码复杂。
阅读更多2024-10-06
PriorityQueue分析
PriorityQueue：概述、应用场景、源码、堆排序；拓展：JDK里PriorityBlockingQueue和DelayQueue、ScheduledExecutorService、Rocket
阅读更多2024-10-06
CANoe_TestModule截图功能TestReportAddWindowCapture
TestReportAddWindowCapture方法作为CAPL脚本中的一个重要功能，其能够将指定窗口的屏幕截图添加到测试报告中，对于记录和验证界面状态具有重要意义。本文将全面解析TestRepo
阅读更多2024-10-06
数据服务-实时同步(sersync)
1.之前我们通过rsync+定时任务实现定时备份/同步2. 对于NFS我们需要进行实时同步。
阅读更多2024-10-06
unity ps 2d animation 蛇的制作
unity ps 制作小蛇
阅读更多2024-10-06
C语言：预编译过程的剖析
5. _ _STDC_ _ //如果编译器遵循ANSI C，其值为1，否则未定义。在执行编译一个程序的时候，我们如果要将一条语句（一组语句）编译或者放弃是很方便的。1.
阅读更多2024-10-06
游戏中的对象池技术探索（一）
本篇文章我们就来探索一下如何在游戏开发中设计通用对象池，使之易于使用和扩展。
阅读更多2024-10-06
字节跳动收购Oladance耳机：强化音频技术，加速VR/AR生态布局
此次收购，字节跳动不仅获得了Oladance的核心技术，还吸纳了一支经验丰富的团队，补足了自身在音频技术方面的短板。对于字节跳动而言，此次收购具有深远意义。其次，这次收购也是字节跳动AI硬件战略的重要
阅读更多2024-10-06
linux：详解nohup命令
在 UNIX 和类 UNIX 操作系统（如 Linux 和 macOS）中，nohup 意图为后台运行且免疫挂断信号的命令，用于在用户注销（logout）或终端关闭后继续运行相应的进程。
阅读更多2024-10-06
expressjs 中的mysql.createConnection，execute 怎么使用
在 Express.js 应用中使用 MySQL 数据库，你通常会使用mysql或mysql2这样的库来创建和管理数据库连接，并执行查询。然而，并不直接提供execute方法。相反，你可以使用quer
阅读更多2024-10-06

【提示学习论文】ProGrad：Prompt-aligned Gradient for Prompt Tuning论文原理

Prompt-aligned Gradient for Prompt Tuning（CORR2022 / ICCV2023）

1 Motivation

2 Contribution

3 具体方法

3.1 交叉熵损失

3.2 KL散度

3.3 梯度

3.4 ProGrad策略公式

3.5 总体流程

相关文章