Graph Contrastive Learningwith Reinforcement Augmentation

🕗 发布于 2024-10-12 20:42 图神经网络对比学习

IJCAI24
推荐指数： #paper/⭐⭐⭐
领域：图增强+强化学习

胡言乱语：

不愧是清华组的论文，这个实验的目的是利用强化学习去生成对比学习的增强视图。但是，其仍然有一些小问题：其本质实际是对以往的图增强方法套了一层强化学习的壳（因此好像也没有获得oral或者spotlight)，个人觉得提升应该不明显。但是明显是一个有趣的方向

个人觉得可以继续做的方向：

大图+强化学习自增强视图。实际上，理论上应该为每个sample子图自适应生成视图（由于大图的每个子领域的多样性，理论上适用的增强也不同)。因此，在大图上为每个子图分配自适应相应的增强视图
1. 其结合之前的一篇偏理论分析的文章–Perfect Alignment May be Poisonous to Graph Contrastive Learning会更好。这篇文章探讨了什么样的图增强和增强后的结果相关。个人觉得改文章提出的策略可以自适应的生成增强图
1. 当然，1和2结合起来会更好（其实对neurips的一篇偏理论文章很感兴趣，但是没有会员资格，提前看不了，有大佬可以提前帮忙下载一篇不)
问题背景
1.什么样的视图是好视图?
良好的增强视图如何变化以提升GCL的性能？我们认为，一个好的增强视图应该保持渐进进化的特征，类似于人类认知中的逐步学习进展，当连续几天学到的东西之间存在联系时，更容易理解和接受新信息。言而总之 会学习的视图是好视图
2.保存更好的原始图图结构信息
在特定的图结构中，边沿删除或者节点删除损坏图结构信息。一些GCL使用无需增强的方法例如编码器perturbation去处理这个问题。但是，扰乱率有很难确定。那么，是否有一种方案在不干扰编码器的情况下去保留原始图的基本结构信息？
解决方法：

10.1. 我们提出动态调整GDA的参数，去自适应学习好视图
10. 我们学习到加权边来构造新视图，而无需删除节点或者边，属性
11.### 但是随之面临的挑战：
11. 现有的图强化学习不适合GDA
12.2. 如何基于图环境设计有效的激活函数仍不确定

贡献：

我们提出了GRA框架，这是GCL的一种新型GDA，基于强化学习。该框架为GDA制定了马尔科夫决策过程，并保留了原始的图结构信息
1. 我们设计GA 2C模型作为GRA框架的实例，以实现连续且可学习的图数据增强
整体框架
冻结GDA参数的GCL框架
如图可见，其主要方法就是学习到一个增强视图A来作为对比学习的增强视图。本方法的视图增强部分便以此为参考：
我们的GRA框架
GRA 框架

10.### Min-max对比学习损失优化以及积累回报函数
$\min_{\boldsymbol{\phi},\boldsymbol{\varphi}}\mathcal{L}_{\mathbf{NCE}}(g_{\boldsymbol{\varphi}}(f_{\boldsymbol{\phi}}(f_{\boldsymbol{\phi}}(\mathcal{G}_{i})),\:g_{\boldsymbol{\varphi}}(f_{\boldsymbol{\phi}}(A_{\tilde{\boldsymbol{\omega}}_{i}^{*}}(\mathcal{G}_{i}))))\\\text{s.t. }\tilde{\boldsymbol{\omega}}_{i}^{*}=\arg\max_{\tilde{\boldsymbol{\omega}}_{i}}R(\tilde{\boldsymbol{\omega}}_{i}).$

GDA的马尔科夫决策：

（这部分需要强化学习相关知识，看莫凡的课程就可以了地址链接
$\mathbb{P}(\tilde{\mathcal{G}}_i^{(t+1)}|\tilde{\mathcal{G}}_i^{(t)})=\mathbb{P}(\tilde{\mathcal{G}}_i^{(t+1)}|\tilde{\mathcal{G}}_i^{(1)},\cdots,\tilde{\mathcal{G}}_i^{(t)}).$
GDA的马尔科夫决策可以被三元组定义为：
$(\mathcal{S}_{\mathrm{state}},\mathcal{S}_{\mathrm{action}},\hat{R})$
我们可以设计奖励函数为：
$R^{(t)}=-\mathcal{I}(Z_i^{(t)},\tilde{Z}_i^{(t)}),\\\boldsymbol{Z}_i^{(t)}=g_{\boldsymbol{\varphi}}(f_{\boldsymbol{\phi}}(\mathcal{G}_i^{(t)})),\quad\tilde{\boldsymbol{Z}}_i^{(t)}=g_{\boldsymbol{\varphi}}(f_{\boldsymbol{\phi}}(\tilde{\mathcal{G}}_i^{(t)})).$

保存图结构信息通过图重新加权

假设原始的图权重矩阵为 $\boldsymbol{E}_{\mathcal{G}_i}{\in}\mathbb{R}^{N_i\times N_i}$
增强视图就为：
$\mathrm{Aug}_{\mathrm{ERW}}:\boldsymbol{E}_{\mathcal{G}_i}\mapsto\boldsymbol{E}_{\mathcal{G}_i}\circ\tilde{\boldsymbol{\omega}}_i^{(t)},$
$w$ 即为加权矩阵。当t=0时， $w$ 为全一矩阵
举个例子， $[[1.0,0.6,0.8]^\mathrm{T},[0.6,1.0,0]^\mathrm{T},[0.8,0.0,1.0]^\mathrm{T}]$ 即代表(v1,v2)的权重为0.6，(v1,v3)代表权重为0.8

GA2C model

文章配图
那么，显然就有一个问题，是我们如何获得权重矩阵，以及加权后的特征
$\begin{aligned}&\tilde{\boldsymbol{\omega}}_i^{(t+1)}=&\text{Sigmoid}(\text{Reshape}(\boldsymbol{H}_i^{(t)})),\\&\boldsymbol{H}_i^{(t)}=&\text{BN}(\mathrm{CC}(\mathrm{RD}(\left\{\boldsymbol{h}_{v,k}^{(t)}|v{\in}\tilde{\mathcal{G}}_i^{(t)}\right\})|k{=}1,\cdots,K)),\\&\boldsymbol{h}_{v,k}^{(t)}=&\text{MLP}_{\theta_A}(\sum_{u\in\mathcal{N}_i(v)\cup\{v\}}\frac{[\tilde{\boldsymbol{\omega}}_i^{(t)}]_{v,u}\cdot\boldsymbol{h}_{u,k-1}^{(t)}}{d(v)\cdot d(u)}),\end{aligned}$
如图，权重矩阵是通过特征 $H$ 通过reshape变为的。sigmoid是sigmoid激活函数。得到权重矩阵后，RD是readout函数。CC是拼接层（将1-k层的特征嵌入拼接起来)。BN是batch normalization layer。最后，通过低k层的加权聚合函数，得到嵌入h。
如下的细节：

$h_{v, k}^{(0)} = \left[ X_{\mathcal{G}_{i}} \right]_{v}$
1. GDA参数矩阵 $\tilde{\omega}_i^{(t+1)}$ 由 $\tilde{\mathcal{G}}_i^{(t)}$ 得到
新视图的生成（相当于DQB的Action函数)
$\tilde{\mathcal{G}}_i^{(t+1)}=A_{\tilde{\boldsymbol{\omega}}_i^{(t+1)}}(\mathcal{G}_i^{(t)})$
A即Actor的A。
评估子模型的结构（相当于期待的输出，有点类似于Q函数）
V是评估重写参数矩阵的Value（价值)
评估子模型评估 $\tilde{V}_i^{(t+1)}$ 依据关于 $\tilde{\mathcal{G}}_i^{(t+1)}$ 的边权重信息
$\begin{aligned}&\tilde{V}_i^{(t)}=\text{Reshape}(\boldsymbol{M}_i^{(t)}),\\&\boldsymbol{M}_i^{(t)}=\text{BN}(\mathrm{CC}(\mathrm{RD}(\left\{\boldsymbol{m}_{v,k}^{(t)}|v{\in}\tilde{\mathcal{G}}_i^{(t)}\right\})|k{=}1,\cdots,K))\\&\boldsymbol{m}_{v,k}^{(t)}=\text{MLP}_{\theta_C}^k(\sum_{u\in\mathcal{N}_i(v)\cup\{v\}}\frac{[\tilde{\boldsymbol{\omega}}_i^{(t)}]_{v,u}\cdot\boldsymbol{m}_{u,k-1}^{(t)}}{d(v)\cdot d(u)}),\end{aligned}$
10.### 我们可以更新如下：
我们因此可以评价A(advantage-value函数)
$\tilde{A}_i^{(t)}{=}\tilde{Q}_i^{(t)}-\tilde{V}_i^{(t)}{=}R^{(t+1)}+\gamma\tilde{V}_i^{(t+1)}-\tilde{V}_i^{(t)},$
如上，A表示通过动作的实际输出(Q)与期待输出（V）之间的差异。上述部分就是标准的强化学习步骤，如下作者重写了部分。

更新critic

优化目标位最大化：
$\mathcal{J}_C=\sum_{t=1}^T(\tilde{A}_i^{(t)})^2$
梯度被重写为：
$\nabla_{\theta_C}\mathcal{J}_C=\frac d{d\theta_C}\sum_{t=1}^T(\tilde{A}_i^{(t)})^2,$

Actor的更新

(其就相当于Qlearning的 $\tilde{Q}_i^{(t)}$ )
优化目标为：最大化：
$\mathcal{J}_{A}=\sum_{t=1}^{T}\mathrm{log}\pi_{i}(\tilde{\omega}_{i}^{(t+1)}|\tilde{\mathcal{G}}_{i}^{(t)})\cdotp\tilde{\boldsymbol{A}}_{i}^{(t)}$
梯度被重写为：
$\nabla_{\theta_A}\mathcal{J}_A=\sum_{t=1}^T\frac{d\text{log}\pi_i(\tilde{\boldsymbol{\omega}}_i^{(t+1)}|\tilde{\mathcal{G}}_i^{(t)})}{d\theta_A}\cdotp\tilde{\boldsymbol{A}}_i^{(t)},$

结果

文章配图

原文地址：https://blog.csdn.net/chairuilin/article/details/142863534

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：springboot 集成flyway数据库迁移版本控制详细教程
下一篇：Ubuntu 详解| Ubuntu ssh| Ubuntu apt命令大全| Ubuntu性能优化| Ubuntu换镜像源

开发指南072-图片热点
/处理跳转： area.getAttribute('href');平台支持使用图像导航界面，例如展示如下一张图，用户点击对应位置触发对应动作。热点数据通过后台接口获取（注意处理权限，没有权限的热点不生
阅读更多2024-10-13
使用机器学习边缘设备的快速目标检测
这项机器学习研究探讨了一种低成本的边缘设备，该设备与具有计算机视觉功能的嵌入式系统集成，以提高目标检测和分类的推理时间和精度。研究的主要目标是减少推理时间并降低功耗，以支持一个竞技型类人机器人的嵌入式
阅读更多2024-10-13
【Windows】【DevOps】Windows Server 2022 安装ansible，基于powershell实现远程自动化运维部署入门到放弃！
文件URL：https://www.python.org/ftp/python/3.13.0/python-3.13.0-amd64.exe。直接拿linux主机测试ansible连接windows
阅读更多2024-10-13
C# 中循环的应用说明
一循环的概念说明二、循环类型三、循环控制语句四、无限循环
阅读更多2024-10-13
Linux `vmstat` 命令详解
vmstat（Virtual Memory Statistics）是 Linux 系统中的一个监控工具，用于报告系统的虚拟内存、进程、CPU 活动等信息。它能帮助用户了解系统的整体性能状况，尤其是内存
阅读更多2024-10-13
Linux下多任务编程（网络编程2）
本文介绍解决accpet和recv相互阻塞的问题，可以用多线程并发外也可以用epoll I/O多路复用的方式解决。
阅读更多2024-10-13
[单master节点k8s部署]37.微服务（一)springCloud 微服务
微服务架构的一个重要特点是，它与开发中使用的具体或无关。每个微服务都可以使用最适合其功能需求的语言或技术来实现。例如，一个微服务可以用Java编写，另一个微服务可以用Python、Go、Node.js
阅读更多2024-10-13
Zynq(3)使用外设MIO/EMIO
使用MIO/EMIO实现流水灯，着重介绍Zynq IP核的配置，解读vitis中的c语言程序，介绍MIO与EMIO的区别。
阅读更多2024-10-13
笔试算法总结
思路很简单，但是当时做题提交的时候，通过率总是18%。不知道为啥，后面我改成了Long类型，然后就通过了全部用例。（易错1：第一次提交没考虑0的情况）使用 StringBuilder 模拟栈的行为，通
阅读更多2024-10-13
快速学习一个算法，Transformer模型架构
它的主要思想是在同一时间通过多个独立的注意力头（Attention Head）来关注序列中不同部分的信息，然后将这些信息综合起来，生成更丰富的表示。自注意力机制的目的是对输入序列中的每个元素计算一个输
阅读更多2024-10-13

Graph Contrastive Learningwith Reinforcement Augmentation

胡言乱语：

个人觉得可以继续做的方向：

问题背景

1.什么样的视图是好视图?

2.保存更好的原始图图结构信息

解决方法：

贡献：

整体框架

冻结GDA参数的GCL框架

我们的GRA框架

GRA 框架

GDA的马尔科夫决策：

保存图结构信息通过图重新加权

GA2C model

新视图的生成（相当于DQB的Action函数)

评估子模型的结构 （相当于期待的输出，有点类似于Q函数）

更新critic

Actor的更新

结果

相关文章

评估子模型的结构（相当于期待的输出，有点类似于Q函数）