LD2 Scalable Heterophilous Graph Neural Network with Decoupled Embeddings

🕗 发布于 2024-09-28 04:21 大图学习

Neurips 24
推荐指数： #paper/⭐⭐⭐
领域：可扩展图，大图加速
整个文章的理论部分比较多，尽量尽我所能避开一些额外公式。详细文章，见链接

模型架构

文章配图
如图，整个模型分为与计算和训练两部分。本文的精华在于预训练

LD2–一个解耦的异配图gnn

为了更好的加速，我们使用了多通道结果去增加灵活性。输入的数据是一系列的嵌入矩阵 $[P_{1},P_{2},\dots ,P_{C}]$
预计算
$\boldsymbol{P}_A,\boldsymbol{P}_X=\mathrm{A}^2\mathrm{Prop}(\boldsymbol{A},\boldsymbol{X})$
转换得嵌入
$\boldsymbol{H}^{(L)}=\mathrm{MLP}(\boldsymbol{P}_A\boldsymbol{W}_A\|\boldsymbol{P}_X\boldsymbol{W}_X).$

低纬邻接矩阵嵌入

由于二阶邻居信息很少受到同配异配信息的影响，因此我们对二跳邻接矩阵进行建模
$\boldsymbol{P}_A=\arg\min_{\boldsymbol{P}\in\mathbb{R}^{n\times F}}\|\boldsymbol{A}^2-\boldsymbol{P}\boldsymbol{P}^T\|_F^2.$
通过优化F范数，我们可以得到 $P_{A} \in \mathbb{R}^{n \times F}$ .
(谱分析视角见论文原文)

长距离特征嵌入

用 $P_X=\sum_{l=1}^{L_P}\theta_l\boldsymbol{T}^l\boldsymbol{X}$ 来计算特征，可能不太好(因为数据有高通低通中通)。按照低通高通中通，我们分别定义为 $P_{X,L2},P_{H},P_{X,0}$ 。
那么，
$\boldsymbol{P}_{X,H}=\frac1{L_{P,H}}\sum_{l=1}^{L_{P,H}}(\boldsymbol{I}+\tilde{\boldsymbol{L}})^l\boldsymbol{X}, (\theta_l=1, \boldsymbol{T}=\boldsymbol{I}+\tilde{\boldsymbol{L}})$
$\boldsymbol{P}_{X,L2}=\frac1{L_{\boldsymbol{P},\boldsymbol{L}2}}\sum_{l=1}^{L_{P,L2}}\bar{\boldsymbol{A}}^{2l}\boldsymbol{X}, (\theta_{l}=1,\boldsymbol{T}=\bar{\boldsymbol{A}}^{2})$
$\boldsymbol{P}_{X,0}=\boldsymbol{X}$
其中， $\tilde{L}=I-\tilde{A},\overline{A}$ 是没有自环的邻接矩阵。
(谱分析视角见原文)
拉普拉斯矩阵显然是高通过滤器，A是低通过滤器。这样，我们就可以构造高阶或者低阶如上长距离特征嵌入

近似邻接矩阵传播预计算

文章配图

近似特征嵌入计算

$\boldsymbol{P}_X=\sum_{l=0}^{L_P}\theta_l\boldsymbol{T}^l\boldsymbol{X}$
首先，初始值是： $\boldsymbol{R}^{(0)}=\boldsymbol{X}.$ 传播矩阵是T。拉普拉斯传播T=I+L.嵌入可以表示为迭代形式：
$\boldsymbol{R}^{(l+1)}(u)=2\boldsymbol{R}^{(l)}(u)-\sum_{v\in\mathcal{N}(u)}\boldsymbol{R}^{(l)}(v)/d^a(u)d^b(v)=\sum_{v\in\mathcal{N}(u)\cup\{u\}}\frac{\alpha_L(u,v)}{d^a(u)d^b(v)}\cdot\boldsymbol{R}^{(l)}(v)$
$\alpha_T(u,v)$ 对于T， $\begin{aligned}\alpha_L(u,u)=2d^{\boldsymbol{a+b}}(u),\alpha_L(u,v)=-1,v\in\mathcal{N}(u)\end{aligned}$ 。对于 $\tilde{A},\bar{A}$ ,分别是 $\alpha_{A}(u,v)=1\text{ and }\alpha_{A}(u,u)=1,0$

近似邻接矩阵嵌入的计算

$\boldsymbol{R}^{(0)}=N(0,1)$
$\boldsymbol{A}^2\mathrm{~as~}\boldsymbol{R}^{(l+1)}=\boldsymbol{A}^2\boldsymbol{R}^{(l)}$
之后，执行column-wise normalization
$\texttt{orthonormalize}(\boldsymbol{R}^{(l+1)})$
这样，矩阵就满足：
$\boldsymbol{A}^2\boldsymbol{R}^{(L_P)}=\boldsymbol{R}^{(L_P)}\boldsymbol{\Lambda}$
最后，结果是：
$\hat{\boldsymbol{U}}=\boldsymbol{R}^{(L_P)},\hat{\boldsymbol{P}}_A=\hat{\boldsymbol{U}}|\hat{\boldsymbol{\Lambda}}|^{1/2}$

实验结果：

文章配图
时间开销：

原文地址：https://blog.csdn.net/chairuilin/article/details/142603921

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：将之前实现的顺序表、栈、队列都更改成模板类
下一篇：解决方案：如何将字段名转成列，并将对应权重数值做好拼接

PHP 中，将 JSON 数据与二进制数据之间进行相互转化主要涉及两个步骤：
要将 JSON 数据转换为二进制数据，首先需要将 JSON 数据解析成 PHP 数组或对象，然后使用 PHP 的。函数将二进制字符串转换为 PHP 数组或对象，然后将其编码为 JSON 数据。如果你只
阅读更多2024-09-28
JavaEE: 探索网络世界的核心-IP协议
13位分片偏移: 是分片相对于原始IP报文开始处的偏移.其实就是在表示当前分片在原报文中处在哪个位置.实际偏移的字节数是这个值 * 8 得到的.因此,除了最后一个报文之外,其他报文的长度必须是8的整数
阅读更多2024-09-28
数据库常见概念
PostgreSQL 支持联合索引和聚簇索引，联合索引可以加速多列条件的查询，而聚簇索引控制数据在磁盘上的排列。适当地使用这些索引可以提高查询性能。
阅读更多2024-09-28
BEV学习---LSS4-模型训练
LSS训练测试
阅读更多2024-09-28
SpringCloud第六章(服务保护CircuitBreaker) -2024
CircuitBreaker是断路器的意思，由于原来的SpringCoud的hystrix停更，所以springcloud社区推出了的新断路器，用来进行springcloud的服务降级、限流、熔断由于
阅读更多2024-09-28
ubuntu 开启root
【代码】ubuntu 开启root。
阅读更多2024-09-28
MySQL数据查询（基础）
SELECT语句用于从表中查询数据。可以选择特定的列，也可以选择所有列。：使用表示选择所有列。
阅读更多2024-09-28
区块链可投会议CCF C--FC 2025 截止10.8 附录用率
CCF C：2025：2023年 39 full and 2 short papers selected from 182 submissions.
阅读更多2024-09-28
第1章 C语言概述
4.打开项目后，右击"源文件"并选择"添加"的"新建项"6.在"hello_word"文件下编写代码并点击运行。1.打开
阅读更多2024-09-28
Git 与 GUI 工具
当我们对 Git 的提交、分支已经非常熟悉，可以熟练使用命令操作 Git 后，再使用 GUI 工具，就可以更高效。
阅读更多2024-09-28