自学内容网 自学内容网

论文笔记:Vision GNN: An Image is Worth Graph of Nodes

neurips 2022

首次将图神经网络用于视觉任务,同时能取得很好的效果

1 方法

2 架构

  • 在计算机视觉领域,常用的 transformer 通常是 isotropic 的架构(如 ViT),而 CNN 更喜欢使用 pyramid 架构(如 ResNet)
  • 论文两种ViG架构都设置了
    • isotropic 架构——主体在整个网络中具有大小和形状相同的特征
    • Pyramid架构——层越深提取空间尺寸越小的特征

3 实验

图片分类任务:


原文地址:https://blog.csdn.net/qq_40206371/article/details/139301373

免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!