论文笔记:Vision GNN: An Image is Worth Graph of Nodes
neurips 2022
首次将图神经网络用于视觉任务,同时能取得很好的效果
1 方法
2 架构
- 在计算机视觉领域,常用的 transformer 通常是 isotropic 的架构(如 ViT),而 CNN 更喜欢使用 pyramid 架构(如 ResNet)
- 论文两种ViG架构都设置了
- isotropic 架构——主体在整个网络中具有大小和形状相同的特征
- Pyramid架构——层越深提取空间尺寸越小的特征
- isotropic 架构——主体在整个网络中具有大小和形状相同的特征
3 实验
图片分类任务:
原文地址:https://blog.csdn.net/qq_40206371/article/details/139301373
免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!