【论文总结】基于深度学习的特征点提取，特征点检测的方法总结

🕗 发布于 2024-01-20 08:54 深度学习 人工智能 学习笔记论文阅读

这里写目录标题

相关工作
1. Discriminative Learning of Deep Convolutional Feature Point Descriptors(2015)
- 网络结构
- sift算法
- 损失函数的构建
2.MatchNet(2015)
- 网络中的组成部分
- 其他组成部分
- 损失函数
- 结果
3.LIFT: Learned Invariant Feature Transform(2016)
- 网络结构
- 训练网络结构
- 损失函数
- 训练和测试
- 结果
4. UCN(Universal Correspondence Network)(2016)
- 网络结构
- 损失函数
- 测试
对于LOSS做实际对比实验测试
5. SuperPoint Self-Supervised Interest Point Detection and Description(2018)
- 训练网络主体结构
- 损失函数
- 总结
- 结果
6. SuperGlue:Learning Feature Matching with Graph Neural Networks
- 总体框架
- 网络主体
- 损失函数
- 结果
6. Key.Net Keypoint Detection by Handcrafted and Learned CNN Filters(2019)
- 训练步骤
- 测试结果
7. IF-Net An Illumination-invariant Feature Network(2020)
- 训练集
- 网络结构
- 损失函数
- 结果
时间轴
方法总结
数据集总结
与传统算法优劣势对比
应用

1. Discriminative Learning of Deep Convolutional Feature Point Descriptors(2015)

提出一种基于深度学习的特征描述方法能够替代引FT，并且能够很好的应对尺度变化、图像旋转乁透射变换、非刚性变形、光照变化等。使用孪生网络从图块中提取特征信息，并且使用L2距离来描述特征之间的差异。

在这里插入图片描述
这里距离越大相似度越低，距离越小相似度越高
只拿出CNN部分则是特征提取

网络结构

在这里插入图片描述

sift算法

在这里插入图片描述

损失函数的构建

在这里插入图片描述

在两个patch是相等的情况下，用两个patch特征的距离来作为Loss函数，我们希望距离越来越小
在两个patch不相等的情况下，多了,MAX和阈值C，如果两个patch特征的距离>c，LOSS=0，如果两个patch特征的距离<c,则为C-如果两个patch特征的距离
patch不相等希望距离大于C，patch相等希望距离越小越好
这种方法进行训练，可以训练出一个特征提取的CNN网络

2.MatchNet(2015)

网络中的组成部分

在这里插入图片描述

A: Feature network 是双塔结构中的单塔，其中的Bottleneck与Preprocessing层比较重要，是为了防止过拟合加的两个层.

B：Metric network 相当于把特征进行比较，Fully Connected Layer +Softmax层判断两个图像特征之间的距离

在这里插入图片描述

输出把两个塔的输出放到一块，在输出到Metric network

其他组成部分

在这里插入图片描述

损失函数

在这里插入图片描述

结果

在这里插入图片描述

3.LIFT: Learned Invariant Feature Transform(2016)

网络结构

在这里插入图片描述

用了三种方法，集合了detector，orientation,descriptor
detector：把图像切割成不同的patch
orientation：对patch做一个旋转
descriptor：做一个描述
这三个方法是三个不同的文章
在这里插入图片描述

训练网络结构

在这里插入图片描述
训练的时候要先输入4个patch，4个patch要不一样，P1和P2是来自同一个3D点不同视角的图像，相当于P1与P2是匹配的，P3是在不同的3D点回来的一个图像投影，相当于P3,P2,P1是不匹配的，P4是一个不包含任何特征点的特征，是为了防止过拟合去用的
输入的流程就是先进入detector然后对图像进行一个裁剪，紧接着用orientation对图像进行一个旋转，再用descriptor输出图像最终的描述符

损失函数

在这里插入图片描述
descriptor的损失函数和之前的损失函数几乎是一样的
orientation训练了一个角度
detector网络训练一个有特征的中心点

训练和测试

在这里插入图片描述
会先输入多张的多尺度图片，最后可以直接输出特征点的特征向量

结果

4. UCN(Universal Correspondence Network)(2016)

在这里插入图片描述

最后会输出一个feature map

网络结构

在这里插入图片描述
最后会输出两个点的特征描述符，去做一个距离的比较，如果距离大于一个阈值说明像素比较低

输入层

在这里插入图片描述
首先输入两张图片，之后输入需要比较图片的坐标点

全卷积层

在这里插入图片描述
使用googleNet网络做全卷积

卷积空间变换

在这里插入图片描述

归一化

在这里插入图片描述
最后会把输入的x,y的点，映射到feature map里面去，输出描述符，然后去做一个比较

损失函数

在这里插入图片描述
不匹配的时候用阈值卡一个loss

测试

在这里插入图片描述

对于LOSS做实际对比实验测试

在这里插入图片描述

可以看到UCNloss的跳变非常厉害，对图像很敏感

5. SuperPoint Self-Supervised Interest Point Detection and Description(2018)

在这里插入图片描述

重点在于训练方法

训练网络主体结构

在这里插入图片描述

（A）base detector 如何训练

在这里插入图片描述
数据集有标注角点的位置，并且有噪声
heatmap中分数比较高的点就是角点，分数比较低的点就不是角点

（B）如何迁移到普通图片

在这里插入图片描述
原始图片进行随即变形，再放进刚才的base-detect 提取角点，然后把所有的角点拼到一块生成新的角点，然后重新训练，自我标注技术

（C）joint training

用superpoint提取真正的兴趣点，再对这些兴趣点做loss
在这里插入图片描述
decoder之后会生成这样的矩阵，包含Cell的信息，每一个像素的信息，代表这个坐标点是否能作为兴趣点的信息，值比较高就是能作为兴趣点，值比较低就是不能作为兴趣点，把寻找兴趣点的回归问题换为分类问题

上面是找兴趣点，下面是找描述子，对特征进行一个描述

损失函数

在这里插入图片描述

总结

既能提取特征点，又能提取描述子，并且对特征点进行打分

结果

在这里插入图片描述
然后这里的比较还是和传统方法比较的

6. SuperGlue:Learning Feature Matching with Graph Neural Networks

在superpoint的匹配方法做了一个改进，不再使用欧式距离方法，做匹配

在这里插入图片描述

总体框架

在这里插入图片描述
这里的M和N 就是superpoint输出的feature map，P就是对应兴趣点的矩阵，之后会再输出一个矩阵，表示两个点是否是匹配的

网络主体

在这里插入图片描述

输入部分

在这里插入图片描述
输入部分会输入描述子和位置，会将位置信息encoder到描述子中去，我们的输出是x，

自注意力和交叉注意力

在这里插入图片描述

自注意力：单张图的注意力
交叉注意力：两张图一起看的注意力方法
类似于人类反复比较两张图

迭代

在这里插入图片描述
一开始自注意力是发散的，通过迭代，会发生收敛

sinkhorn算法

在这里插入图片描述
去匹配我们输出的描述符，用的是内积的方法得到一个得分最终放到两个矩阵上

损失函数

在这里插入图片描述

结果

在这里插入图片描述
绿线代表匹配成功，红线代表错误的匹配

6. Key.Net Keypoint Detection by Handcrafted and Learned CNN Filters(2019)

在这里插入图片描述

检测关键点的方法，最后的输出并不是提取出的特征而是关键点
主要贡献是用了一阶导数和二阶导数的融合
在这里插入图片描述

没有任何的网路结构，相当于一个手工生成的特征，每一层下采样，用金字塔一样的结构，得到三个相同的feature map （蓝色），三个feature map 放到一块做一个normalization，得到score map，相当于key point

得分比较高的是关键点，得分比较低的是非关键点，得到这样的一个feature map

训练步骤

在这里插入图片描述
首先会输入两张图片，然后通过刚才的网络，输出分数。先进行分离，对于每一块要通过NMS得到一个得分最高的点，每一块得分最高的点应该是匹配上的
就是看两张图片某个点是比较匹配点，就定为关键点

测试结果

在这里插入图片描述

7. IF-Net An Illumination-invariant Feature Network(2020)

在这里插入图片描述
针对光照不变性提出的网络

训练集

在这里插入图片描述
特有的顺序：从简单到难

网络结构

在这里插入图片描述

共享权值，双网络训练，上面用ps数据集，下面AMOS数据集，交替训练，取最好的权值进行共享

网络结构用到Lnet
在这里插入图片描述

损失函数

在这里插入图片描述
最应该被惩罚的值进行一个惩罚

结果

在这里插入图片描述

时间轴

在这里插入图片描述

方法总结

在这里插入图片描述

数据集总结

在这里插入图片描述

与传统算法优劣势对比

在这里插入图片描述

应用

在这里插入图片描述

原文地址：https://blog.csdn.net/weixin_46050242/article/details/135694188

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：webpack.config.js配置文件报错：The ‘mode‘ option has not been set
下一篇：深度学习—常见的卷积操作和卷积神经网络

解决 Spring Boot 中 `Ambiguous mapping. Cannot map ‘xxxController‘ method` 错误
在使用 Spring Boot 开发 Web 应用时，经常会遇到各种各样的错误。其中一种常见的错误是。本文将详细介绍这个错误的原因及解决方法，帮助开发者快速定位并解决问题。解决错误的关键在于确保每个方
阅读更多2024-11-15
数据分析案例-笔记本电脑价格数据可视化分析
本实验数据集来源于Kaggle，原始数据集共有1303条数据，13个变量，各变量含义如下：0 laptop_ID-数字-产品ID1 Company-字符串-笔记本电脑制造商2 Product-字符串-
阅读更多2024-11-15
Linux 如何查看当前系统版本的详细信息？
系统中基本都存在，所以是一种标准的获取系统信息的方式。命令以标准的方式提供详细的发行版信息。发行版的说明文件一般位于。
阅读更多2024-11-15
初级数据结构——栈
数据结构栈（Stack）是一种线性的数据结构，它只允许在序列的一端（称为栈顶）进行插入和删除操作。这种特性使得栈成为许多算法和问题解决中的有力工具。栈是一种简单而强大的数据结构，它遵循后进先出的原则，
阅读更多2024-11-15
网络安全练习之 ctfshow_web
根据前面得到的qq邮箱中的qq号查询用户，目前电脑版的QQ添加好友好像不能查看详细信息，手机版的可以看到对方所在地为陕西西安。路径是：/editor/attached/file/tmp/html/no
阅读更多2024-11-15
Python 三种方式实现自动化任务
本文介绍了用Python实现机器人过程自动化的三个包，方便读者选择、对比学习。
阅读更多2024-11-15
C++基础：Pimpl设计模式的实现
PIMPL （ Private Implementation 或 Pointer to Implementation ）是通过一个私有的成员指针，将指针所指向的类的内部实现数据进行隐藏。
阅读更多2024-11-15
【flutter】flutter2升级到3.
以这个 https://github.com/aa286211636/Flutter_QQ 为例子，升级下看看。只有登录界面能正常显示，别的页面都是报错。flutter这版本变动，基本不能直接ru
阅读更多2024-11-15
【JAVA毕业设计】基于Vue和SpringBoot的宠物咖啡馆平台
基于Vue.js和SpringBoot的宠物咖啡馆平台是一个综合性的在线服务系统，旨在为宠物爱好者提供一个便捷的宠物护理和社交场所。该平台分为管理后台和用户网页端，以满足不同用户群体的需求。管理后台主
阅读更多2024-11-15
认证鉴权框架SpringSecurity-2--重点组件和过滤器链篇
这4个接口中，每一个都是当认证或者授权过程中发生结果后触发，可以是失败的场景也可以是成功后触发。1个成功后执行，3个为失败后促发执行。
阅读更多2024-11-15

【论文总结】基于深度学习的特征点提取，特征点检测的方法总结

这里写目录标题

相关工作

1. Discriminative Learning of Deep Convolutional Feature Point Descriptors(2015)

网络结构

sift算法

损失函数的构建

2.MatchNet(2015)

网络中的组成部分

其他组成部分

损失函数

结果

3.LIFT: Learned Invariant Feature Transform(2016)

网络结构

训练网络结构

损失函数

训练和测试

结果

4. UCN(Universal Correspondence Network)(2016)

网络结构

输入层

全卷积层

卷积空间变换

归一化

损失函数

测试

对于LOSS做实际对比实验测试

5. SuperPoint Self-Supervised Interest Point Detection and Description(2018)

训练网络主体结构

（A）base detector 如何训练

（B）如何迁移到普通图片

（C）joint training

损失函数

总结

结果

6. SuperGlue:Learning Feature Matching with Graph Neural Networks

总体框架

网络主体

输入部分

自注意力和交叉注意力

迭代

sinkhorn算法

损失函数

结果

6. Key.Net Keypoint Detection by Handcrafted and Learned CNN Filters(2019)

训练步骤

测试结果

7. IF-Net An Illumination-invariant Feature Network(2020)

训练集

网络结构

损失函数

结果

时间轴

方法总结

数据集总结

与传统算法优劣势对比

应用

相关文章