自学内容网 自学内容网

48 全连接卷积神经网络 FCN【动手学深度学习v2】

全连接卷积神经网络:神经网络处理语义分割问题的奠基性工作,目前已不太常用。

了解一下全卷积网络模型最基本的设计。 如 下图所示,全卷积网络先使用卷积神经网络抽取图像特征,然后通过1×1卷积层将通道数变换为类别个数,最后通过转置卷积层将特征图的高和宽变换为输入图像的尺寸。 因此,模型输出与输入图像的高和宽相同,且最终输出通道包含了该空间位置像素的类别预测。

知识补充:

只考虑精度不考虑速度的话推荐使用rcnn

出于对训练速度的考虑,本节网络中的1*1卷积层,将7*7*512的数据结构直接压缩到了7*7*class_num,造成了较大的信息损失,若要对预测效果进行进一步优化的话可以调节这一层

13.11. 全卷积网络icon-default.png?t=N7T8https://zh-v2.d2l.ai/chapter_computer-vision/fcn.html

全连接卷积神经网络(Fully Convolutional Neural Network,FCN)是一种特殊类型的卷积神经网络(CNN),主要用于图像语义分割任务。与传统的CNN不同,FCN通过完全使用卷积层来替代全连接层,从而实现对任意尺寸输入图像进行像素级别的预测。

传统的CNN通常包含卷积层和全连接层。卷积层用于提取图像的局部特征,而全连接层将卷积层的输出转换为固定长度的向量,用于分类任务。然而,全连接层对输入图像的尺寸有限制,无法处理变化尺寸的输入图像。

FCN通过将全连接层替换为卷积层,使得网络可以接受任意尺寸的输入图像,并且能够输出与输入图像尺寸相同的特征图。这种特性使得FCN非常适用于图像语义分割任务,其中目标是为每个像素分配一个语义标签。

FCN的关键思想是使用卷积层进行下采样和上采样操作,以保持空间信息。下采样通过使用具有较大步幅的卷积层或池化层来减小特征图的尺寸,同时增加特征图的深度。上采样通过使用转置卷积等操作将特征图的尺寸恢复到输入图像的尺寸,同时进行特征图的细化。

在FCN中,通常采用编码器-解码器结构。编码器部分由多个卷积层和池化层组成,用于提取图像的特征表示。解码器部分则通过上采样操作将低分辨率的特征图恢复到输入图像的尺寸,并生成像素级别的预测。此外,FCN通常使用跳跃连接(Skip Connections)来融合不同层级的特征,以提高分割结果的细节和准确性。

FCN在图像语义分割任务中取得了很大的成功,成为了一种重要的架构。它在许多计算机视觉领域的应用中广泛使用,如医学图像分析、自动驾驶、图像生成等。


原文地址:https://blog.csdn.net/qq_53826699/article/details/137559902

免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!