24/10/12 算法笔记 NiN

🕗 发布于 2024-10-17 01:58 笔记 深度学习 人工智能

LeNet、AlexNet和VGG都有一个共同的设计模式：通过一系列的卷积层与汇聚层来提取空间结构特征；然后通过全连接层对特征的表征进行处理。 AlexNet和VGG对LeNet的改进主要在于如何扩大和加深这两个模块。或者，可以想象在这个过程的早期使用全连接层。然而，如果使用了全连接层，可能会完全放弃表征的空间结构。 网络中的网络（NiN）提供了一个非常简单的解决方案：在每个像素的通道上分别使用多层感知机

看一下卷积层和全连接层对于空间结构信息的不同能力

卷积层（Convolutional Layers）：
- 卷积层通过滑动窗口（卷积核）在输入数据上进行局部连接操作，这种操作能够捕捉到输入数据的空间结构信息。例如，在图像处理中，卷积层可以检测到图像中的边缘、纹理、形状等空间特征。
- 由于卷积层的这种局部感受野特性，它们能够理解输入数据中的空间关系，如物体的位置、方向和相对布局。
全连接层（Fully Connected Layers）：
- 全连接层则不同，每个神经元与前一层的所有神经元都有连接。在图像数据中使用全连接层时，输入数据的空间维度通常会被展平（flatten）成一个长向量。
- 一旦图像数据被展平，空间维度的信息（如像素的位置）就会丢失，因为全连接层不再考虑输入数据的空间结构。这意味着全连接层无法直接从展平的数据中捕捉到与空间位置相关的特征。

如果在网络的早期阶段就使用全连接层，那么模型可能会失去对输入数据空间结构的表征能力。这是因为全连接层不保留空间信息，而卷积层则能够做到这一点。因此，在处理具有明显空间结构的数据（如图像）时，通常先使用卷积层来提取空间特征，然后再使用全连接层进行分类或其他任务。

实际中，通常会在卷积神经网络末尾使用全连接层，此时网络已经通过卷积层学习到了丰富的空间特征，这个阶段，全连接层可以将这些特征整合起来，用于最终的决策或分类。

NiN的想法是在每个像素位置（针对每个高度和宽度）应用一个全连接层。如果我们将权重连接到每个空间位置，我们可以将其视为1×1卷积层（如 6.4节中所述），或作为在每个像素位置上独立作用的全连接层。从另一个角度看，即将空间维度中的每个像素视为单个样本，将通道维度视为不同特征（feature）。

NiN特点：

1.1*1卷积层：

使用1*1卷积层来实现逐像素的全连接操作，有助于在通道维度上整合特征，同时保持空间维度学习，1*1卷积可以看作是对每个像素点的通道进行线性变换，并且可以通过这种方式减少或增加通道数，实现特征降维或升维

2.使用全局平均池化层替代了传统全连接层，减少模型的参数数量，并且使得模型的输出对输入的尺寸变化更加鲁棒

3.减少了参数，减轻过拟合问题，使模型轻量

4.在卷积层之间引入全连接层（通过1*1卷积实现）增强了模型对特征的表达能力，使模型能够捕捉到更复杂的特征组合

NiN的这些设计使得它在处理图像分类任务时非常有效，尤其是在需要保持空间结构信息的同时，还需要强大的特征表达能力的场景中。

1x1卷积层在深度学习网络中有着广泛的应用，尤其是在一些著名的网络架构中，如Network In Network（NiN）、Inception网络、ResNet等

原文地址：https://blog.csdn.net/yyyy2711/article/details/142890154

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：CUDA 全局内存
下一篇：【分布式训练（5）】无法 kill PID？如何 kill 休眠中的 GPU 占用进程

南京邮电大学电工电子A实验十一（数据选择器及逻辑电路的动态测试）
南京邮电大学电工电子A实验十一（数据选择器及逻辑电路的动态测试）；南京邮电大学；电工电子；实验报告
阅读更多2024-10-17
mp4转avi怎么转换？6个好用的mp4转换器测评汇总，赶快学起来！
mp4文件是一种多媒体容器格式，可以存储视频、音频和字幕等数据。由于像 iTunes 这样的商店广泛使用这一格式，并且其与iPod和PlayStation Portable（PSP）设备兼容，mp4文
阅读更多2024-10-17
【北京迅为】itop-3562开发板机器视觉opencv开发手册使用OpenCV处理图像
【北京迅为】itop-3562机器视觉opencv开发手册使用OpenCV处理图像
阅读更多2024-10-17
鸿蒙开发案例：HarmonyOS NEXT语法实现2048
• 方块移动动画：暂未实现原理应该是在UI的Text上设置.translate({ x:, y: })并添加.animation({duration: 200})，然后在逻辑里通过修改x或y来实现位
阅读更多2024-10-17
【openGL学习笔记】----GLFW、GLAD环境配置
GLFW已经提供为Visual Studio（2012到2022都有）预编译好的二进制版本和相应的头文件。通常来说glad和glfw配合使用来提供更高效的渲染和更好的跨平台支持‌。定义OpenGL的版
阅读更多2024-10-17
PyQt 入门教程（3）基础知识 | 3.2、加载资源文件
常见的资源文件有图像与图标，下面分别介绍下加载资源文件的常用方法。PyQt6版本暂时没有提供。工具的时，如何使用资源文件。运行效果，窗口图标发生变化。工具，下面介绍下在不使用。
阅读更多2024-10-17
推广——模板题新世界
欢迎大家加入，数据均配置完成了。
阅读更多2024-10-17
kubernetes自定义pod启动用户
image: ...
阅读更多2024-10-17
特征值计算（大数据作业）
参数可以自己设置，A是一个实对称矩阵，max_iter是最大的迭代次数，tolerance 是用于设置迭代停止的条件之一，是精度要求。u 是随机设置的一个向量，通过迭代不断地更新。
阅读更多2024-10-17
JS异步编程进阶（一）：Callback、Promise、Async/Await 和 Observable 深度对比
Callback ,Promise,Async/Await 是场景的异步流程实现方式，简单的场景下够用，但如果业务过于复杂，你可能需要一种新的模式来简化复杂的流程了。例如需要后台持续执行、非一次性完成
阅读更多2024-10-17

24/10/12 算法笔记 NiN

相关文章