卷积神经网络学习问题总结

🕗 发布于 2024-07-18 08:00 cnn 学习 人工智能 python pytorch

问题一：深度学习中的损失函数和应用场景

回归任务：

均方误差函数（MSE）适用于回归任务，如预测房价、预测股票价格等。

import torch.nn as nn  
loss_fn = nn.MSELoss()

分类任务：

交叉熵损失函数（Cross-Entropy Loss）适用于分类任务，如图像分类、文本分类等。对于多分类问题，该损失函数可与Softmax激活函数结合使用。

import torch.nn as nn  
loss_fn = nn.CrossEntropyLoss()

二分类任务：

二元交叉熵损失函数（Binary Cross-Entropy Loss）适用于二分类问题，如预测是否为垃圾邮件、预测股票涨跌等。对于二分类问题，该损失函数可与Sigmoid激活函数结合使用。

import torch.nn as nn  
loss_fn = nn.BCELoss()

问题二：空洞卷积

灰色部分为卷积核权重

白色部分为空，值为0

dilation rate：空洞率

权重值的间隔为dilation rate - 1

例：m = 3, p = 0, s = 1时

（m表示卷积核大小，p 表示零填充大小（zero-padding）， s 表示步长（stride），d表示空洞率（dilation））

若d=1：

若d=2：

优点：在不增加参数的情况下增大感受野，适用于图片size较大，或需要快速感受全局信息的情况。

通过设置不同的dilation rate捕获多尺度上下文信息，适用于需要捕获图片的多层次的情况，如语义分割等。

问题：存在网格效应，远距离点之间的信息可能不相关。

解决办法：HDC

一、叠加卷积的 dilation rate 不能有大于1的公约数。如 [2, 4, 6] 则不是一个好的三层卷积，依然会出现 gridding effect。解决网格效应

二、将 dilation rate 设计成锯齿状结构，例如 [1, 2, 5, 1, 2, 5] 循环结构。同时捕获远近信息

三、满足：

最常用：

问题三：残差网络

反向传播路径太长，训练难度增加

问题：

若卷积后的结果与输入X的shape不同，则不能直接相加
当步长不为1，图片大小发生变化
当通道数与输入通道不同，图片通道数发生变化

解决：

使用一个1x1的卷积核来改变X的shape，使得其能与卷积后的结果shape相匹配（不知道^ ^

残差模型VS等深卷积：

原文地址：https://blog.csdn.net/weixin_61681867/article/details/140505688

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

计算机网络谢希仁第五章课后题【背诵版本】
（结合谢希仁p234图记一下图）Karn 算法。在计算加权平均 RTTs时，只要报文段重传了，就不采用其往返时间样本。这样得出的加权平均 RTTs和 RTO 就较准确。（允许TCP能够区分开有效和无效
阅读更多2024-11-18
【伪造检测】Noise Based Deepfake Detection via Multi-Head Relative-Interaction
实现的，这是一种由于相机感光传感器而造成的缺陷噪声，主要用图像的源识别，在伪造检测的任务中并没有很好的表现。伪造人脸图像只会对人脸进行操作，为了能够防止在背景信息中也提取到被操作的像素，在选取背景
阅读更多2024-11-18
✅DAY30 贪心算法 | 452. 用最少数量的箭引爆气球 | 435. 无重叠区间 | 763.划分字母区间
解题思路：首先把原数组按左边界进行排序。然后比较[i-1]的右边界和[i]的左边界是否重叠，如果重叠，更新当前右边界为最小右边界和[i+1]的左边界判断是重叠。的方式通常更直观，因为只需要维护一个变量
阅读更多2024-11-18
esp32学习：windows下idf离线安装（最简单）
安装下来，可linux下的一样，里面使用命令，常用的就几个命令，编译起来速度还行，可以用vscode对代码进行编辑。很多朋友学习esp32时发现，安装idf很麻烦，需要很多依赖，那有没有简单的方法呢，
阅读更多2024-11-18
Redisson 中开启看门狗（watchdog）机制
在 Redisson 中，当使用分布式锁时，如果设置了锁的超时时间，那么在获取锁成功后，Redisson 会启动一个后台线程（即看门狗）来不断地延长锁的过期时间，只要锁没有被显式释放，看门狗就会一直工
阅读更多2024-11-18
ubuntu 安装protobuf 3.4.0
文件，这样 CMake 才能找到必要的构建配置文件。如果问题仍然存在，请检查文件目录结构，确保没有遗漏下载的文件。：你需要进入下载的 Protocol Buffers 源代码的根目录。的根目录，然后
阅读更多2024-11-18
spring boot接收参数
spring boot接受参数
阅读更多2024-11-18
使用SimpleDateFormat的踩坑指南
本文主要介绍了SimpleDateFormat的常用用法，并且给出了使用SimpleDateFormat会有线程不安全问题，并发场景下会踩坑。同时也给出了如何让其在并发场景下也能正常使用的解决方案。
阅读更多2024-11-18
C++ 内联函数
定义内联函数：如前文所述，在函数声明或定义前加上关键字inline即可定义一个内联函数。既可以在函数声明时添加inline关键字，也可以在函数定义时添加，例如：// 函数声明为内联函数// 函数定义为
阅读更多2024-11-18
MyBatis框架快速入门
MyBatis 是一款优秀的。
阅读更多2024-11-18

卷积神经网络学习问题总结

问题一： 深度学习中的损失函数和应用场景

回归任务：

分类任务：

二分类任务：

问题二： 空洞卷积

问题三： 残差网络

相关文章

问题一：深度学习中的损失函数和应用场景

问题二：空洞卷积

问题三：残差网络