深度学习概览

🕗 发布于 2024-11-15 15:37 深度学习 人工智能

笔记内容侵权联系删

深度学习

深度学习一般指深度神经网络，深度指神经网络的层数(多层)。

传统机器学习与深度学习
深度学习，是一种基于无监督特征学习和特征层次结构学习的模型，在计算机视觉，语音识别，自然语言处理等领域有着突出的优势。

传统机器学习
对计算机硬件需求较小:计算量级别有限一般不需配用GPU显卡做并行运算
适合小数据量训练，再增加数据量难以提升性能
需要将问题逐层分解
人工进行特征选择
特征可解释性强

深度学习
对硬件有一定要求:大量数据需进行大量的矩阵运算，需配用GPU做并行运算
高维的权重参数，海量的训练数据下可以获得高性能
“端到端”的学习
利用算法自动提取特征
特征可解释性弱

神经网络

神经网络旨在模拟人脑的行为，由相互连接的节点（也称为人工神经元）组成，这些节点组织成层次结构。每个神经元接收一组输入，执行一系列计算，并产生一个输出，该输出传递给下一层。随着数据在网络中传递，节点之间的连接会根据数据中的模式而加强或减弱，这使得网络可以从数据中学习，并根据其学到的知识进行预测或决策。

训练法则

深度学习中常用的损失函数

在训练深度学习网络的时候，我们首先要将目标分类的“错误”参数化，这就是损失函数(误差函数反映了感知器目标输出和实际输出之间的误差。

回归任务最常用的损失函数为二次代价函数

分类任务最常用的损失函数是交叉熵代价函数

一般二次代价函数更多用于回归问题，而交叉熵误差更多用于分类问题

全局梯度下降算法(BGD)
对于训练样例集中的每一个样例记为<x,t>，X是输入值向量，t为目标输出，o为实际学习率，C为损失函数。

【这个版本的梯度下降算法，实际上并不常用，它的主要问题是
收敛过程非常慢，因为每次更新权值都需要计算所有的训练样例。】

随机梯度下降算法(SGD)

针对原始梯度下降算法的弊端，一个常见的变体称为增量梯度下降(Incremental Gradient Descent)，亦即随机降(SGD:Stochastic Gradient Descent)。

小批量梯度下降(MBGD)
针对上两种梯度下降算法的弊端，提出了一个实际工作中最常用的梯度下降算法，即pMini-BatchSGD。它的思想是每次使用一小批固定尺寸(BS:BatchSize)的样例来计算w，，然后更新权值

反向传播算法
误差反向传播算法(Error Back Propagation)是神经网络的重要算法。它使用链式求导法则将输出层的误差反向传回给网络，使神经网络的权重有了较简单的梯度计算实现方法。
其步骤为:
将损失函数值反向传播给每个计算单元;
每个计算单元根据获得的误差更新权重。

梯度消失和梯度爆炸问题
梯度消失:当网络层数越多时，进行反向传播求导值越小，导致梯度消失梯度爆炸:当网络层数越多时，进行反向传播求导值越大，导致梯度爆炸

原文地址：https://blog.csdn.net/TaoYuan__/article/details/143755156

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：真正的一站式视频出海解决方案
下一篇：确保以管理员权限运行 Visual Studio 开发者命令提示符

【已为网站上传证书,却显示不安全】
【已为网站上传证书,却显示不安全】
阅读更多2024-11-16
Jtti：服务器总是自动重启怎么办?
1.查看系统日志：通过查看系统日志文件(如/var/log/syslog、/var/log/messages或Windows Event Viewer)获取错误信息，找出重启原因。解决方案：查看系统日
阅读更多2024-11-16
Scala的Array(1)
Scala的Array表示长度不可变的数组，若需要定义可变数组需要倒包。
阅读更多2024-11-16
Scala中的Array
Array是一种在Scala中用于存储固定大小，相同类型元素的数据结构，Array是可变。类型有两种：Array表示长度不可变的数组，和ArrayBuffer表示长度可变的数组。(一)Array的定义
阅读更多2024-11-16
llama factory lora 微调 qwen2.5 7B Instruct模型
项目背景甲方提供一台三卡4080显卡需要进行qwen2.5 7b Instruct模型进行微调。以下为整体设计。要使用对进行，流程与之前提到的模型类似。LoRA 微调是一种高效的微调方法，通过低秩
阅读更多2024-11-16
大数据中的时序数据，以及时序数据架构设计解决方案
时序数据架构设计需根据具体的应用场景、数据量和实时性要求来选择合适的方案。如果数据量较小且不需要实时处理，关系型数据库可能足够；如果数据量大且需要高效实时查询，可以选择时序数据库；而对于大规模分布式处
阅读更多2024-11-16
Linux网络——网络初识
在谈及网络之前，我们要先对学的知识有一个了解网络的本质就是获取数据，而系统的本质就是加工数据。
阅读更多2024-11-16
革新预测领域：频域融合时间序列预测，深度学习新篇章，科研涨点利器
2024发论文&模型涨点之——频域+时间序列频域+时间序列不仅能提供更丰富的信息，还能提高模型性能和预测准确性。对于论文er来说，是个可发挥空间大、可挖掘创新点多的研究方向。当前，学术界的目光
阅读更多2024-11-16
本地启动浏览器，并禁用web安全性，解决本地启动时，服务端强制要求https协议导致请求不通的问题
本地启动浏览器，并禁用web安全性，解决本地启动时，服务端强制要求https协议导致请求不通的问题
阅读更多2024-11-16
推荐一款来自韩国的影音全能播放器：KMPlayer播放器
来自韩国的影音全能播放器，与Mplayer一样从linux平台移植而来的Kmplayer(简称KMP)几乎可以播放您系统上所有的影音文件。通过各种插件扩展KMP可以支持层出不穷的新格式。强大的插件功能
阅读更多2024-11-16

深度学习概览

深度学习

神经网络

训练法则

相关文章