深度学习——微积分求导，反向传播

🕗 发布于 2024-09-21 04:01 深度学习 人工智能

一、导数

举一个关于导数的实例，定义一个函数 $u=f(x)=3x^2-4x$

pip install matplotlib

在这里插入图片描述

import numpy as np
from matplotlib_inline import backend_inline
import torch


def f(x):
    return 3 * x ** 2 - 4 * x

定义一个求导函数：通过令x=1并让h趋近于0，观察 $\frac {f(x+h)-f(x)} {h}$ 的数值结果趋近于2

def numerial_lim(f,x,h):
    return (f(x+h)-f(x))/h

h=0.1
for i in range(5):
    print(f'h={h:.5f}, numerial limit = {numerial_lim(f, 1, h):.5f}')
    h *= 0.1

在这里插入图片描述
为了对导数进行可视化，将使用python中流行的绘图库matplotlib包生成图形。

from matplotlib import pyplot as plt
def use_svg_display():  #@save
    """使用svg格式在Jupyter中显示绘图"""
    backend_inline.set_matplotlib_formats('svg')

def set_figsize(figsize=(3.5, 2.5)):  #@save
    """设置matplotlib的图表大小"""
    use_svg_display()
    plt.rcParams['figure.figsize'] = figsize

#@save
def set_axes(axes, xlabel, ylabel, xlim, ylim, xscale, yscale, legend):
    """设置matplotlib的轴"""
    axes.set_xlabel(xlabel)
    axes.set_ylabel(ylabel)
    axes.set_xscale(xscale)
    axes.set_yscale(yscale)
    axes.set_xlim(xlim)
    axes.set_ylim(ylim)
    if legend:
        axes.legend(legend)
    axes.grid()

from matplotlib import pyplot as plt
def use_svg_display():  #@save
    """使用svg格式在Jupyter中显示绘图"""
    backend_inline.set_matplotlib_formats('svg')

def set_figsize(figsize=(3.5, 2.5)):  #@save
    """设置matplotlib的图表大小"""
    use_svg_display()
    plt.rcParams['figure.figsize'] = figsize

#@save
def set_axes(axes, xlabel, ylabel, xlim, ylim, xscale, yscale, legend):
    """设置matplotlib的轴"""
    axes.set_xlabel(xlabel)
    axes.set_ylabel(ylabel)
    axes.set_xscale(xscale)
    axes.set_yscale(yscale)
    axes.set_xlim(xlim)
    axes.set_ylim(ylim)
    if legend:
        axes.legend(legend)
    axes.grid()


x = np.arange(0, 3, 0.1)
plot(x, [f(x), 2 * x - 3], 'x', 'f(x)', legend=['f(x)', 'Tangent line (x=1)'])

现在可以绘制函数及其在x=1处的切线y=2x-3，其中系数是2切线的斜率。
在这里插入图片描述

二、自动微分，反向传播

深度学习框架通过自动计算导数，即自动微分来加快求导。在实验中，根据设计好的模型，系统会构建一个计算图，来跟踪计算是哪些数据通过哪些操作组合起来产生输出。自动微分使系统能够随后反向传播梯度，意味着跟踪整个计算图，填充关于每个参数的偏导数。

2.1 对向量求导的例子

对函数 $y=2\bm x^T \bm x$ 关于列向量 $\bm x$ 求导，先创建变量 $\bm x$ ，并为其分配一个初始值。

import torch
x = torch.arange(4.0)
x

在这里插入图片描述
在计算 $y$ 关于 $\bm x$ 的梯度之前，需要一个区域来存储梯度。

x=torch.arange(4.0,requires_grad=True)
x.grad
y = 2*torch.dot(x,x)
y

在这里插入图片描述
x是一个长度为4的向量，计算x和x的点积，得到了我们赋值给y的标量输出。接下来，通过调用反向传播函数来自动计算y关于x每个分量的梯度，并打印这些梯度。

y.backward()
x.grad

在这里插入图片描述
函数 $y=2\bm x^T \bm x$ 关于 $\bm x$ 的梯度应为 $4 x$ ，快速验证梯度是否计算正确。

x.grad == 4*x

在这里插入图片描述

2.1 求和函数的梯度

现在计算x的另一个函数（求和函数）的梯度，每个变量的导数系数应该为1.

# 在默认情况下，PyTorch会累积梯度，我们需要清除之前的值
x.grad.zero_()
y = x.sum()
y.backward()
x.grad

在这里插入图片描述

原文地址：https://blog.csdn.net/2301_79815102/article/details/142287738

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：如何在 Spring Boot 中实现 RocketMQ 的批量消息消费
下一篇：HtmlRender - c++实现的html生成类

PyQt5库学习之QFileDialog.Options()函数
是 PyQt5 中的一个类，用于定义文件对话框的行为和外观。通过设置这些选项，可以控制文件对话框的各种特性，例如是否使用原生对话框、是否允许选择多个文件等。
阅读更多2024-09-21
树与图的深度优先遍历（dfs的图论中的应用）
846. 树的重心给定一颗树，树中包含 nn 个结点（编号 1∼n）和 n−1条无向边。请你找到树的重心，并输出将重心删除后，剩余各个连通块中点数的最大值。重心定义：重心是指树中的一个结点，如果将这个
阅读更多2024-09-21
前后端数据交互笔记03（get和post方法）
post:通过jquery+ajax方式发起（或from发起）；但是post可用于数据的增、删、改（因为get请求的写地址就能访问的特性，所以get请求不具有随意增删改的作用）get:只要能写地址的地
阅读更多2024-09-21
affine: python仿射变换包
affine是一个用于描述二维图像仿射变换的包，可以定义变换参数并进行变换，可以几何其他的GIS包使用，比如GDAL, RasterIO等。特别需要注意的是from_gdal中地理参考参数顺序是 c
阅读更多2024-09-21
Yolov8-pose关键点检测：一种新的自适应算法轻量级通道分割和变换(ALSS)模块，解决红外检测场景存在严重遮挡和重叠目标时的局限性
提出了一种新的自适应算法轻量级通道分割和变换(ALSS)模块。该模块采用自适应信道分裂策略优化特征提取，并集成信道变换机制增强信道间的信息交换。这改善了模糊特征的提取，对于处理抖动引起的模糊和重叠目标
阅读更多2024-09-21
OpenCV库学习之NMSBoxes函数
是 OpenCV 库中的一个函数，用于在目标检测任务中执行非极大值抑制（Non-Maximum Suppression, NMS）。这个函数通过移除多余的边界框来保留最佳的检测结果。在目标检测算法（如
阅读更多2024-09-21
Node.js backend for OpenAI image generation giving error code 400
用于 OpenAI 图像生成的 Node.js 后端返回错误代码 400。
阅读更多2024-09-21
Blender软件三大渲染器Eevee、Cycles、Workbench对比解析
Blender 是一款强大的开源3D制作平台，提供了从建模、雕刻、动画到渲染、后期制作的一整套工具，广泛应用于电影、游戏、建筑、艺术等领域。渲染101云渲染云渲6666相比于其他平台，如 Autode
阅读更多2024-09-21
使用 Puppeteer-Cluster 和代理进行高效网络抓取：完全指南
网络搜刮对于大规模收集数据至关重要，而 Puppeteer 是一种广泛使用的工具，用于自动执行网络搜刮等浏览器任务。不过，随着刮擦需求的增长，你需要高效地管理多个浏览器实例，同时避免 IP 禁止。这就
阅读更多2024-09-21
[C#]winform 使用opencvsharp实现玉米粒计数
这段代码是使用OpenCvSharp库（OpenCV的C#封装）对图像进行处理，主要流程包括图像的二值化、腐蚀操作、距离变换、轮廓检测，并在原图上标出检测到的轮廓位置及数量。
阅读更多2024-09-21

深度学习——微积分求导，反向传播

目录

一、导数

二、自动微分，反向传播

2.1 对向量求导的例子

2.1 求和函数的梯度

相关文章