自学内容网 自学内容网

【漫话机器学习系列】022.微积分中的链式求导法则(chain rule of Calculus)

链式求导法则(Chain Rule of Calculus)

链式求导法则是微积分中的重要工具,用于处理复合函数的求导。它描述了如何计算一个函数的函数(复合函数)的导数。


1. 链式法则的定义

假设有一个复合函数 y = f(g(x)),其中:

  • 外层函数为 f(u),变量 u = g(x) 是内层函数。

链式求导法则表述为:

\frac{dy}{dx} = f'(g(x)) \cdot g'(x)

2. 直观理解

链式法则的核心思想是将复合函数的变化率分解为:

  • 外层函数对内层函数的变化率(即 f'(u),
  • 内层函数对自变量的变化率(即 g'(x))。

两者的乘积就是复合函数的整体变化率。


3. 数学推导

设 y = f(u) 且 u = g(x),则

\frac{dy}{dx} = \frac{dy}{du} \cdot \frac{du}{dx}

其中:

  • \frac{dy}{du} = f'(u):外层函数的导数。
  • \frac{du}{dx} = g'(x):内层函数的导数。

因此,

\frac{dy}{dx} = f'(g(x)) \cdot g'(x)


4. 示例

示例 1:简单复合函数

已知 y = (2x^2 + 3)^4,求导。

解:

  1. 令内层函数 u = 2x^2 + 3,则 y = u^4
  2. 内层导数:u' = \frac{du}{dx} = 4x
  3. 外层导数:\frac{dy}{du} = 4u^3
  4. 复合导数: \frac{dy}{dx} = \frac{dy}{du} \cdot \frac{du}{dx} = 4u^3 \cdot 4x = 16x(2x^2 + 3)^3

示例 2:自然对数函数

已知 y = \ln(3x^2 + 1),求导。

解:

  1. 外层函数:f(u) = \ln(u),导数为 f'(u) = \frac{1}{u}​。
  2. 内层函数:g(x) = 3x^2 + 1,导数为 g'(x) = 6x
  3. 根据链式法则: \frac{dy}{dx} = \frac{1}{g(x)} \cdot g'(x) = \frac{1}{3x^2 + 1} \cdot 6x = \frac{6x}{3x^2 + 1}

示例 3:三角函数

已知 y = \sin(x^2),求导。

解:

  1. 外层函数:f(u) = \sin(u),导数为 f'(u) = \cos(u)
  2. 内层函数:g(x) = x^2,导数为 g'(x) = 2x
  3. 根据链式法则: \frac{dy}{dx} = \cos(x^2) \cdot 2

5. 多层复合函数

链式法则可以扩展到多层复合函数。

示例:多层复合函数

已知 y = \sin^2(3x^2 + 1),求导。

解:

  1. 最内层函数:u = 3x^2 + 1u' = 6x
  2. 第二层函数:v = \sin(u)v' = \cos(u) \cdot u'
  3. 最外层函数:y = v^2y' = 2v \cdot v'
  4. 逐步求导并合并:

    \frac{dy}{dx} = 2\sin(3x^2 + 1) \cdot \cos(3x^2 + 1) \cdot 6x = 12x \sin(3x^2 + 1) \cos(3x^2 + 1)

6. 实际应用

  1. 机器学习

    • 反向传播算法中,链式法则被用来计算神经网络的梯度。
    • 例如,损失函数对参数的梯度是通过层层求导实现的。
  2. 物理学

    • 计算复杂系统的变化率,例如多变量变化的传播速度。
  3. 经济学

    • 分析复合函数关系中的边际效应,例如价格对需求的间接影响。

7. 总结

链式法则是微分学的核心工具,用于处理复合函数的求导问题。它将复杂的导数问题分解为简单的步骤,是解析、优化和计算的重要基础。


原文地址:https://blog.csdn.net/IT_ORACLE/article/details/144735740

免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!