【Pytorch】torch.nn.functional模块中的非线性激活函数

🕗 发布于 2024-11-19 11:30 pytorch 深度学习 人工智能

在使用torch.nn.functional模块时，需要导入包：

from torch.nn import functional

以下是常见激活函数的介绍以及对应的代码示例：

tanh (双曲正切)

输出范围：(-1, 1)

特点：中心对称，适合处理归一化后的数据。
公式： $tanh(x) = (e^x - e^{-x}) / (e^x + e^{-x})$

import torch
x = torch.tensor([-2.0, -1.0, 0.0, 1.0, 2.0])
y = torch.nn.funcationl.tanh(x)
print(y)  # 输出：tensor([-0.9640, -0.7616,  0.0000,  0.7616,  0.9640])

sigmoid (S形函数)

输出范围：(0, 1)
特点：用于将输入映射到概率值，但可能会导致梯度消失问题。
公式： $sigmoid(x) = 1 / (1 + e^{-x})$

y = torch.nn.funcational.sigmoid(x)
print(y)  # 输出：tensor([0.1192, 0.2689, 0.5000, 0.7311, 0.8808])

SiLU (Sigmoid Linear Unit，也称Swish)

输出范围：(0, x)
特点：结合了线性和非线性特性，效果较好。
公式：silu(x) = x * sigmoid(x)

y = torch.nn.funcationl.silu(x)
print(y)  # 输出：tensor([-0.2384, -0.2689,  0.0000,  0.7311,  1.7616])

GELU (Gaussian Error Linear Unit)

输出范围：接近ReLU，但更加平滑。
特点：常用于Transformer模型。
公式：近似为：gelu(x) ≈ x * sigmoid(1.702 * x)

y = torch.nn.functional.gelu(x)
print(y)  # 输出：tensor([-0.0454, -0.1588,  0.0000,  0.8413,  1.9546])

ReLU (Rectified Linear Unit)

输出范围：[0, +∞)
特点：简单高效，是最常用的激活函数之一。
公式：relu(x) = max(0, x)

y = torch.nn.funcationl.relu(x)
print(y)  # 输出：tensor([0., 0., 0., 1., 2.])

ReLU_ (In-place ReLU)

输出范围：[0, +∞)
特点：修改原张量而不是生成新的张量，节省内存。

x.relu_()  # 注意：会改变x本身
print(x)  # x的值被修改为：tensor([0., 0., 0., 1., 2.])

Leaky ReLU

输出范围：(-∞, +∞)
特点：允许负值有较小的输出，避免死神经元问题。
公式：leaky_relu(x) = x if x > 0 else alpha * x

x = torch.tensor([-2.0, -1.0, 0.0, 1.0, 2.0])
y = torch.nn.functional.leaky_relu(x, negative_slope=0.01)
print(y)  # 输出：tensor([-0.0200, -0.0100,  0.0000,  1.0000,  2.0000])

Leaky ReLU_ (In-place Leaky ReLU)

特点：和ReLU_一样会修改原张量。

x.leaky_relu_(negative_slope=0.01)
print(x)  # x的值被修改

Softmax

输出范围：(0, 1)，且所有输出的和为1。
特点：常用于多分类任务的最后一层。
公式： $softmax(x)_i = exp(x_i) / sum(exp(x_j))$

x = torch.tensor([1.0, 2.0, 3.0])
y = torch.nn.functional.softmax(x, dim=0)
print(y)  # 输出：tensor([0.0900, 0.2447, 0.6652])

Threshold

输出范围：手动设置的范围。
特点：小于阈值的数被置为设定值，大于等于阈值的数保持不变。

x = torch.tensor([-1.0, 0.0, 1.0, 2.0])
y = torch.nn.functional.threshold(x, threshold=0.5, value=0.0)
print(y)  # 输出：tensor([0., 0., 0., 2.])

Normalize

功能：将张量的值标准化到指定范围。

公式：normalize(x) = x / max(||x||, eps)

x = torch.tensor([[1.0, 2.0, 3.0], [4.0, 5.0, 6.0]])
y = torch.nn.functional.normalize(x, p=2, dim=1)
print(y)  # 输出：标准化到单位向量

原文地址：https://blog.csdn.net/weixin_62403234/article/details/143861902

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：Oracle SQL plus设置篇
下一篇：时间复杂度计算的快速解题步骤

鸿蒙进阶篇-TextInput&TextArea和Checkbox
在鸿蒙开发中，TextInput 用于单行文本输入，TextArea 用于多行文本输入，Checkbox 则是用于多项选择的复选框组件。
阅读更多2024-11-21
MySQL45讲第二十六讲备库为什么会延迟好几个小时？——阅读总结
在MySQL数据库的主备架构中，备库延迟是一个需要重点关注的问题。它可能影响系统的可用性和数据的一致性，尤其是在主库压力较大时，备库延迟可能达到数小时甚至永远无法追上主库。今天，我们将深入探讨MySQ
阅读更多2024-11-21
快速简单的视频下载器——lux
在学习之余，发现了一个简单并且高效的视频下载器lux,能够帮你快速且高效的下载文件（不仅仅是视频可以），所以写了一篇博客分享lux的相关内容这个简单并且高效的视频下载器lux，一定会提高你的下载效率的
阅读更多2024-11-21
XGBOOST、LightGBM、CATBoost
本文介绍了三种 GBDT 的优化算法，可以根据实际情况进行选择。
阅读更多2024-11-21
【JAVA】Java基础—面向对象编程：常用API与数据结构—字符串、数组的使用
在Java编程中，字符串和数组是两个非常基础且重要的数据结构。它们在日常开发中无处不在，理解它们的使用及其背后的理论知识是成为一名合格Java开发者的必经之路。：可以将字符串比作一本书的章节。每个章节
阅读更多2024-11-21
Docker-Compose 快速部署安装 Nginx 或其他应用
测试部署的 Nginx 是否运行正常，可以在浏览器中访问 Nginx 所在的 IP 或端口，确保能够看到默认的 Nginx 页面。（如果你安装的是 Docker CE）。将下载的 Docker-Com
阅读更多2024-11-21
微信小程序申请getlocation权限
2、如果小程序没有导航功能。可以使用wx.openLocation写一个导航页面功能，以便进行权限申请。所以需要申请getlocation权限的开启。体验版没有申请开启不影响使用，但是上线提审必须申请
阅读更多2024-11-21
(RK3566驱动开发 - 2）.IIC驱动
【代码】(RK3566驱动开发 - 2）.IIC驱动。
阅读更多2024-11-21
04 搭建linux驱动开发环境
虽然 petalinux 功能很全面，但是其编译速度较慢，不适用于驱动调试阶段（因为驱动调试阶段会频繁修改驱动模块、内核、设备树等），因此本章将采用分步编译的方式来编译启动开发板所需要的各种镜像文件，
阅读更多2024-11-21
2025蓝桥杯（单片机）备赛--扩展外设之NE555的使用及定时器1的详细讲解（十）
超详细的定时器555讲解
阅读更多2024-11-21