C++builder中的人工智能（12）：了解ELU（Exponential Linear Unit）——人工神经网络中的激活函数

🕗 发布于 2024-11-09 02:34 c++ 人工智能 开发语言

在这篇文章中，我们将解释什么是指数线性单元（ELU），以及如何利用ELU激活函数。通过学习这些知识，你将能够使用C++软件创建C++应用程序。

我们需要了解哪些关于激活函数的知识？

激活函数（phi()），也称为转移函数或阈值函数，它根据净输入函数的给定值（sum）确定激活值（a = phi(sum)）。在这里，sum是它们权重中的信号之和，激活函数是这个和的新值，具有给定的函数或条件。换句话说，激活函数是将所有加权信号的和转换为该信号的新激活值的方法。有不同类型的激活函数，通常使用的是线性（恒等）、双极性和逻辑（sigmoid）函数。激活函数及其类型在这里有详细解释。

在C++（以及大多数编程语言）中，你可以创建自己的激活函数。注意，sum是净输入函数的结果，它计算所有加权信号的和。我们将使用这些作为输入函数的结果。在这里，人工神经元（输出值）的激活值可以通过激活函数如下所示，

通过使用这个sum净输入函数值和phi()激活函数。

什么是指数线性单元（ELU）？

指数线性单元（ELU：Exponential Linear Unit）是另一种激活函数，由Djork-Arne Clevert, Thomas Unterthiner & Sepp Hochreiter开发并发表，标题为“FAST AND ACCURATE DEEP NETWORK LEARNING BY EXPONENTIAL LINEAR UNITS (ELUS)”。你可以通过点击这里找到论文的文本https://arxiv.org/pdf/1511.07289。

根据他们的研究，他们引入了“指数线性单元”（ELU），它加快了深度神经网络中的学习速度，并导致了更高的分类准确率。ELU激活函数通过对于正值的身份缓解了消失梯度问题，如修正线性单元（ReLUs），泄漏ReLUs（LReLUs）和参数化ReLUs（PReLUs）。他们还证明了与其他激活函数的单元相比，ELUs具有改进的学习特性。与ReLUs相比，

指数线性单元（ELU）可以写成如下，

这个函数的导数可以写成，

在C和C++编程语言中，简单的指数线性单元函数可以写成如下

double alpha = 0.1; // 范围从0到1.0
double phi(double sum) {
    return (sum > 0 ? sum : alpha * (std::exp(sum) - 1)); // ELU函数
}

有没有一个简单的人工神经网络示例，使用指数线性单元（ELU）在C++中？

我们可以在Tneuron类中使用给定的ELU函数，如下所示，

#include <iostream>
#define NN 2   // 神经元数量
double alpha = 0.1; // 范围从0到1.0, 可以定义在神经元类中，如果每个神经元有不同的alpha

class Tneuron { // 神经元类
public:
    double a; // 每个神经元的活动
    double w[NN+1]; // 神经元之间连接的权重

    Tneuron() {
        a = 0;
        for (int i = 0; i <= NN; i++) w[i] = -1; // 如果权重是负数，则表示没有连接
    }

    // 定义输出神经元的激活函数（或阈值）
    double phi(double sum) {
        return (sum > 0 ? sum : alpha * (std::exp(sum) - 1)); // ELU函数
    }
};

Tneuron ne[NN+1]; // 神经元对象

void fire(int nn) {
    float sum = 0;
    for (int j = 0; j <= NN; j++) {
        if (ne[j].w[nn] >= 0) sum += ne[j].a * ne[j].w[nn];
    }
    ne[nn].a = ne[nn].phi(sum);
}

int main() {
    // 定义两个输入神经元（a0, a1）和一个输出神经元（a2）的活动
    ne[0].a = 0.0;
    ne[1].a = 1.0;
    ne[2].a = 0;

    // 定义来自两个输入神经元到输出神经元（0到2和1到2）的信号权重
    ne[0].w[2] = 0.3;
    ne[1].w[2] = 0.2;

    // 激发我们的人工神经元活动，输出将是
    fire(2);
    printf("%10.6f\n", ne[2].a);
    getchar();
    return 0;
}

指数线性单元（ELU）通常用于ANN应用中引入发展模型中的非线性，或者用于将信号限制在指定区间内。ANN元素计算其输入信号的线性组合，并应用有界的ELU函数作为激活函数作为输出（激活值）。这可以被定义为经典阈值神经元的平滑版本。最常用的激活函数选择，用于将大振幅的信号剪辑以保持神经网络的响应有界。

原文地址：https://blog.csdn.net/caridle/article/details/143636534

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：贪心算法day3（最长递增序列问题）
下一篇：三十五、Python基础语法（文件操作-下）

【已为网站上传证书,却显示不安全】
【已为网站上传证书,却显示不安全】
阅读更多2024-11-16
Jtti：服务器总是自动重启怎么办?
1.查看系统日志：通过查看系统日志文件(如/var/log/syslog、/var/log/messages或Windows Event Viewer)获取错误信息，找出重启原因。解决方案：查看系统日
阅读更多2024-11-16
Scala的Array(1)
Scala的Array表示长度不可变的数组，若需要定义可变数组需要倒包。
阅读更多2024-11-16
Scala中的Array
Array是一种在Scala中用于存储固定大小，相同类型元素的数据结构，Array是可变。类型有两种：Array表示长度不可变的数组，和ArrayBuffer表示长度可变的数组。(一)Array的定义
阅读更多2024-11-16
llama factory lora 微调 qwen2.5 7B Instruct模型
项目背景甲方提供一台三卡4080显卡需要进行qwen2.5 7b Instruct模型进行微调。以下为整体设计。要使用对进行，流程与之前提到的模型类似。LoRA 微调是一种高效的微调方法，通过低秩
阅读更多2024-11-16
大数据中的时序数据，以及时序数据架构设计解决方案
时序数据架构设计需根据具体的应用场景、数据量和实时性要求来选择合适的方案。如果数据量较小且不需要实时处理，关系型数据库可能足够；如果数据量大且需要高效实时查询，可以选择时序数据库；而对于大规模分布式处
阅读更多2024-11-16
Linux网络——网络初识
在谈及网络之前，我们要先对学的知识有一个了解网络的本质就是获取数据，而系统的本质就是加工数据。
阅读更多2024-11-16
革新预测领域：频域融合时间序列预测，深度学习新篇章，科研涨点利器
2024发论文&模型涨点之——频域+时间序列频域+时间序列不仅能提供更丰富的信息，还能提高模型性能和预测准确性。对于论文er来说，是个可发挥空间大、可挖掘创新点多的研究方向。当前，学术界的目光
阅读更多2024-11-16
本地启动浏览器，并禁用web安全性，解决本地启动时，服务端强制要求https协议导致请求不通的问题
本地启动浏览器，并禁用web安全性，解决本地启动时，服务端强制要求https协议导致请求不通的问题
阅读更多2024-11-16
推荐一款来自韩国的影音全能播放器：KMPlayer播放器
来自韩国的影音全能播放器，与Mplayer一样从linux平台移植而来的Kmplayer(简称KMP)几乎可以播放您系统上所有的影音文件。通过各种插件扩展KMP可以支持层出不穷的新格式。强大的插件功能
阅读更多2024-11-16

C++builder中的人工智能（12）：了解ELU（Exponential Linear Unit）——人工神经网络中的激活函数

我们需要了解哪些关于激活函数的知识？

什么是指数线性单元（ELU）？

有没有一个简单的人工神经网络示例，使用指数线性单元（ELU）在C++中？

相关文章