【一】TensorFlow神经网络模型构建之神经元函数及优化方法

🕗 发布于 2024-03-25 06:54 tensorflow 神经网络 人工智能 神经元函数

TensorFlow神经网络模型构建主要涉及如下几块：神经元函数、卷积函数、池化函数、分类函数、优化方法。下面分别对这几块进行展开说明：

神经元函数及优化方法

神经网络之所以能解决非线性问题（如语音、图像识别等），本质上就是激活函数加入了非线性因素，弥补了线性模型的表达力，把“激活的神经元的特征”通过函数保留并映射到下一层。

激活函数不会更改输入数据的维度(输入和输出的维度是相同的)。TensorFlow中有如下激活函数，输入均为需要计算的x(Tensor)，输出均为与x数据类型相同的张量（Tensor）。常见的激活函数有Sigmoid，Tanh，ReLU、softplus。

1、Sigmoid函数使用方法

import tensorflow as tf
data=tf.constant([[1.0,2.0],[1.0,2.0],[1.0,2.0]])
with tf.compat.v1.Session() as sess:
    print(sess.run(tf.sigmoid(data)))

运行结果是如下：
在这里插入图片描述
Sigmoid函数的优点在于它的输出映射在(0，1)内，单调连续，非常适合于用作输出层，并且求导比较容易。缺点在于其软饱和性。

软饱和性：指激活函数 $h (x)$ 在取值趋于无穷大时，它的一阶导数趋于0。
硬饱和性：指当 $∣ x ∣ > c$ 时，其中c为常数， $f^{'}(x)=0$ 。

一旦落入软饱和区， $f^{'}(x)$ 就会变得接近于0，容易产生梯度消失。

梯度消失指在更新模型参数时采用链式求导法则反向求导，越往前梯度越小。

最终的结果是达到一定深度后梯度对于模型的更新就没有任何贡献。

2、ReLU函数使用方法

ReLU函数定义为 $f (x) = ma x (x, 0)$ 。softplus函数定义为 $f (x) = l o g (1 + e x p (x))$ ，可以看作是ReLU函数的平滑版本。Relu和softplus函数代码示例及图形如下：

import numpy as np
import matplotlib.pyplot as plt
def relu_tugrp():
 x=np.arange(-100, 100, 1)
 softplus=np.log(1+np.exp(x))
 relu=np.maximum(0,x)
 plt.subplot(221)
 plt.plot(x,softplus,label='softplus')
 #显示图像的label
 plt.legend()
 
 #创建一个子图
 plt.subplot(222)
 plt.plot(x,relu,label='relu')
 #显示图像的label
 plt.legend()
 #画网格线
 plt.grid(True)

relu_tugrp()

在这里插入图片描述
使用TensorFlow中的relu、reluu6、crelu、softplus函数示例如下：

import tensorflow as tf
data=tf.constant([[-1.0,2.0],[1.0,-2.0],[1.0,2.0]])
with tf.compat.v1.Session() as sess:
    print(sess.run(tf.nn.relu(data)))
    print(sess.run(tf.nn.softplus(data)))
    print(sess.run(tf.nn.relu6(data)))
    print(sess.run(tf.nn.crelu(data)))

在这里插入图片描述

3、dropout函数使用方法

一个神经元将以概率keep_prob决定是否被抑制。如果被抑制，则该神经元的输出为0；如果不被抑制，那么该神经元的输出值将被放大到原来的 $\frac{1}{keep_prob}$ 倍。
在默认情况下，每个神经元是否被抑制是相互独立的。但是否被抑制可以通过noise_shape来调节。当noise_shape[i]==shape(x)[i]时，x中的元素是相互独立的。如果shape(x)=[k,l,m,n]，x中的维度顺序分别为批、行、列和通道；如果noise_shape(x)=[k,l,m,n]，那么每个批和通道相互独立，行与列相互关联，要么都是0，要么都是原来的值。示例代码：

import tensorflow as tf
data=tf.constant([[-1.0,2.0,3.0,4.0]])
with tf.compat.v1.Session() as sess:
    print(sess.run(tf.nn.dropout(data,0.5,noise_shape=[1,4])))
    print(sess.run(tf.nn.dropout(data,0.5,noise_shape=[1,1])))

在这里插入图片描述

原文地址：https://blog.csdn.net/henni_719/article/details/136989651

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：Linux 的 app ：一般到哪里下载？(**)
下一篇：[iOS]GCD(一)

leetcode289:生命游戏
根据，简称为，是英国数学家约翰·何顿·康威在 1970 年发明的细胞自动机。给定一个包含m × n个格子的面板，每一个格子都可以看成是一个细胞。每个细胞都具有一个初始状态：1即为（live），或0即为
阅读更多2024-10-20
MongoDB数据恢复
注意：两个MongoDB的版本要一致，本文使用的是mongo:4.2.24。先把K8S上面的MongoDB 容器停止（可以把副本改成0）。1、将容器挂载MongoDB的数据目录备份到本地。经常是数据文
阅读更多2024-10-20
C#中实现事务
C#中实现事务
阅读更多2024-10-20
【LeetCode每日一题】——560.和为 K 的子数组
给你一个整数数组 nums 和一个整数 k ，请你统计并返回该数组中和为 k 的子数组的个数。子数组是数组中元素的连续非空序列。
阅读更多2024-10-20
「漏洞复现」满客宝智慧食堂系统 selectUserByOrgId 未授权访问漏洞
请勿利用文章内的相关技术从事非法测试，由于传播、利用此文所提供的信息而造成的任何直接或者间接的后果及损失，均由使用者本人负责，作者不为此承担任何责任。工具来自网络，安全性自测，如有侵权请联系删除。本次
阅读更多2024-10-20
React面试题目（从基本到高级）
React前端面试常见题目涵盖了React的基础概念、组件、状态管理、生命周期、性能优化等多个方面。
阅读更多2024-10-20
12.个人博客系统（Java项目基于spring和vue）
1 在校学习的学生，可用于日常学习使用或是毕业设计使用 2 毕业一到两年的开发人员，用于锻炼自己的独立功能模块设计能力，增强代码编写能力。 3 亦可以部署为商化项目使用。 4 需要完整资料及源码
阅读更多2024-10-20
YoloV8改进策略：注意力改进|DeBiFormer，可变形双级路由注意力|引入DeBiLevelRoutingAttention注意力模块（全网首发）
本次改进的核心在于将DeBiLevelRoutingAttention模块嵌入到YoloV8的主干网络中，具体位置是在SPPF（Spatial Pyramid Pooling Fast）模块之后。这一
阅读更多2024-10-20
word取消自动单词首字母大写
情况说明：在word输入单词后首字母会自动变成大写取消单词首字母大写步骤：（1）点击菜单栏文件（2）点击“更多”——>“选项”（3）点击“校对”——>“自动更正选项”（4）取消“句首字母大
阅读更多2024-10-20
web前端网页用户注册页面
【代码】web前端网页用户注册页面。
阅读更多2024-10-20

【一】TensorFlow神经网络模型构建之神经元函数及优化方法

神经元函数及优化方法

1、Sigmoid函数使用方法

2、ReLU函数使用方法

3、dropout函数使用方法

相关文章