神经网络基础-神经网络搭建和参数计算

🕗 发布于 2024-12-14 07:02 神经网络 人工智能 深度学习

文章目录

- 1.构建神经网络
- 2. 神经网络的优缺点

1.构建神经网络

在 pytorch 中定义深度神经网络其实就是层堆叠的过程，继承自nn.Module，实现两个方法：

__init__方法中定义网络中的层结构，主要是全连接层，并进行初始化。
forward方法，在实例化模型的时候，底层会自动调用该函数。该函数中可以定义学习率，为初始化定义的layer传入数据等。

我们来构建如下图所示的神经网络模型：
在这里插入图片描述

编码设计如下：

第1个隐藏层：权重初始化采用标准化的xavier初始化激活函数使用sigmoid。
第2个隐藏层：权重初始化采用标准化的He初始化激活函数采用relu。
out输出层线性层假若二分类，采用softmax做数据归一化。

# 创建神经网络
import torch
import torch.nn as nn
# pip install torchsummary
from torchsummary import summary # 计算模型参数，查看模型结构 pip install torchsummary
# 创建神经网络模型类
class Model(nn.Module):
    # 初始化属性值
    def __init__(self):
        # 调用父类的初始化属性值
        super(Model, self).__init__()
        # 创建第一个隐藏层模型，3个输入特征，3个输出特征
        self.linear1 = nn.Linear(3, 3)
        # 初始化权重 xavier 均匀分布初始化
        nn.init.xavier_uniform_(self.linear1.weight)
        # 创建第二个隐藏层，3个输入特征（上一层的输出特征）,2个输出特征
        self.linear2 = nn.Linear(3, 2)
        # 初始化权重 kaiming 正太分布初始化
        nn.init.kaiming_normal_(self.linear2.weight)
        # 创建输出层模型
        self.out = nn.Linear(2, 2)
    # 创建向前传播方法，自动执行 forward()方法
    def forward(self, x):
        # 数据经过第一个线性层
        x = self.linear1(x)
        # 使用 sigmoid 激活函数
        x = torch.sigmoid(x)
        # 数据经过第二个线性层
        x = self.linear2(x)
        # 使用 relu 激活函数
        x = torch.relu(x)
        # 数据经过输出层
        x = self.out(x)
        # 使用 softmax 激活函数
        # dim=-1：每一维度行数据相机为1
        x = torch.softmax(x, dim=-1)
        return x

if __name__ == '__main__':
    # 实例化model对象
    model = Model()
    # 随机产生数据
    data = torch.randn(5,3)
    print('data.shape',data.shape)
    # 数据经过神经网络模型训练
    out = model(data)
    print('out.shape',out.shape)
    # 计算模型参数
    # 计算每层每个神经元的 w 和 b 个数总和
    summary(model,input_size=(3,),batch_size=5)
    # 查看模型参数
    print("======查看模型参数w和b======")
    for name, param in model.named_parameters():
        print(name, param)

神经网络的输入数据是为[batch_size, in_features]的张量经过网络处理后获取了[batch_size, out_features]的输出张量。

在上述例子中，batch_size=5, in_features=3,out_features=2,结果如下所示：

data.shape torch.Size([5, 3])
out.shape torch.Size([5, 2])

模型参数输出：

----------------------------------------------------------------
        Layer (type)               Output Shape         Param #
================================================================
            Linear-1                     [5, 3]              12
            Linear-2                     [5, 2]               8
            Linear-3                     [5, 2]               6
================================================================
Total params: 26
Trainable params: 26
Non-trainable params: 0
----------------------------------------------------------------
Input size (MB): 0.00
Forward/backward pass size (MB): 0.00
Params size (MB): 0.00
Estimated Total Size (MB): 0.00
----------------------------------------------------------------
======查看模型参数w和b======
linear1.weight Parameter containing:
tensor([[ 0.3857,  0.4809, -0.0346],
        [ 0.3645,  0.2803, -0.6291],
        [ 0.1999, -0.6617,  0.7724]], requires_grad=True)
linear1.bias Parameter containing:
tensor([0.3084, 0.5636, 0.4501], requires_grad=True)
linear2.weight Parameter containing:
tensor([[ 0.1063,  0.7494,  0.4311],
        [-1.4152,  0.3396, -0.8590]], requires_grad=True)
linear2.bias Parameter containing:
tensor([-0.3771,  0.2937], requires_grad=True)
out.weight Parameter containing:
tensor([[-0.6012,  0.4727],
        [-0.2953, -0.5854]], requires_grad=True)
out.bias Parameter containing:
tensor([-0.3271,  0.4940], requires_grad=True)

模型参数的计算：

以第一个隐层为例：该隐层有3个神经元，每个神经元的参数为：4个（w1,w2,w3,b1），所以一共用3x4=12个参数。
输入数据和网络权重是两个不同的事儿！对于初学者理解这一点十分重要，要分得清。

2. 神经网络的优缺点

优点
➢ 精度高，性能优于其他的机器学习算法，甚至在某些领域超过了人类。
➢ 可以近似任意的非线性函数。
➢ 近年来在学界和业界受到了热捧，有大量的框架和库可供调。
缺点
➢ 黑箱，很难解释模型是怎么工作的。
➢ 训练时间长，需要大量的计算资源。
➢ 网络结构复杂，需要调整超参数。
➢ 部分数据集上表现不佳，容易发生过拟合。

原文地址：https://blog.csdn.net/dwjf321/article/details/144457551

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：智能家居与AI物联网的无缝连接：构建个性化、智能化的居住体验
下一篇：开源密码管理器 Bitwarden 一站式管理所有密码以及 2FA

linux-16 关于shell（十五）date，clock，hwclock，man，时间管理，命令帮助
想显示一下当前系统上的时间该怎么显示？有一个命令叫做date，来看date命令，如下图，第一个星期几对吧？然后是月日小时分钟秒，最后一个是年对吧？CST指的是它的时间格式，我这个可以先姑且不用管它。这
阅读更多2024-12-14
linux中给某个文件切换成www用户
要将某个文件的拥有者切换为 `www` 用户（通常是用于 Web 服务的用户），你可以使用 `chown` 命令来更改文件的所有者和所属组。使用 `chown` 命令将文件的所有者设置为 `www`
阅读更多2024-12-14
小程序播放设备没有声音
小程序没声音，音频AAC
阅读更多2024-12-14
《宇宙机器人》缺少“msvcp100.dll文件”是什么原因？“缺失msvcp100.dll文件”快速修复方法！
恭喜《宇宙机器人》获得TGA年度游戏！《宇宙机器人》缺少msvcp100.dll的快速修复方法作为一名在软件开发领域摸爬滚打多年的从业者，我深知电脑游戏在运行过程中可能遇到的各种疑难杂症，特别是文件丢
阅读更多2024-12-14
使用火焰图对Go项目进行性能分析
在 Golang 开发中，性能分析是确保应用高效运行的重要环节。这里介绍一下如何使用 gin-contrib/pprof 在 Gin 应用中集成性能剖析工具，并结合 Graphviz 生成图形化的性能
阅读更多2024-12-14
scala基础_数据类型概览
【代码】scala基础_数据类型概览。
阅读更多2024-12-14
DApp开发如何平衡性能与去中心化？
答案是肯定的。在技术层面，DApp浏览器可以完全集成到你自己开发的DApp中，从而提供一个一体化的用户体验。本文将详细分析如何实现这一目标，以及其中的技术实现、优势和需要注意的问题。
阅读更多2024-12-14
μC/OS-Ⅱ源码学习(4)---信号量
这一操作不是一定能成功的，只有当当前计数器值大于0或没有任务等待该信号量时，才能成功设置（这也是合理的，如果有任务正在苦苦等待该信号量，手动设置一个新值会让该任务立即就绪，从而影响了系统的执行时序。这
阅读更多2024-12-14
网络原理初识一＞网络基本的概念, 网络如何转发
⽹络协议是⽹络通信（即⽹络数据传输）经过的所有⽹络设备都必须共同遵从的⼀组约定、规则。经过二次转发，物理层解析，数据链路层解析，构造以太网数据帧，和二进制数据进行转发。多个局域⽹连接起来，在物理上组
阅读更多2024-12-14
RFDiffusion 计算二面角函数get_dih解读
这段代码通过几何方法计算二面角，用于描述蛋白质的主链和侧链构象。
阅读更多2024-12-14

神经网络基础-神经网络搭建和参数计算

文章目录

1.构建神经网络

2. 神经网络的优缺点

相关文章