深度学习计算

🕗 发布于 2024-09-20 18:14 python 深度学习 开发语言

一、层和块

块可以描述单个层、多个层组成的组件或整个模型。

通过定义块，组装块，可以实现复杂的神经网络。

一个块可以由多个class组成。

其实就是 自己定义神经网络net，自己定义层的顺序和具体的init、 forward函数。

层和块的顺序由sequential处理。

eg：

class MLP( nn . Module): # 这里只要继承了就可以实例化为一个层

# 用模型参数声明层。这里，我们声明两个全连接的层

def __init__(self):

# 调用MLP的父类Module的构造函数来执行必要的参数初始化。 即hidden和out的参数会自动生成。

# 这样，在类实例化时也可以指定其他函数参数，例如模型参数params（稍后将介绍）

super().__init__()

self . hidden = nn.Linear( 20 , 256 ) # 隐藏层

self . out = nn.Linear( 256 , 10 ) # 输出层

# 定义模型的前向传播， 即如何根据输入X返回所需的模型输出

def forward(self, X):

# 注意，这里我们使用ReLU的函数版本，其在nn.functional模块中定义。

return self.out(F.relu(self.hidden(X)))

自己定义网络中的层

一般是在init里定义层，在forward里定义参数的传递 即输出的内容 。

# 手搓一个sequential类

class MySequential(nn.Module):

def __init__(self, *args):

super().__init__()

for idx, module in enumerate(args):

# 这里，module是Module子类的一个实例。我们把它保存在'Module'类的成员

# 变量_modules中。_module的类型是OrderedDict

# _modules的优点是，在模块的参数初始化过程中，系统会在里面查找需要初始化参数的子块。

self._modules[str(idx)] = module

def forward(self, X):

# OrderedDict保证了按照成员添加的顺序遍历它们

for block in self._modules.values():

X = block(X)

return X

net = MySequential (nn.Linear( 20, 256 ), nn.ReLU(), nn.Linear( 256 , 10 ))

为了更强的灵活性，我们想将自己定义的块加入模型中。

class FixedHiddenMLP(nn.Module):

def __init__(self):

super().__init__()

# 不计算梯度的随机权重参数。因此其在训练期间保持不变

self.rand_weight = torch.rand((20, 20), requires_grad=False) # 需要一个常数参数时

self.linear = nn.Linear(20, 20)

def forward(self, X):

X = self.linear(X)

# 使用创建的常量参数以及relu和mm函数

X = F.relu(torch.mm(X, self.rand_weight) + 1)

# 复用全连接层。这相当于两个全连接层共享参数

X = self.linear(X)

class NestMLP(nn.Module):

def __init__(self):

super().__init__()

self.net = nn.Sequential(nn.Linear(20, 64), nn.ReLU(),

nn.Linear(64, 32), nn.ReLU())

self.linear = nn.Linear(32, 16)

def forward(self, X):

return self.linear(self.net(X)) #骚操作

chimera = nn.Sequential(NestMLP(), nn.Linear(16, 20), FixedHiddenMLP())

二、保存模型参数

torch. save( net .state_dict(), 'mlp.params') #保存参数

clone = MLP()

clone.load_state_dict(torch.load('mlp.params')) #复用参数

clone.eval()

原文地址：https://blog.csdn.net/weixin_74152658/article/details/142311215

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：HTML 和 CSS
下一篇：Vite：快速构建现代Web应用的工具

python教程修订版
目前为止 one of the most sõught after for jobs.
阅读更多2024-09-24
Day26笔记-Day25作业讲解&对象的序列化和反序列化&安装第三方库
帮助0基础的小伙伴入门和学习Python！
阅读更多2024-09-24
数据驱动农业——农业中的大数据
AI、物联网、云计算和移动互联网等技术迅速发展，数据量呈爆炸式增长，传统的数据分析方法已无法满足需求。大数据技术在此背景下应运而生，为海量数据的分析提供了新机遇。虽然大数据技术在金融、医疗、交通等领域
阅读更多2024-09-24
深度学习：（七）梯度下降法在神经网络中的应用
详细说明了梯度下降法在神经网络中的应用，并给出公式和参数随机初始化的方法
阅读更多2024-09-24
JDBC封装day02
查询：ResultSet rs = this.executeSQL(SQL语句,Object数组)增，删，改: int i = this.executeUpdate(SQL语句,Object数组)co
阅读更多2024-09-24
【一句话点破】【C++重要题目】基类与派生类的成员变量值被对象调用的结果（二）
【一句话点破】基类/派生类的成员变量由哪个对象初始化的，哪个对象调用该成员变量时就用由它初始化的值 [尤其找准是基类对象or派生类对象的值]
阅读更多2024-09-24
哈里斯表态：承诺支持加密货币投资！
加密风险投资公司Variant的法务主管Jake Chervinsky在X上写道：“这是一种进步，而且是一种好的进步，但哈里斯所说的‘在保护我们的消费者和投资者的同时’可能意味着很多事情。还是想看看政
阅读更多2024-09-24
缓存与数据库如何保持一致及MySQL和Redis的使用场景以及区别
在更新数据库数据后，先删除缓存中的数据，再进行数据库更新操作，这样可以保证在数据库更新期间，缓存中的数据已被删除，下一次查询时会从数据库中读取最新数据，并更新缓存。双写一致性是指在更新数据库数据之前，
阅读更多2024-09-24
vue-animate-onscroll动画库(可来回触发动画)
它是一个 Vue 插件，用于在滚动时触发动画效果。它可以帮助开发者在用户滚动页面时，逐渐展示元素，增强用户体验。基本用法是通过在元素上添加特定的指令，指定动画效果和触发条件。
阅读更多2024-09-24
使用反向代理软件frp在局域网内共享上网
linux服务器借用同局域网的win上的代理工具正常上网
阅读更多2024-09-24

深度学习计算

相关文章