PyTorch使用教程(10)-torchinfo.summary网络结构可视化详细说明

🕗 发布于 2025-01-20 11:49 深度学习 python pytorch 人工智能

1、基本介绍

torchinfo是一个为PyTorch用户量身定做的开源工具，其核心功能之一是summary函数。这个函数旨在简化模型的开发与调试流程，让模型架构一目了然。通过torchinfo的summary函数，用户可以快速获取模型的详细结构和统计信息，如模型的层次结构、输入/输出维度、参数数量、多加操作(Mult-Adds)等关键信息。

2、安装

首先，你需要安装torchinfo库。可以通过pip进行安装：

pip install torchinfo

3、导入

安装完成后，需要在你的Python脚本中导入torchinfo模块：

from torchinfo import summary

4、函数原型定义

torchinfo的summary函数原型定义如下：

def summary(model: nn.Module, input_data: torch.Tensor | tuple[torch.Tensor, ...] | tuple[int, ...] | None = None, batch_dim: int = 0, col_widths: tuple[int, ...] | None = None, col_names: tuple[str, ...] | None = None, device: str | torch.device | None = None, dtypes: tuple[torch.dtype, ...] | None = None, verbose: int = 1, **kwargs)

参数说明

model: 要分析的PyTorch模型，必须是torch.nn.Module的实例。
input_data: 用于模型前向传播的输入数据。它可以是一个torch.Tensor对象，也可以是一个包含多个输入张量的元组。此外，还可以提供一个表示输入尺寸的元组，例如(batch_size, channels, height, width)。
batch_dim: 指定输入张量中哪个维度是批量大小（batch size）。默认为0。
col_widths: 指定输出列宽的元组。如果未指定，则自动计算列宽以适应输出。
col_names: 指定输出列名的元组。如果未指定，则使用默认列名。
device: 指定模型运行的设备（如’cpu’或’cuda’）。如果未指定，则自动选择。
dtypes: 指定输入张量的数据类型。如果未指定，则自动推断。
verbose: 控制输出信息的详细程度。默认为1，表示输出基本信息。设置为2或更高可以获得更详细的输出。
kwargs: 其他关键字参数，可以传递给模型的前向传播函数。

5、使用方法

下面通过几个示例来展示如何使用torchinfo的summary函数。
5.1 使用预定义模型
首先，我们使用PyTorch预定义的模型（如torchvision.models.resnet50）来展示如何使用summary函数。

import torch
import torchvision.models as models
from torchinfo import summary
# 定义模型
model = models.resnet18(pretrained=False)

# 使用summary函数打印模型概况
summary(model, input_size=(1, 3, 224, 224))

在这个示例中，我们加载了一个未预训练的ResNet50模型，并使用summary函数打印了模型的概况。input_size参数指定了输入数据的大小，即(batch_size, channels, height, width)。
在这里插入图片描述

5.2 使用自定义模型
接下来，我们定义一个简单的自定义模型，并使用summary函数打印其概况。

import torch
import torch.nn as nn
from torchinfo import summary

# 定义一个简单的两层全连接神经网络模型
class SimpleModel(nn.Module):
    def __init__(self):
        super(SimpleModel, self).__init__()
        self.fc1 = nn.Linear(100, 50)
        self.fc2 = nn.Linear(50, 10)
        self.relu = nn.ReLU()

    def forward(self, x):
        x = self.fc1(x)
        x = self.relu(x)
        x = self.fc2(x)
        return x

# 创建模型实例
model = SimpleModel()

# 使用summary函数打印模型概况
summary(model, input_size=(100,))

在这个示例中，我们定义了一个简单的两层全连接神经网络模型，并使用summary函数打印了模型的概况。input_size参数指定了输入数据的大小，即(batch_size, features)。由于我们的模型是一个全连接层，所以我们只指定了特征数量。
在这里插入图片描述

5.3 使用自定义输入数据

有时候，可能想要使用实际的输入数据来查看模型的概况。下面是一个示例，展示了如何使用自定义输入数据来调用summary函数。

import torch
import torchvision.models as models
from torchinfo import summary

# 定义模型
model = models.resnet50(pretrained=False)

# 创建自定义输入数据
input_data = torch.randn(1, 3, 224, 224)  # batch_size=1, channels=3, height=224, width=224

# 使用summary函数打印模型概况
summary(model, input_data=input_data)

在这个示例中，我们创建了一个形状为(1, 3, 224, 224)的随机张量作为输入数据，并使用summary函数打印了模型的概况。注意，这里我们使用input_data参数而不是input_size参数来指定输入数据。

5.4 调整输出格式
torchinfo允许通过col_widths和col_names参数来调整输出的格式。下面是一个示例，展示了如何自定义输出列宽和列名。

import torch
import torchvision.models as models
from torchinfo import summary

# 定义模型
model = models.resnet50(pretrained=False)

# 使用summary函数打印模型概况，并自定义输出列宽和列名
summary(model, input_size=(3, 224, 224), col_widths=(30, 30, 20, 20),
        col_names=('input_size', 'output_size', 'kernel_size', 'num_params'))

在这个示例中，我们自定义了输出列宽和列名。col_widths参数指定了每列的宽度（以字符为单位），而col_names参数指定了每列的列名。这样，就可以根据需要来调整输出的格式了。

6、小结

torchinfo的summary函数是一个强大的工具，可以方便地查看PyTorch模型的结构和参数数量。通过本文的介绍，应该已经掌握了如何使用summary函数来打印模型的概况。无论使用预定义模型还是自定义模型，无论是使用输入尺寸还是自定义输入数据，torchinfo都能提供详细而清晰的输出信息。希望这篇文章能对你有所帮助！

原文地址：https://blog.csdn.net/evm_doc/article/details/145241252

免责声明：本站文章内容转载自网络资源，如侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：【开源免费】基于Vue和SpringBoot的保险合同管理系统（附论文）
下一篇：监控与调试：性能优化的利器 — ShardingSphere

使用Dify访问数据库(mysql)
1、在本地搭建数据库访问的服务，并使用ngrok暴露到公网。2、创建知识库，导入表结构描述。3、创建数据库访问工作流。4、创建数据库智能体。
阅读更多2025-01-20
PageHelper快速使用
/</</</
阅读更多2025-01-20
【漫话机器学习系列】054.极值（Extrema）
极值是数学分析和优化问题中的一个核心概念，指函数在某个定义域内取得的最大值或最小值。极值是分析函数行为的重要工具，广泛应用于优化、建模和决策中。通过数学条件和数值方法，可以有效地识别和验证极值点，从而
阅读更多2025-01-20
气体泄漏分割数据集labelme格式1612张1类别
重要说明：可以将数据集用labelme打开编辑，json数据集需自己转成mask或者yolo格式或者coco格式作语义分割或者实例分割。数据集格式：labelme格式(不包含mask文件，仅仅包含jp
阅读更多2025-01-20
根据进程id查看服务使用的垃圾收集器
*1.使用`jcmd`工具****步骤：****2.使用`jinfo`工具****步骤：****3.使用Java性能监控工具****3.1使用VisualVM****3.2使用JavaMissionC
阅读更多2025-01-20
202年寒假充电计划——自学手册网络安全（黑客技术）
网络安全可以基于攻击和防御视角来分类，我们经常听到的“红队”、“渗透测试”等就是研究攻击技术，而“蓝队”、“安全运营”、“安全运维”则研究防御技术。走安全行业的工程方向的，技术上面其实有很大的重叠性，
阅读更多2025-01-20
Java基础--类和对象
类是构建对象的模板，一个类可以创建多个对象，每个对象的数据的最初来源来自对象publicStringname="张三"；}//创建Student类第一个student：表示数据类型
阅读更多2025-01-20
PyTorch使用教程(11)-cuda的使用方法
Torch是一个流行的深度学习库，由PyTorch开发团队创建，主要用于Python编程环境。当Torch结合CUDA时，它可以显著提升训练深度神经网络的速度。通过将数据和计算转移到GPU上，利用GP
阅读更多2025-01-20
深入浅出：Go语言os包中的API使用指南
包是Go语言标准库中的一个重要组成部分，它为开发者提供了与操作系统进行交互的接口。包的实际应用，我们将构建一个简单的命令行工具，该工具能够列出当前目录下的所有文件，并计算它们的总大小。包的设计目标是提
阅读更多2025-01-20
postman请求参数化
在测试脚本（Tests）中，可以使用JavaScript代码来更新环境变量的值。例如，假设从API响应中获取了一个新的用户令牌（token），可以通过以下代码将其更新到环境变量中：这样，在后续的请求中
阅读更多2025-01-20