PyTorch 张量的分块处理介绍

🕗 发布于 2025-01-14 15:08 pytorch 人工智能 python

分块处理是将大型张量分解成较小的块，以便更高效地进行计算，减少内存占用，特别适用于处理超大张量的场景（如深度学习中的大批量数据或大型模型训练）。

PyTorch 提供了多种方法来分块张量，包括 chunk、split、unfold 等。以下是这些方法的介绍及其适用场景。

1. 使用 `torch.chunk`

功能
将张量沿指定维度分成 指定数量的块。

语法

torch.chunk(input, chunks, dim=0)

input：输入张量。
chunks：将张量分成的块数。
dim：指定分块的维度。

示例

x = torch.arange(12).reshape(3, 4)  # 一个 3x4 的张量
print(x)

# 沿第 0 维（行）分成 3 块
chunks = torch.chunk(x, chunks=3, dim=0)
for i, chunk in enumerate(chunks):
    print(f"Chunk {i}:\n{chunk}")

2. 使用 `torch.split`

功能
将张量沿指定维度分成 指定大小的块。每块的大小可以不相同。

语法

torch.split(input, split_size_or_sections, dim=0)

split_size_or_sections：可以是整数（每块的大小）或列表（每块的大小分别定义）。
dim：指定分块的维度。

示例

x = torch.arange(12).reshape(3, 4)

# 沿第 1 维（列）分成大小为 2 的块
chunks = torch.split(x, 2, dim=1)
for i, chunk in enumerate(chunks):
    print(f"Chunk {i}:\n{chunk}")

# 指定块的大小分别为 1 和 3
chunks = torch.split(x, [1, 3], dim=1)
for i, chunk in enumerate(chunks):
    print(f"Chunk {i}:\n{chunk}")

3. 使用 `torch.unfold`

功能
从张量中提取 滑动窗口 块，适用于卷积、时间序列等需要处理局部区域的场景。

语法

torch.unfold(input, dimension, size, step)

dimension：滑动窗口应用的维度。
size：窗口大小。
step：滑动步长。

示例

x = torch.arange(1, 10).reshape(1, 1, 3, 3)  # 3x3 张量
print("Original tensor:\n", x)

# 滑动窗口大小为 2x2，步长为 1
unfolded = x.unfold(2, 2, 1).unfold(3, 2, 1)
print("Unfolded tensor shape:", unfolded.shape)
print("Unfolded tensor:\n", unfolded)

注： x.unfold(2, 2, 1)中第一个2为维度，第二个2为窗口大小，1为滑动步长。

4. 分块处理的优化场景

(1) 内存优化

当内存不足以加载整个大张量时，将其分块并逐块处理可以显著减少内存占用。

(2) 并行处理

将张量分块后，可以将各个块分配到不同的设备（如多 GPU）进行并行计算，提高计算效率。

(3) 数据流批处理

在训练深度学习模型时，可将大批次数据分块处理，避免一次性加载超大批次导致显存溢出。

5. 分块与重组

分块后常需要对处理后的块进行重组，以恢复原始张量的形状。PyTorch 提供以下方法：

(1) `torch.cat`

将多个张量按指定维度连接。

x1 = torch.tensor([[1, 2]])
x2 = torch.tensor([[3, 4]])
result = torch.cat([x1, x2], dim=0)
print(result)  # tensor([[1, 2],
               #         [3, 4]])

(2) `torch.stack`

将多个张量堆叠到新的维度上。

x1 = torch.tensor([1, 2])
x2 = torch.tensor([3, 4])
result = torch.stack([x1, x2], dim=0)
print(result)  # tensor([[1, 2],
               #         [3, 4]])

(3) `torch.reshape`

用于恢复分块前的形状。

chunk = torch.arange(12).reshape(3, 4)
flattened = chunk.flatten()
restored = flattened.reshape(3, 4)
print(restored)

6. 总结

chunk：按块数分割张量，块大小可能不均。
split：按块大小分割张量，可以自定义每块的大小。
unfold：生成滑动窗口块，适用于局部区域计算。
分块优化场景：适用于内存优化、并行计算和大批次数据处理。

原文地址：https://blog.csdn.net/qq_27390023/article/details/145024043

免责声明：本站文章内容转载自网络资源，如侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：【Redis】数据结构|内部编码
下一篇：【Linux】Linux常见指令（下）

蓝桥杯R格式--高精度算法模拟
【代码】蓝桥杯R格式--高精度算法模拟。
阅读更多2025-01-21
2025年01月20日Github流行趋势
项目维护者：eclectic-coding,jakeherp,evanplaice,eclecticCodingND,Easybuoy。项目维护者：kamaljohnson,ssiyad,Ritvik
阅读更多2025-01-21
2025美赛Latex模板可直接运行！O奖自用版
2025年美赛Latex模板自用版，O奖优秀论文的Latex模板!
阅读更多2025-01-21
# [0114] Task01 《数学建模导论》P1 解析几何与方程模型
几何语言：∵。
阅读更多2025-01-21
Linux：常用命令--文件与目录操作
每一个用户在Linux系统（典型的多用户操作系统）中都有自己的专属工作目录，称之为HOME目录。功能：用于修改文件或者目录的时间属性，包括存取时间和更改时间。，表示当前工作目录内的test文件夹内的a
阅读更多2025-01-21
Vue2：el-tree用scope slot为每一个节点添加一个鼠标悬浮时出现的右对齐的按钮
el-tree中，每一个节点后面添加一个按钮，响应除节点点击事件之外的操作，要求：1、按钮在鼠标悬浮在该节点之上时才出现2、按钮右对齐实现如下。
阅读更多2025-01-21
第五篇 vue3 ref 与 reactive 对比
注意点： ref 不能写越过 value. 必须要在valeu 前面进行定义。若需要一个响应式对象，且层级较深，推荐使用。若需要一个基本类型的响应式数据，必须使用。通过 ref 来修改整体的名称
阅读更多2025-01-21
WebSocket 和 Socket 的区别
综上所述，Socket提供了更底层的网络通信接口，适用于需要对网络细节有深入控制的场景；而WebSocket则更适用于现代Web应用程序中需要双向通信的场景，它在开发效率和性能上具有优势，特别是在需要
阅读更多2025-01-21
gather算子的CUDA编程和算子测试
知乎介绍参考添加链接描述完整测试框架参考本人仓库添加链接描述gather算子的onnx定义参考添加链接描述，该算子的主要变换参考下图：这里我们不妨以input = [A, dimsize, D]， i
阅读更多2025-01-21
MySQL指定表使用的存储引擎
MySQL指定表使用的存储引擎
阅读更多2025-01-21

PyTorch 张量的分块处理介绍

1. 使用 torch.chunk

2. 使用 torch.split

3. 使用 torch.unfold