【深度学习】矩阵操作万能函数 einsum-爱因斯坦求和

🕗 发布于 2024-10-06 12:11 深度学习 矩阵 人工智能

ref:https://blog.csdn.net/zhaohongfei_358/article/details/125273126
在学习transformer的时候，看到代码里面有

        values = self.values(values)  # (N, value_len, embed_size)
        keys = self.keys(keys)  # (N, key_len, embed_size)
        queries = self.queries(query)  # (N, query_len, embed_size)

        # Split the embedding into self.heads different pieces
        values = values.reshape(N, value_len, self.heads, self.head_dim)
        keys = keys.reshape(N, key_len, self.heads, self.head_dim)
        queries = queries.reshape(N, query_len, self.heads, self.head_dim)

        # Einsum does matrix mult. for query*keys for each training example
        # with every other training example, don't be confused by einsum
        # it's just how I like doing matrix multiplication & bmm

        energy = torch.einsum("nqhd,nkhd->nhqk", [queries, keys])
        # queries shape: (N, query_len, heads, heads_dim),
        # keys shape: (N, key_len, heads, heads_dim)
        # energy: (N, heads, query_len, key_len)

把我看蒙了，所以这次正经学习一下，看看咋回事。这个颇有一些只可意会不可言传的感觉，还是人菜瘾大，理解不深啊！

einsum 在numpy和torch中都有，借助了index–>(求和）

import torch
import torch.nn as nn
import torch.optim as optim
x = torch.rand((2, 3))
v = torch.rand((1, 3))
print(torch.einsum('ij,kj->ik', x, v).shape) # 矩阵乘法
print(torch.einsum('ij,kj->ki', x, v).shape) # 矩阵乘法 + T
print(torch.einsum('ij,km->ijkm', x, v).shape) # 这个算是一个拼接吧

x = torch.rand((2, 3))
v = torch.rand((1, 3))
print(torch.einsum('ij,kj->ik', x, v).shape)
print(torch.einsum('ij,kj->ki', x, v).shape)
print(torch.einsum('ij,km->ijkm', x, v).shape)

import torch
x = torch.tensor([
    [1, 2, 3],
    [4,5,6]
    ])
y = torch.tensor([
    [7,8,9]
    ])
x,y

(tensor([[1, 2, 3],
         [4, 5, 6]]),
 tensor([[7, 8, 9]]))

result = torch.einsum('ij,km->ijkm', x, y)
result

tensor([[[[ 7,  8,  9]],

         [[14, 16, 18]],

         [[21, 24, 27]]],


        [[[28, 32, 36]],

         [[35, 40, 45]],

         [[42, 48, 54]]]])

a = [
    [[1, 2],   # i=0
     [3, 4]],  # i=0
    [[5, 6],   # i=1
     [7, 8]]   #  i=1
]

b = [
     [[9, 10, 11], #  i=0
     [12, 13, 14]], #  i=0
     
    [[15, 16, 17], # i=1
     [18, 19, 20]]  # i=1
]

torch.tensor(a[0]).shape,torch.tensor(b[0]).shape

torch.tensor(a[0]).shape,torch.tensor(b[0]).shape

torch.tensor(a[0]) @ torch.tensor(b[0])

torch.tensor(a[0]) @ torch.tensor(b[0])

torch.tensor(a[1]) @ torch.tensor(b[1])

tensor([[183, 194, 205],
        [249, 264, 279]])

res = []
for i in range(len(a)):
    a1 = torch.tensor(a[i])
    b1 = torch.tensor(b[i])
    res.append(a1@b1)
res1 = torch.stack(res)
print(res,"\n",res1)

res = []
for i in range(len(a)):
    a1 = torch.tensor(a[i])
    b1 = torch.tensor(b[i])
    res.append(a1@b1)
res1 = torch.stack(res)
print(res,"\n",res1)

x = torch.rand(3, 3)
torch.einsum('ii->i', x),x

(tensor([0.7127, 0.3843, 0.2046]),
 tensor([[0.7127, 0.0171, 0.9940],
         [0.6781, 0.3843, 0.9031],
         [0.4963, 0.1581, 0.2046]]))

原文地址：https://blog.csdn.net/weixin_40293999/article/details/142712073

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：C# Blazor Server 调用海康H5Player播放摄像头画面
下一篇：UE4 材质学习笔记03（翻书（Flipbook）动画/环境混合）

leetcode289:生命游戏
根据，简称为，是英国数学家约翰·何顿·康威在 1970 年发明的细胞自动机。给定一个包含m × n个格子的面板，每一个格子都可以看成是一个细胞。每个细胞都具有一个初始状态：1即为（live），或0即为
阅读更多2024-10-20
MongoDB数据恢复
注意：两个MongoDB的版本要一致，本文使用的是mongo:4.2.24。先把K8S上面的MongoDB 容器停止（可以把副本改成0）。1、将容器挂载MongoDB的数据目录备份到本地。经常是数据文
阅读更多2024-10-20
C#中实现事务
C#中实现事务
阅读更多2024-10-20
【LeetCode每日一题】——560.和为 K 的子数组
给你一个整数数组 nums 和一个整数 k ，请你统计并返回该数组中和为 k 的子数组的个数。子数组是数组中元素的连续非空序列。
阅读更多2024-10-20
「漏洞复现」满客宝智慧食堂系统 selectUserByOrgId 未授权访问漏洞
请勿利用文章内的相关技术从事非法测试，由于传播、利用此文所提供的信息而造成的任何直接或者间接的后果及损失，均由使用者本人负责，作者不为此承担任何责任。工具来自网络，安全性自测，如有侵权请联系删除。本次
阅读更多2024-10-20
React面试题目（从基本到高级）
React前端面试常见题目涵盖了React的基础概念、组件、状态管理、生命周期、性能优化等多个方面。
阅读更多2024-10-20
12.个人博客系统（Java项目基于spring和vue）
1 在校学习的学生，可用于日常学习使用或是毕业设计使用 2 毕业一到两年的开发人员，用于锻炼自己的独立功能模块设计能力，增强代码编写能力。 3 亦可以部署为商化项目使用。 4 需要完整资料及源码
阅读更多2024-10-20
YoloV8改进策略：注意力改进|DeBiFormer，可变形双级路由注意力|引入DeBiLevelRoutingAttention注意力模块（全网首发）
本次改进的核心在于将DeBiLevelRoutingAttention模块嵌入到YoloV8的主干网络中，具体位置是在SPPF（Spatial Pyramid Pooling Fast）模块之后。这一
阅读更多2024-10-20
word取消自动单词首字母大写
情况说明：在word输入单词后首字母会自动变成大写取消单词首字母大写步骤：（1）点击菜单栏文件（2）点击“更多”——>“选项”（3）点击“校对”——>“自动更正选项”（4）取消“句首字母大
阅读更多2024-10-20
web前端网页用户注册页面
【代码】web前端网页用户注册页面。
阅读更多2024-10-20

【深度学习】矩阵操作万能函数 einsum-爱因斯坦求和

相关文章