q @ k运算及att = (q @ k.transpose(-2, -1))含义

🕗 发布于 2024-04-13 10:28 pytorch 人工智能 python

以下代码经常在Transformer的算法中见到：

q, k, v = qkv[0], qkv[1], qkv[2] # query, key, value tensor
q = q * self.scale
attn = (q @ k.transpose(-2, -1))

其中涉及到a @ b操作和transpose操作

a = torch.Tensor([[1,2],[3,4]])
print(a)

b = torch.Tensor([[0.5,2],[0.5,0.5]])
print(b)

print(a@b)

输出：
tensor([[1., 2.],
        [3., 4.]])
tensor([[0.5000, 2.0000],
        [0.5000, 0.5000]])
tensor([[1.5000, 3.0000],
        [3.5000, 8.0000]])

import torch
x=torch.randn(12,3,10,20)
y=torch.randn(20,30)
z=x@y
print(z.shape)

输出结果：
torch.Size([12, 3, 10, 30])

从以上结果可以发现，默认以最后两维进行矩阵乘法运算

transpose(-2, -1) 表示将 k 的最后两维进行转置(交换位置)

import torch
q = torch.randn(125,2,343,16)
k = torch.randn(125,2,343,16)

attn = q @ k.transpose(-2, -1)

print(attn.shape)

输出：
torch.Size([125, 2, 343, 343])

原文地址：https://blog.csdn.net/ym62033/article/details/137549773

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：mysql数据库基础--基础操作
下一篇：3d max快捷键命令大全

neo4j节点关联路径的表示、节点的增删改查
neo4j节点Nodes、关联Relationships、路径Paths的表示、节点的增删改查
阅读更多2024-09-20
生动好看的css卡片样式
【代码】生动好看的css卡片样式。
阅读更多2024-09-20
51单片机-AT24C02(IIC总线介绍及其时序编写步骤)-第一节（下一节实战）
我以前的文章也有对基本常用的通信协议讲解，如SPI UART IIC RS232 RS485 CAN的讲解，可前往主页查询，（2024.9.12,晚上20：53，将AT24C02存储芯片，掉电不丢失，
阅读更多2024-09-20
视频怎么提取音频？一键音频提取，视频内容轻松听！
视频怎么提取音频？一键解锁音频世界，让视频精彩不再静默！无论您是忙碌于日常工作的上班族，还是热衷于学习的求知者，亦或是享受闲暇时光的聆听者，一键提取音频'功能让视频内容瞬间转化为耳畔的温柔低语，让知识
阅读更多2024-09-20
观成科技：新版suo5隧道工具加密流量跟踪分析
suo5是一个高性能的http隧道代理工具，支持全双工半双工模式，具有很高的传输性能，现在越来越多的webshell管理工具与内存马生成工具都支持了生成suo5木马的功能。从v1.1.0版本开始，其T
阅读更多2024-09-20
23：SPI二：W25Q64存储器模块的使用
其中最主要的特点就是掉电不丢失。由上图所示：W25Qxx的地址是24位的，则代表地址总线是24根地址总线。一个地址则代表一个门牌号，一个门牌号的存储空间是一个字节，那么24位的地址一共有多少个字节？地
阅读更多2024-09-20
C++ 面试模拟02
C++ 面试模拟02
阅读更多2024-09-20
游戏如何应对云手机刷量问题
不同于市面上其他产品，FairGuard加固采用更底层的检测手段，精准区分游戏运行环境，可识别云手机、虚拟机、虚拟框架、越狱、ROOT等各类风险环境，并提供个性化闪退策略。云手机的实现原理是依托公有云
阅读更多2024-09-20
Jupyter的使用
在 Jupyter Notebook 中，代码提示和自动补全的快捷键是非常实用的。可以查看该函数或对象的文档字符串（docstring），提供参数说明和用法示例。在 Jupyter Notebook
阅读更多2024-09-20
Sui与3DOS合作推动3D打印网络的去中心化
3DOS与Sui 联手，通过按需、本地化的3D打印推动全球制造的去中心化。
阅读更多2024-09-20

q @ k运算及att = (q @ k.transpose(-2, -1))含义

其中涉及到a @ b操作和transpose操作

相关文章