Masked_Filled随机置列为零

🕗 发布于 2025-01-15 18:03 深度学习 pytorch 人工智能

文章目录

1. softmax
2. python 方法

1. softmax

在计算损失函数的时候，我们需要将我们填充为0的地方概率置为0，以免参与损失计算，我们一般会将需要置为0的位置上面通过masked_filled函数将为True的位置置为一个非常小的值1e-9，这样经过F.softmax函数后，其值为0。这里用到两个函数，

第一个是F.softmax，主要负责归一化处理，将值转换为0-1内，并且其和为1，转换成概率值。
第二个是Masked_fill 函数，可以通过提供一个同等大小的BOOL矩阵，将为True的地方，填充为自己喜欢的值。
第三个是填充的方式，在transformer中，我们把为0的位置的值填充为负无穷，这样经过为softmax后为零，但是transofrmer中填充的方式为在一个行向量中的末尾填充零，以行向量作为样本向量，列向量为特征向量，根据MIT麻神理工的思路，矩阵A以列向量表示更适合参数学习，所以我们希望通过随机掩码不同位置的列向量，这样通过学习样本的特征维来表示矩阵，所以我们引入一种列向量掩码方式。

2. python 方法

import torch
import torch.nn as nn
import torch.nn.functional as F

torch.set_printoptions(precision=3, sci_mode=False)
torch.manual_seed(333512)

if __name__ == "__main__":
    run_code = 0
    row = 4
    column = 5
    scores = torch.randn(row, column)
    masked = torch.randint(0, 2, (1, column)).to(torch.bool)
    masked_scores = scores.masked_fill(masked, -1e9)
    scores_softmax = F.softmax(masked_scores, dim=-1)
    print(f"scores=\n{scores}")
    print(f"masked=\n{masked}")
    print(f"masked_scores=\n{masked_scores}")
    print(f"scores_softmax=\n{scores_softmax}")

结果：

scores=
tensor([[-0.786,  1.136,  1.624,  0.417,  1.366],
        [-0.520, -0.127, -0.219, -0.489,  0.276],
        [-0.937, -0.734,  1.221, -0.305,  1.020],
        [ 2.252, -0.042, -1.098,  1.135, -0.075]])
masked=
tensor([[False,  True,  True, False,  True]])
masked_scores=
tensor([[    -0.786, -1000000000.000, -1000000000.000,      0.417, -1000000000.000],
        [    -0.520, -1000000000.000, -1000000000.000,     -0.489, -1000000000.000],
        [    -0.937, -1000000000.000, -1000000000.000,     -0.305, -1000000000.000],
        [     2.252, -1000000000.000, -1000000000.000,      1.135, -1000000000.000]])
scores_softmax=
tensor([[0.231, 0.000, 0.000, 0.769, 0.000],
        [0.492, 0.000, 0.000, 0.508, 0.000],
        [0.347, 0.000, 0.000, 0.653, 0.000],
        [0.754, 0.000, 0.000, 0.246, 0.000]])

原文地址：https://blog.csdn.net/scar2016/article/details/145083012

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：多云架构下JuiceFS实现一致性与低延迟数据分发的深度解析
下一篇：Ubuntu20.04复现GraspNet全记录（含遇到的问题及解决方法

【LeetCode: 394. 字符串解码 + 栈】
【LeetCode: 394. 字符串解码 + 栈】给定一个经过编码的字符串，返回它解码后的字符串。编码规则为: k[encoded_string]，表示其中方括号内部的 encoded_string
阅读更多2025-01-16
【Git版本控制器--2】Git的分支管理
解决这个问题的⼀个好的建议就是：先把master分支的内容合并到dev分支下，此时虽然会发生合并冲突的情况，但我们也可以进行合并冲突，最关键的是dev分支是用于开发的，哪怕我们在这个分支下解决合并冲突
阅读更多2025-01-16
145.《redis原生超详细使用》
redis原生超详细使用
阅读更多2025-01-16
2025年——【寒假】自学黑客计划（网络安全）
网络安全可以基于攻击和防御视角来分类，我们经常听到的 “红队”、“渗透测试” 等就是研究攻击技术，而“蓝队”、“安全运营”、“安全运维”则研究防御技术。走安全行业的工程方向的，技术上面其实有很大的重叠
阅读更多2025-01-16
[mysql]日志
日志是记录系统、应用程序或服务活动、事件或状态变化的文件或数据库。它通常用于跟踪操作、错误、警告、调试信息等，以便开发人员或管理员分析系统的行为、诊断问题、优化性能或进行安全审计。上面是日志的解释，在
阅读更多2025-01-16
MySQL 学习全攻略
在当今数字化蓬勃发展的时代，数据的存储与管理至关重要，而 MySQL 作为一款广受欢迎的开源关系型数据库管理系统，为无数应用程序提供着强大的数据支撑。无论是网站开发、企业级应用，还是数据分析项目，掌握
阅读更多2025-01-16
向u-boot提交补丁的流程
1. 首先需要订阅一下，地址在此https://lists.denx.de/listinfo/u-boot，使邮箱地址对应有一个成员名称，才能向uboot社区发送补丁，否则会收到Post by non
阅读更多2025-01-16
免费下载 | 2024安全有效性验证能力白皮书
2024安全有效性验证能力白皮书》是一份由北京知其安科技有限公司与北京数字世界咨询有限公司联合撰写的报告，旨在探讨和阐述安全有效性验证（Cybersecurity Validation，CV）的概念、
阅读更多2025-01-16
什么叫慢查询 ?什么情况下出现?怎么解决，怎么优化在微服务中
慢查询（Slow Query）是指在数据库系统中执行时间超过预设阈值的SQL或NoSQL查询。这些查询通常会消耗较多的资源，可能导致数据库性能下降，并且可能影响到其他正在运行的查询或事务。
阅读更多2025-01-16
Ubuntu 20.04 安装Cuda 12.2版本踩坑记录
不要使用deb安装，而是使用runfile安装
阅读更多2025-01-16

Masked_Filled随机置列为零

文章目录

1. softmax

2. python 方法

相关文章