文献阅读（81）FACT

🕗 发布于 2024-09-21 04:30 硬件架构

题目：FACT: FFN-Attention Co-optimized Transformer Architecture with Eager Correlation Prediction
时间：2023
会议：ISCA
研究机构：清华

主要贡献

算法优化：提出了Eager Prediction (EP)，预测softmax前重要的部分，跳过不重要的计算，减少QKV的计算量。
使用基于log的加法操作进行预测，减少乘法运算。
通过一个乱序调度器消除预测的延迟，使得预测和计算可以完全流水线化。
通过一种新颖的对角线存储模式避免混合精度FFN中的内存访问冲突。

在这里插入图片描述
如上图所示，transformer中FFN的计算量是更大的，只有token数量足够长时attention的计算量才会超过FFN

在这里插入图片描述
过去的工作只是节约了S=QK的计算量，还不够，这篇论文更进一步，预测完再动态的生成QKV，从而结余QKV的计算量

在这里插入图片描述
Out-of-order QKV Generation Scheduler

输入和预测：输入token矩阵被送入系统，同时EP单元开始工作，预测注意力矩阵。
乱序QKV生成：
步骤1：EP单元预测第一行的注意力矩阵，确定需要计算的K、V矩阵的列。
步骤2：PE阵列立即开始为这些列生成K、V矩阵，并将结果存储在临时缓冲区中。
步骤3：当EP单元预测下一行的注意力矩阵时，PE阵列会计算额外需要的K、V矩阵，同时继续处理之前生成的Q矩阵。
并行处理：随着EP单元逐行预测注意力矩阵，PE阵列并行地生成QKV矩阵，并根据预测结果动态调整计算顺序。
存储和使用：生成的QKV矩阵以乱序的方式存储在临时缓冲区中，当计算某一行的注意力分数时，直接从缓冲区中读取对应的QKV矩阵。

原文地址：https://blog.csdn.net/tiaozhanzhe1900/article/details/142386705

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：[leetcode刷题]面试经典150题之4删除有序数组中的重复项II（中等）
下一篇：WPF入门教学四 WPF控件概述

栈和队列（选择题）
栈的存储结构可以分为和。顺序存储的栈称为，链式存储的栈称为。（1）顺序栈顺序栈：利用一组地址连续的存储单元存放自栈底到栈顶的数据元素，同时附设一个指针（top）指示当前栈顶位置。栈空条件：顺序栈的数组
阅读更多2024-09-22
C++从入门到起飞之——多态全方位剖析！
多态是⼀个继承关系的下的类对象，去调⽤同⼀函数，产⽣了不同的⾏为。⽐如Student继承了 Person。Person对象买票全价，Student对象优惠买票。
阅读更多2024-09-22
9月16日笔记
当安全主体访问该安全对象时，Windows会检查安全主体的 SID和安全对象 DACL中的 ACE 配置策略，根据找到的 ACE 配置策略对安全主体的访问行为允许或拒绝。MA，允许的最大值;选中预先创
阅读更多2024-09-22
synchronized锁的升级过程
synchronized锁的升级过程
阅读更多2024-09-22
电脑远程启动Wol
Wake On lan
阅读更多2024-09-22
专业学习｜《随机过程》学习笔记（二）（定义、分类及相关过程）
本片博客继上一篇学习指引文之后，强调介绍了随机过程的分类，让读者能对随机过程、随机过程的分类有一个系统了解，其中还补充了一些基础知识以便读者了解推导过程。
阅读更多2024-09-22
汇川AM600 与 codesys opc server 通讯并建立 OPCserver 的方法
AM600 OPC Server 架构。
阅读更多2024-09-22
VM-Ubantu中使用vscode头文件报错——解决办法
VM-Ubantu中使用vscode头文件报错——解决办法。使用快捷键shift+ctrl+p，点击Edit Config(JSON)，并将下面的代码复制进去即可
阅读更多2024-09-22
Hive企业级调优[2]—— 测试用表
文件上传到 hadoop12 节点的。文件上传到 hadoop12 节点的。文件上传到 hadoop12 节点的。文件上传到 hadoop12 节点的。注：需要下载源数据的，评论区私俺。目录，并执行以
阅读更多2024-09-22
力扣无重复字符的最长子串
使用滑动窗口结合双指针，滑动窗口的表示采用哈希表存储字母数量信息的方式在窗口滑动的过程中维护最大不重复子串长度。
阅读更多2024-09-22

文献阅读（81）FACT

相关文章