【AI学习】Mamba学习（九）：HiPPO LegS版本

🕗 发布于 2024-10-19 16:34 人工智能 学习

在上一篇《Mamba学习（八）：HiPPO通用框架定义和方法》中关于时间度量的案例中，论文提出了LegT、LagT、LegS三种时间度量方式。
在这里插入图片描述
三种时间度量方式，左边是LegT，就是滑窗的方式，在窗内平均分配权重；中间是LagT，采用了指数衰减的权重；右边是LegS，对整个历史平均分配权重。
HiPPO LegS版本就是基于LegS的时间度量方式得出的闭式解。

HiPPO-LegS: Scaled Measures for Timescale Robustness

HiPPO-LegS具有良好的理论性质：对输入时间尺度不变，计算速度快，并且具有有界梯度和近似误差。
在这里插入图片描述

就如苏神所说：“LegS 是我们的重点关注对象。重点关注 LegS 的原因并不难猜，因为从推导的假设来看，它是目前求解出来的唯一一个能够记忆整个历史的 ODE 系统，这对于很多场景如多轮对话来说至关重要。此外，它还有其他的一些比较良好且实用的性质。”

关于这些良好的理论性质，苏神在《重温被Mamba带火的SSM：HiPPO的一些遗留问题》一文中有详尽的阐述。

在这里插入图片描述

原文地址：https://blog.csdn.net/bylander/article/details/143064038

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：浏览器缓存
下一篇：电子物证的数字化时代：龙信科技引领取证技术革新

指令：计算机的语言(六)
寻址模式：根据操作数的地址使用的不同，在多种寻址方式中加以区分的寻址基址。立即数寻址，操作数是指令本身的常量。寄存器寻址，操作数在寄存器中。基址或偏移寻址，操作数在内存中，其地址是寄存器和指令中的常量
阅读更多2024-10-20
苍穹外卖笔记
用户端小程序展示的菜品数据都是通过查询数据库获得，如果用户端访问量比较大，数据库访问压力随之增大。造成程序卡顿，系统反应慢，体验差。
阅读更多2024-10-20
基于PHP+MySQL+Vue的网上订餐系统
基于PHP+MySQL+Vue的网上订餐系统
阅读更多2024-10-20
CMOS晶体管的串联与并联
对于mos管的串联和并联，一直没有整明白，特别是设计到EDA软件中，关于MOS的M和F参数，就更困惑了，今天看了许多资料以及在EDA软件上验证了电路结构与版图的对应关系，总算有点收获，所以在此与各位同
阅读更多2024-10-20
Vue学习
2.vue实例(对象)中data属性: 定义变量，用来给Vue实例绑定一些相关数据, 绑定的数据可以通过{{变量名}}在Vue作用范围内取出。表单中数据变化导致vue实例data数据变化 vue实
阅读更多2024-10-20
Ubuntu-Ubuntu22.04下Anacodna3的qmake和Qt的qmake冲突问题
Ubuntu22.04下Anacodna3的qmake和Qt的qmake冲突问题。检查问题，说 libcaca 有问题，查看该库的依赖问题。则定位到是库的引用问题，这里的库应该是qt的环境库。指定 q
阅读更多2024-10-20
【密码分析学笔记】ch3 分组密码的差分分析和相关分析方法
密钥在异或运算过程中被抵消 → 直接从明文对异或值得到密文对异或值（绕过密钥）【不随机现象】X和X’是两个长度为n的二进制比特串，是分组长度，理想分组密码满足随机置换。与部分密钥有关的带概率的方程。
阅读更多2024-10-20
网络安全漏洞管理十大度量指标
当前，网络安全漏洞所带来的风险及产生的后果，影响到网络空间乃至现实世界的方方面面，通信、金融、能源、电力、铁路、医院、水务、航空、制造业等行业各类勒索、数据泄露、供应链、钓鱼等网络安全攻击事件层出不穷
阅读更多2024-10-20
ChatGPT-4o丨AI大语言模型优化、本地化部署、从0-1搭建、智能体构建、多模态、时间序列、目标检测及语义分割
ChatGPT-4o丨AI大语言模型优化、本地化部署、从0-1搭建、智能体构建、多模态、时间序列、目标检测及语义分割
阅读更多2024-10-20
JVM进阶调优系列(2)字节面试:JVM内存区域怎么划分，分别有什么用?
详细分析JVM内存划分，以及各个内存区域的作用。并通过实际案例剖析类加载过程，以及类的数据在内存存放细节。
阅读更多2024-10-20

【AI学习】Mamba学习（九）：HiPPO LegS版本

HiPPO-LegS: Scaled Measures for Timescale Robustness

相关文章