23- TIME-LLM: TIME SERIES FORECASTING BY REPRO- GRAMMING LARGE LANGUAGE MODELS

🕗 发布于 2025-01-18 17:32 语言模型 人工智能 自然语言处理

解决问题

用LLM来解决时序预测问题，并且能够将时序数据映射（reprogramming）为NLP token，并且保持backbone的大模型是不变的。解决了时序序列数据用于大模型训练数据稀疏性的问题。

方法

Input Embedding

输入： $X^{N*T}$ ,首先对 $X_i$ 进行均方差归一化，再对 $X_i$ 进行类似卷积操作的分块，每个分块长度为 $L_p$ ，滑动步长为 $s$ ,那么分块后新的序列长度为
在这里插入图片描述
再将 $X_{p}\in{P*L_p}$ 通过线性映射层映射为 $X_{p}\in{P*d_m}$ （相当于将每个段时序信息的数据映射为一个embeding，来描述该时段的信息）。

Patch Reprogramming

将时序数据进行数据对齐，为nlp能理解的信息
文中学习一个 $E'\in{V'*D}$ ，其中 $V^{'}$ 远小于原词典大小，这样可以提升效果。 $E^{'}$ 在模型中进行学习，学习词典与path的相关性信息。
在这里插入图片描述

再将 $E^{'}$ 作为attention中的V和K，path embedding作为attention中的Q，这样就可以得到path与每个nlp token之间的相关性。
在这里插入图片描述

Prompt-as-Prefix.

同时在序列特征前面构造一些提示词信息，来帮助学习。

在打包和前馈时，prompt and patch嵌入 $O_i$ , 通过如图2所示的冻结LLM，我们丢弃前置Prompt-as-Prefix部分并获得输出表示。在此之后，将它们展平并线性投影，以得出最终预测 $Y_i$ . （丢弃指得是只用他们来计算attention吗，最终输出的embedding表示丢弃掉？）
在这里插入图片描述

整体结构

其中LLM是冻结的
在这里插入图片描述

实验

在few-shot（减少训练集数量）和zero-shot（训练集和测试集不同）都进行了评估，都获得了很好的效果

Reprogramming Interpretation

可以看出，在经过充分的学习之后，不同的patch有不同的语意含义，需要不同的原型来表示。
key

在这里插入图片描述

可以借鉴的点

对序列特征进行滑动窗口的划分，每段有不同的含义，生成对应的embedding
通过学习与nlp词典的相关性来减少词表大小，加速训练

原文地址：https://blog.csdn.net/yinyu19950811/article/details/145164712

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：InnoDB存储引擎对MVCC的实现
下一篇：BERT详解

Unity新版InputSystem短按与长按，改键的实现
新版inputsystem是Unity推出的一种新的输入方式，它将设备与行为进行分离，通过配置文件，更利于用户直接进行按键修改与配置。这一部分主要是对InputSystem的简单介绍，我会通过代码形式
阅读更多2025-01-18
C语言程序环境和预处理详解
第1种是翻译环境，在这个环境中源代码被转换为可执行的机器指令。第2种是执行环境，它用于实际执行代码。在ANSIC的任何一种实现中，存在两个不同的环境。
阅读更多2025-01-18
C语言之字符函数和字符串函数（上）
本篇文章讲解了C语言中字符串操作会遇到的一些函数，内容包括函数的了解，使用和模拟实现，能使我们进一步了解这些函数的底层逻辑。对我们的学习很有帮助
阅读更多2025-01-18
vue3.0如何快速封装防抖和节流
防抖节流封装函数，node-vue后台管理系统vue2、vue3后台页面管理
阅读更多2025-01-18
【2024年华为OD机试】 (B卷,200分)- 二叉树中序遍历（Java & JS & Python&C/C++）
本题的核心是通过解析字符串构建二叉树，然后进行中序遍历。使用栈结构解析字符串，提取节点和子树信息。递归构建二叉树节点关系。递归或迭代实现中序遍历。时间复杂度为O(n + m)，适合处理节点数不超过 1
阅读更多2025-01-18
算法练习——链表
算法练习——链表
阅读更多2025-01-18
深度学习常见术语解释
更多的epoch通常意味着模型有更多的机会从数据中学习，但也可能导致过拟合，即模型在训练数据上表现得太好，以至于它无法很好地泛化到新的、未见过的数据。精确率（Precision）：精确率表示在模型预测
阅读更多2025-01-18
【Java Web】第八章微头条项目开发
一、项目简介二、前端项目环境搭建三、后端项目环境搭建四、PostMan测试工具五、登录注册功能六、头条首页功能七、头条发布修改和删除代码解释和关键部分说明：优化和可能的改进方向：总结：该微头条项目是一
阅读更多2025-01-18
WOA-CNN-GRU-Attention、CNN-GRU-Attention、WOA-CNN-GRU、CNN-GRU四模型对比多变量时序预测
WOA-CNN-GRU-Attention、CNN-GRU-Attention、WOA-CNN-GRU、CNN-GRU四模型对比多变量时序预测
阅读更多2025-01-18
matlab中的griddata函数
griddata函数主要用于将不规则分布的数据点插值到规则网格上。x,y:不规则分布的数据点的坐标。v:数据点的值。xq,yq:查询点的坐标。vq:查询点的插值结果。griddata函数支持多种插值方
阅读更多2025-01-18