(时序论文阅读)TimeMixer: Decomposable Multiscale Mixing for Time Series Forecasting

🕗 发布于 2024-11-13 11:58 论文阅读 深度学习 人工智能 自然语言处理时间序列处理

来源论文iclr2024

论文地址：https://arxiv.org/abs/2405.14616
源码地址： https://github.com/kwuking/TimeMixer

背景

数据是有连续性，周期性，趋势性的。我们这篇文章主要围绕的是用MLP结构来预测数据的周期性具体为：
短期变化（细粒度）：例如局部波动、尖峰等，通常与日常行为或随机事件相关。
长期变化（粗粒度）：例如趋势、周期性或季节性模式，这些通常反映更广义的规律。
现有方法（如 RNN 和 Transformer）通常只能从单一时间尺度建模，忽略了不同时间尺度之间的关联性。
确实，在金融领域，如a股是有明显的周期性的，在股价预测方面确实可以借鉴。

模型架构

Past-Decomposable-Mixing (PDM)模块

PDM 模块负责从历史数据中提取多尺度的时间特征，通过分解和多层混合来捕捉趋势和季节性
PDM 的具体步骤：
时间序列分解：

使用分解模块（如基于 Autoformer 的策略）将时间序列分为：
1.趋势性成分（Trend）：表示长期变化。
2.季节性成分（Seasonal）：表示短期波动。
生成多尺度的趋势和季节性子序列。（也就是将其自底向上隔点取值）

那是怎么进行多尺度划分的呢？
看这里我们取P为96，l取0，1，2，3.
在这里插入图片描述

原文采用的是普通的平均池化来进行多尺度划分，将P和l进行带入后获得的多尺度提取序列是，第一次比如是隔2个点进行取值获得第一次的粗序列，第二次进行四个点取值的粗序列，第四次是隔八个点取的粗序列，反正是根据2的指数进行递增的。如下图。
在这里插入图片描述

下面这是特征提取层
在这里插入图片描述
那么这个PDM模块得到的是哪个mixing呢？
答案是总的
那我们如何得到这些趋势向和季节向？
原文就是通过平均池化，得到趋势向
然后用总的减去趋势向得到季节向

那么为什么用平均池化可以得到趋势向？
举个例子， 2，4，6，8，假设池化步幅为2
平均池化后得到3，3，7，7那么这就是趋势向得到的结果，这时候我们可以看到这是有上升趋势的，
那么用原来的序列减去平均池化后的序列结果呢？得到-1，1，-1，1 这样一看就很有周期性。

在这里插入图片描述

先看季节向的公式：
季节向是自底向上的，为什么自底向上，是因为季节性的话（也就是周期性），提取向上后时间间隔越来越大，那么得到的上层的周期性就不明显，就需要用下层的信息去补充上层信息，使其达到季节性效果。
在这里插入图片描述
趋势层是自上到下的，自顶向下的处理方式可以在细粒度特征中引入稳定的趋势信息，减少噪声的影响，使模型在噪声较大的数据中表现更鲁棒。自顶向下的处理方式可以在细粒度特征中引入稳定的趋势信息，减少噪声的影响，使模型在噪声较大的数据中表现更鲁棒。
在这里插入图片描述

在这里插入图片描述

FMM模块

就是将多尺度提取后mixing模块的结果进行维度转换，把它统一到一个维度去，最后在进行加权得到最后的预测结果。
在这里插入图片描述

总体模型图如下。
在这里插入图片描述

实验部分

最后实验部分也是比sota模型高。
TimeMixer在所有基准测试中都实现了一致的最先进性能，涵盖了具有不同频率、
变量数和实际场景的大量系列。特别是，TimeMixer的性能明显优于PatchTST，天气MSE降低
了9.4%，Solar-Energy MSE降低了24.7%。值得注意的是，即使在Solar-Energy和ETT等可预测
性较低的数据集上，TimeMixer也表现出了良好的性能，进一步证明了TimeMixer的通用性和有
效性。
在这里插入图片描述
为了验证模型的泛化能力，在一些比较随机性差的数据集是否有效果，作者定义了一个指标
Forecastability，Forecastability可预测指数(2013ForeCA算法)
谱熵–反映数据在频域中的不确定性，度量数据集混乱程度的指标，熵值越高，时间序列趋势越复杂，越难以预测
(1-熵值)越大，可预测Forecastability:性越强

在这里插入图片描述

原文地址：https://blog.csdn.net/wq2571931803/article/details/143714962

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：HTML文件中引入jQuery的库文件
下一篇：【蓝桥等考C++真题】蓝桥杯等级考试C++组第13级L13真题原题(含答案)-最大的数

sql server 查看io资源使用
如果输出physical reads 或者 read-ahead reads 大于0 ，则表示有物理读取。
阅读更多2024-11-14
opencv入门学习总结
import cv2 # 返回当前安装的 OpenCV 库的版本信息并且是字符串格式 print(cv2 . getVersionString()) """作用：它可以
阅读更多2024-11-14
stable-diffusion-3 ，每天免费试用
官方space，童叟无欺，科学试用。
阅读更多2024-11-14
AI绘画经验（stable-diffusion）
在Stable Diffusion中，编码器将图像压缩成一个较小的Latent特征向量，这个向量包含了图像的关键信息，并且可以作为U-Net的输入。在Stable Diffusion中，文本编码器用于
阅读更多2024-11-14
【Linux网络编程】Socket编程--TCP：echo server | 多线程远程命令执行
【Linux网络编程】Socket编程--TCP：echo server | 多线程远程命令执行
阅读更多2024-11-14
vLLM×Milvus：如何高效管理GPU内存，减少大模型幻觉
大语言模型（LLM）是功能丰富且强大的 AI 系统，能够解决各个领域内的众多问题。它们的发展速度非常快，新模型不断被频繁推出。通常，新推出的 LLM 在处理各种任务时的性能更好。例如 Mistral、
阅读更多2024-11-14
一个功能强大的文档解析和转换工具，支持PDF、DOCX、PPTX和Markdown等
Docling是一个功能强大的文档解析和转换工具，支持多种文档格式，提供先进的PDF理解功能，并允许用户将文档转换为Markdown和JSON格式。它还具有元数据提取、OCR支持、无缝集成以及其他高级
阅读更多2024-11-14
计算机网络：运输层 —— TCP 协议概述与 TCP 报文段首部格式
传输控制协议（Transmission Control Protocol，TCP）协议是互联网上最常用的传输层协议之一，它负责提供可靠的端到端数据传输服务。TCP 协议采用连接导向的通信方式，通过三次
阅读更多2024-11-14
MySQL常见面试题
MySQL常见面试题
阅读更多2024-11-14
《Redis 实战基础、持久化机制及与 MySQL 一致性解决方案》
本文探讨了Redis的持久化机制及其在不同场景下的应用，并简要介绍了与MySQL数据同步的一致性解决方案。希望这些内容能帮助读者更好地理解和使用Redis，提升应用系统的性能和可靠性。
阅读更多2024-11-14

(时序论文阅读)TimeMixer: Decomposable Multiscale Mixing for Time Series Forecasting

背景

模型架构

Past-Decomposable-Mixing (PDM)模块

FMM模块

实验部分

相关文章