风速预测（五）基于Pytorch的EMD-CNN-LSTM模型

🕗 发布于 2024-10-05 06:08 pytorch cnn lstm

往期精彩内容：

时序预测：LSTM、ARIMA、Holt-Winters、SARIMA模型的分析与比较

全是干货 | 数据集、学习资料、建模资源分享！

拒绝信息泄露！VMD滚动分解 + Informer-BiLSTM并行预测模型-CSDN博客

风速预测（一）数据集介绍和预处理_风速数据在哪里下载-CSDN博客

风速预测（二）基于Pytorch的EMD-LSTM模型-CSDN博客

风速预测（三）EMD-LSTM-Attention模型-CSDN博客

风速预测（四）基于Pytorch的EMD-Transformer模型-CSDN博客

前言

LSTF(Long Sequence Time-Series Forecasting)问题是在时间序列预测中需要处理长序列的情况。在实际应用中，序列可能会包含大量的数据点，在这种情况下，传统的时间序列预测模型可能会遇到一些挑战，因为处理长序列时会出现一些问题，例如：

长期依赖性：随着时间序列数据的增长，模型需要能够捕捉长期的依赖关系和趋势。
计算复杂性：针对长序列进行训练和预测通常需要更多的计算资源和时间。
内存消耗：长序列通常需要大量的内存来存储数据和模型参数，这可能会导致内存耗尽或者性能下降的问题。

在处理LSTF问题时，选择合适的窗口大小（window size）是非常关键的。选择合适的窗口大小可以帮助模型更好地捕捉时间序列中的模式和特征，为了提取序列中更长的依赖建模，本文把窗口大小提升到96，运用EMD-CNN-LSTM模型来充分提取序列中的特征信息。

本文基于前期介绍的风速数据（文末附数据集），先经过经验模态EMD分解,然后通过数据预处理，制作和加载数据集与标签，最后通过Pytorch实现EMD-CNN-LSTM模型对风速数据的预测。风速数据集的详细介绍可以参考下文：

风速预测（一）数据集介绍和预处理_比较准的风速预测网站-CSDN博客

1 风速数据EMD分解与可视化

1.1 导入数据


import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import matplotlib
matplotlib.rc("font", family='Microsoft YaHei')

# 读取已处理的 CSV 文件
df = pd.read_csv('wind_speed.csv' )
# 取风速数据
winddata = df['Wind Speed (km/h)'].tolist()
winddata = np.array(winddata) # 转换为numpy
# 可视化
plt.figure(figsize=(15,5), dpi=100)
plt.grid(True)
plt.plot(winddata, color='green')
plt.show()

1.2 EMD分解


from PyEMD import EMD

# 创建 EMD 对象
emd = EMD()
# 对信号进行经验模态分解
IMFs = emd(winddata)

# 可视化
plt.figure(figsize=(20,15))
plt.subplot(len(IMFs)+1, 1, 1)
plt.plot(winddata, 'r')
plt.title("原始信号")

for num, imf in enumerate(IMFs):
    plt.subplot(len(IMFs)+1, 1, num+2)
    plt.plot(imf)
    plt.title("IMF "+str(num+1), fontsize=10)
# 增加第一排图和第二排图之间的垂直间距
plt.subplots_adjust(hspace=0.8, wspace=0.2)
plt.show()

2 数据集制作与预处理

2.1 先划分数据集，按照8：2划分训练集和测试集

2.2 设置滑动窗口大小为96，制作数据集

3 基于Pytorch的EMD-CNN-LSTM模型预测

3.1 数据加载，训练数据、测试数据分组，数据分batch


# 加载数据
import torch
from joblib import dump, load
import torch.utils.data as Data
import numpy as np
import pandas as pd
import torch
import torch.nn as nn
# 参数与配置
torch.manual_seed(100)  # 设置随机种子，以使实验结果具有可重复性
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

# 加载数据集
def dataloader(batch_size, workers=2):
    # 训练集
    train_set = load('train_set')
    train_label = load('train_label')
    # 测试集
    test_set = load('test_set')
    test_label = load('test_label')

    # 加载数据
    train_loader = Data.DataLoader(dataset=Data.TensorDataset(train_set, train_label),
                                   batch_size=batch_size, num_workers=workers, drop_last=True)
    test_loader = Data.DataLoader(dataset=Data.TensorDataset(test_set, test_label),
                                  batch_size=batch_size, num_workers=workers, drop_last=True)
    return train_loader, test_loader

batch_size = 64
# 加载数据
train_loader, test_loader = dataloader(batch_size)

3.2 定义EMD-CNN-LSTM预测模型

注意：输入风速数据形状为 [64, 10, 96]， batch_size=64, 维度10维代表10个分量，96代表序列长度（滑动窗口取值）。

3.3 定义模型参数


# 定义模型参数
batch_size = 64
input_len = 96   # 输入序列长度为96 (窗口值)
input_dim = 10    # 输入维度为10个分量
conv_archs = ((1, 32), (1, 64))   # CNN 层卷积池化结构  类似VGG
hidden_layer_sizes = [64, 128]  # LSTM 层 结构
output_size = 1 # 单步输出

model = EMDCNNLSTMModel(batch_size, input_len, input_dim, conv_archs, hidden_layer_sizes, output_size=1)  

# 定义损失函数和优化函数 
model = model.to(device)
loss_function = nn.MSELoss()  # loss
learn_rate = 0.003
optimizer = torch.optim.Adam(model.parameters(), learn_rate)  # 优化器

3.4 模型训练

采用两个评价指标：MSE 与 MAE 对模型训练进行评价，100个epoch，MSE 为0.00412，MAE 为 0.000241，EMD-CNN-LSTM预测效果良好，性能提升明显，适当调整模型参数，还可以进一步提高模型预测表现。通过CNN模型来处理输入的长窗口时间序列数据，能够有效地捕获局部模式和特征，将CNN模型的输出作为LSTM模型的输入，LSTM模型能够更好地捕捉时间序列数据中的长期依赖关系。EMD-CNN-LSTM模型效果明显，可见其性能的优越性。

注意调整参数：

可以适当调整CNN中卷积池化的层数和维度，微调学习率；
调整LSTM层数和维度，增加更多的 epoch （注意防止过拟合）
可以改变滑动窗口长度（设置合适的窗口长度）

3.5 结果可视化

代码、数据整理如下：

原文地址：https://blog.csdn.net/2402_85668383/article/details/142669697

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：【移动端】Viewport 视口
下一篇：docker简介

VMware复制Ubuntu虚拟机后网卡失效的问题
为了在个人电脑上搭建集群，我使用了多台VMware虚拟机来模拟集群主机。之前虚拟机的操作系统时Redhat时，我复制虚拟机后网卡功能没有问题，但这次换成Ubuntu操作系统，我复制了虚拟机后同时启动这
阅读更多2024-10-06
2-109 基于matlab-GUI的BP神经网络
基于matlab-GUI的BP神经网络，10种不同分布的数据样本，9种不同的激活函数，可更改升级网络结构参数，对比各种方法参数下的训练测试效果，实时显示预测过程。程序已调通，可直接运行。
阅读更多2024-10-06
No module named ‘_ssl‘
正常编译安装成功，但是当使用时又出现了奇怪的报错，估计是机器太老了。此时需要注意是否有报错，有报错就是上一步。分别执行以下命令，下载安装包并编译安装。添加路径至ld.so.conf。，这样默认安装路径
阅读更多2024-10-06
sql语法学习
SQL即结构化查询语言(Structured Query Language)，是一种特殊目的的编程语言，是一种数据库查询和程序设计语言，用于存取数据以及查询、更新和管理关系数据库系统；同时也是数据库脚
阅读更多2024-10-06
SQLITE 构建多表查询
如果你有具体的查询需求，可以提供更多的细节，我可以帮你构建更精准的查询。在SQLite中，构建多表查询时，最常用的方式是使用 JOIN 操作符来连接多个表。SQLite不支持 RIGHT JOIN，但
阅读更多2024-10-06
python 实现chaos machine混沌机算法
Chaos Machine（混沌机）算法是一种基于混沌理论的加密算法，它利用混沌系统的复杂性和不可预测性来生成随机序列，从而实现加密功能。混沌系统具有极其敏感的依赖于初始条件的动力学特性，这种特性使得
阅读更多2024-10-06
CE找CSGO人物坐标和视角基址-幽络源原创
现在我们开始找联机模式可用的坐标，如图设置CE的搜索方式为单浮点，搜索-1687,然后改变下自己的X坐标然后再次扫描，当数值比较少的时候，就可以拉到最下方，随便选一个绿色的client+偏移的作为我们
阅读更多2024-10-06
0基础跟德姆（dom）一起学AI 机器学习01-机器学习概述
AI全流程带你玩0基础带你学人工智能相关软件，讲解机器学习、深度学习、大模型等人工智能领域核心知识。帮助想了解，或者正在AI赛道成长的你。
阅读更多2024-10-06
VB.net读写NDEF标签URI智能海报WIFI蓝牙连接
vb.net 读写NDEF标签源码，写入文本、URI智能海报、电子名片、WIFI连接、蓝牙连接、地图坐标、呼叫电话等，支持ForumType2、Ntag、MifareClass、ForumType4、
阅读更多2024-10-06
【我的 PWN 学习手札】tcache stash unlink
tcache stashing unlink atttack 主要利用的是 calloc 函数会绕过 tcache 从smallbin 里取出 chunk 的特性。并且 smallbin 分配后，同大
阅读更多2024-10-06