[go: up one dir, main page]

CN114219027A - 一种基于离散小波变换的轻量级时间序列预测方法 - Google Patents

一种基于离散小波变换的轻量级时间序列预测方法 Download PDF

Info

Publication number
CN114219027A
CN114219027A CN202111536500.3A CN202111536500A CN114219027A CN 114219027 A CN114219027 A CN 114219027A CN 202111536500 A CN202111536500 A CN 202111536500A CN 114219027 A CN114219027 A CN 114219027A
Authority
CN
China
Prior art keywords
sequence
discrete
data
length
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111536500.3A
Other languages
English (en)
Inventor
樊谨
王则昊
吉玉祥
汪森
孙丹枫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Dianzi University
Original Assignee
Hangzhou Dianzi University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Dianzi University filed Critical Hangzhou Dianzi University
Priority to CN202111536500.3A priority Critical patent/CN114219027A/zh
Publication of CN114219027A publication Critical patent/CN114219027A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于离散小波变换的轻量级时间序列预测方法,采用波形分解模块,对输入序列进行分解得到低频分量和高频分量,使得两个分量的长度均为输入序列的一半,然后采用基于分层平行提取特征的离散网络的离散特征提取方法来对两个分量分别预测;离散网络针对注意力机制计算复杂度高的缺点,采用了离散注意力机制进行分块计算attention数值,从而降低了模型的计算复杂度。最后采用波形重构模块生成最终预测序列。该方法可以提高资源利用率,更小的模型规模使得其在资源受限制的设备上更具竞争力。

Description

一种基于离散小波变换的轻量级时间序列预测方法
技术领域
本发明属于时间序列预测领域,具体涉及一种基于离散小波变换的轻量级时间序列预测方法。
背景技术
近年来,时间预测技术广泛地用在设备健康预测系统、天气预测、股票预测等各个领域。时间序列预测是时间序列分析领域的一个重要分支,通常时间序列预测方法会对历史中的时间序列不断学习与分析,从而提取出决定该时间序列变化的特征,在该特征的基础上,对未来一段时间内的时间序列变化趋势进行预测。
随着对时间序列预测问题研究的不断深入,以及各种优秀方法的不断出现,使得时间序列预测问题对新方法的要求不断增高,表现在对预测精度等更高要求、预测序列长度的增加、单变量时间序列向多变量时间序列的转变、要求模型规模尽可能缩小从而使其得到更广泛的应用,等等。
近年来,越来越多的时间序列预测方法专注于提升预测精度、增长预测序列长度。随着时间序列预测问题的要求逐渐增高,众多方法在学习时间序列中的长距离依赖关系问题上越来越乏力,难以取得进一步的突破。直到基于注意力机制(Attention,AT)的Transformer方法的提出,一个新的强大的模块带来了新的视野,得益于其在提取距离较长的两个元素之间依赖关系问题上有着突破性的提高。越来越多的方法中将Transformer方法用于时间序列预测问题上,取得了很好的进展。但Transformer有着较高的计算复杂度,模型规模庞大,使得它对内存具有很高的要求,从而无法直接用于更长的预测要求。于是,越来越多用于改善Transformer的计算复杂度的Transformer变体模型被提出,使其在更长时间序列预测中取得更好的效果。在众多变体模型中,离散特征提取方法(Sepformer)有着相当大的提升。
离散特征提取方法(Sepformer)采用分层平行提取全局特征和局部特征的离散网络(Separate Network),从而提升了整个模型的精度。离散网络(Separate Network)针对注意力(Self-attention)机制的高计算复杂度的缺点,采用了离散注意力(SeparateAttention)机制进行分块计算attention数值,从而降低了模型的计算复杂度至O(C)。该方法可以提高多元时间序列预测的精度、对比已存在的方法降低了计算复杂度以及增加最大预测长度。但该方法依旧具有较大的模型规模,资源利用率较低。
发明内容
本发明要解决的技术问题是在保证预测精度的前提下,尽量降低模型占用内存规模,使得模型在各项技术问题上达到一个平衡(trade-off)。本发明提供一种基于离散小波变换的轻量级时间序列预测方法,经过测试后,在极大程度上保留了离散特征提取方法的高精度、低计算复杂度以及长序列预测能力,并且进一步减小模型规模,提高了资源利用率。
本发明采用的技术方案是:采用波形分解模块,对输入序列进行分解得到低频分量和高频分量,使得两个分量的长度均为输入序列的一半,然后采用离散特征提取方法(Sepformer)来对两个分量分别预测,离散特征提取方法基于分层平行提取特征的离散网络(Separate Network)。离散网络(Separate Network)针对注意力(Self-attention)机制的高计算复杂度的缺点,采用了离散注意力(SeparateAttention)机制进行分块计算attention数值,从而降低了模型的计算复杂度。最后采用波形重构模块生成最终预测序列。该方法可以提高资源利用率,更小的模型规模使得其在资源受限制的设备上更具竞争力。
一种基于离散小波变换的轻量级时间序列预测方法,步骤如下:
步骤1:数据预处理,获得训练数据集和验证数据集。
步骤2:借助于步骤1得到的训练数据集,在设备条件允许的情况下,每次随机选取32组训练数据,将每组数据中的历史序列和起始序列分别输入到两个波形分解(WaveformDecomposition)模块中,将输入的序列分解为低频分量(approximate coefficient)和高频分量(detail coefficient)。
步骤3:将步骤2得到的低频分量和高频分量,将其分别输入到两个离散特征提取模块(Sepformer)中进行特征提取。每个离散特征提取模块中包含两个编码器(Encoder)和一个解码器(Decoder),将输入的对应分量输入到编码器中的离散网络(SeparateNetwork)进而提取全局特征和局部特征,最终得到对应于两个分量的两组全局局部特征。
步骤4:将步骤3得到的两组特征,分别在编码器后的隐藏层中进行维度对齐,再将维度对齐后的特征进行拼接,最终得到对应高低频分量的两组的全局特征和局部特征。
步骤5:将步骤4得到的两组特征,分别输入各自离散特征提取模块里对应的解码器(Decoder)中,通过解码器中的离散网络(Separate Network)对全局特征与各层局部特征进行重构,生成对应于高频分量和低频分量的生成预测序列。
步骤6:对于步骤5得到的两组对应高低频分量的预测序列,通过波形重构(Waveform Reconstruction)模块进行小波分解的逆过程,对高低频分量进行重组,得到最终的生成预测序列。
步骤7:根据步骤6得到的生成预测序列,通过均方误差(MSE)和平均绝对误差(MAE)公式,计算生成的预测序列与真实序列之间的误差,再通过Adam优化器进行反向传播,更新网络参数。
步骤8:借助于步骤7更新网络参数后的模型与步骤1得到的验证数据集,选取32组验证数据作为输入,执行步骤2至步骤7,其中将步骤2中的验证数据替换成选取的32组测试数据。最终得到基于测试数据的生成预测序列。
步骤9:计算步骤8得到的基于验证数据的生成预测序列与预测序列之间的均方误差(MSE),求得所有组数据的均方误差(MSE)后求均值,最终得到基于验证数据集生成的预测序列。
步骤10:重复步骤2至步骤9,若借助于步骤9得到的均方误差(MSE)不再减小,说明模型表现无法再变好,则网络参数更新完毕,模型结束训练。
步骤11:将预测任务所给的输入序列输入到步骤10最终得到的训练好的模型中,进行序列预测,输出最终得到的预测序列,完成预测。
进一步的,步骤1具体方法如下:
选取合适的公共时间序列数据集,进行分组与分割以适应模型对数据格式的要求。首先根据需求设定每组数据中的历史序列长度、预测序列长度和起始序列长度,这三个长度分别对应每组数据中的三个部分:历史序列、预测序列和起始序列。采用滑窗机制进行分组,窗口长度为历史序列长度与预测序列长度之和,每次窗口移动一位,即相邻两组数据之间只有一位上的不同。在完成数据分组之后,截取70%组数据作为训练数据集,30%组数据作为验证数据集。
进一步的,在长度上,起始序列长度小于等于历史序列长度,在数值上,起始序列与历史序列的后部分相同。历史序列与预测序列在位置上是前后相接的,每组数据的长度为历史序列长度与预测序列长度之和。
进一步的,所述的波形分解模块基于离散小波变换(Discrete WaveletTransform,DWT)原理,公式如下:
Figure BDA0003412729050000051
Figure BDA0003412729050000052
Figure BDA0003412729050000053
subject.to.x=0,1,2..,M-1
j=0,1,2,...,J-1
k=0,1,2,...,2j-1
u(x)是尺度函数(Scaling Function),v(x)是小波函数(Wavelet Function);Wu(0,k)和Wv(j,k)分别为近似系数(approximate coefficient)和细节系数(detailcoefficient),二者表示低频分量和高频分量;M为序列长度;j和k用于控制尺度函数的缩放尺度。
进一步的,所述的离散网络采用波形提取模块(Waveform Extraction,WE)和离散注意力机制模块(Separate Attention,SA)层层提取全局特征(global feature)和局部特征(local feature)。波形提取模块会对输入序列进行分解,通过滑窗机制遍历整个输入序列求得窗口内均值,得到输入序列的全局趋势,使用输入序列减去得到的全局趋势,得到输入序列的局部波动。
进一步的,波形提取模块整体公式如下所示:
Figure BDA0003412729050000054
Figure BDA0003412729050000055
Figure BDA0003412729050000056
Figure BDA0003412729050000057
其中
Figure BDA0003412729050000058
Figure BDA0003412729050000059
分别表示波形的全局趋势和局部波动,用于作为输入,通过离散注意力机制模块提取全局特征和局部特征;
Figure BDA0003412729050000061
为第l层WE的输入序列;
Figure BDA0003412729050000062
为连接符号,用于连接不同的分块;AvgPool函数为均值池化函数,其设定一个滑动窗口,每次滑动一个单元,然后对窗口内的所有元素求均值,将所得数值赋值给当前单元。将进行分块,然后输入AvgPool中,
Figure BDA0003412729050000063
表示第i个分块。
进一步的,离散注意力机制模块先将输入序列分割成长度相同的块(Block,B),然后通过共享的注意力机制模块(Attention,AT)提取特征,接着通过前馈网络(Feed-Forward Network,FFN)进行维度变换,按比例缩短每个块的长度,最终拼接后输出。离散注意力机制(Attention,AT)的计算公式如下所示:
Figure BDA0003412729050000064
Figure BDA0003412729050000065
其中,
Figure BDA0003412729050000066
为第l层离散注意力机制模块(SA)的输入序列;B表示输入序列得到的分块(Block);
Figure BDA0003412729050000067
分别表示Q、K、V在第l层第i个分块上的可学习权重矩阵;
Figure BDA0003412729050000068
Figure BDA0003412729050000069
分别表示第l层Q、K、V和B的第i个分块。Q、K和V分别表示分块经过线性变换后得到的问题矩阵(query)、键值矩阵(key)和数值矩阵(value)。其中注意力机制定义为:
Figure BDA00034127290500000610
其中dmodel表示特征维度。
进一步的,离散网络整体函数表达式如下所示:
Figure BDA0003412729050000071
其中Zl表示离散网络第l层的全局特征,Hl表示离散网络第l层的局部特征;XSN表示SN的输入。
本发明的有益效果:
本发明使用基于离散小波变化的波形分解模块(Waveform Decomposition)和波形重构模块(Waveform Reconstruction)对时间序列进行分解与重构,波形分解模块将输入序列分解成低频分量和高频分量,使得两个分量的长度均为输入序列的一半,然后通过离散特征提取模块(Sepformer)进行特征提取,通过波形重构模块对得到预测的分量进行重构,生成最终预测序列。本发明大大降低了模型的规模,提高了资源利用率。
在多元时间序列预测时,预测精度、预测序列长度、对局部细微波动的拟合能力等问题都是影响预测效果的重要因素。本发明采用基于离散小波变换的波形分解和波形重构模块对输入序列进行分解,从而降低模型的规模,提高了资源利用率。采用分层平行提取多元时间序列的全局特征和局部特征机制,提升了预测精度,利用局部特征提高对多元时间序列的局部细微波动的拟合能力,并且增加了模型的预测长度,大大提升了模型在多元时间序列预测上的效果。
附图说明
图1是本发明实施例的整体结构示意图。
图2是本发明实施例的详细结构示意图。
图3是本发明实施例的离散特征提取模块(Sepformer)的结构图
图4是本发明实施例的离散网络(Separate Network)的结构图。
图5是本发明实施例的离散注意力机制(Separate Attention)的结构图。
图6是离散波形分解方法(SWformer)和微型离散波形分解方法(Mini-SWformer)的模型图,其中微型离散波形分解方法丢弃了高频分量从而进一步降低了模型规模。
图7是在五种公开数据集下,离散波形分解方法和微型离散波形分解方法与六个已有的方法在均方误差(MSE)上的比较。
图8是相同条件下,本发明中的SWformer以及含有更小的模型规模的Mini-SWformer和Informer的GPU使用量的比较。
具体实施方式
下面结合附图和具体实施步骤对本发明做了进一步的说明:
一种基于离散小波变换的轻量级时间序列预测方法,包括以下步骤:
步骤1:数据预处理。选取合适的公共时间序列数据集,进行分组与分割以适应模型对数据格式的要求。首先根据需求设定每组数据中的历史序列长度、预测序列长度和起始序列长度,这三个长度分别对应每组数据中的三个部分:历史序列、预测序列和起始序列。在长度上,起始序列长度小于等于历史序列长度,在数值上,起始序列与历史序列后部分相同。历史序列与预测序列在位置上是前后相接的,每组数据的长度为历史序列长度与预测序列长度之和。采用滑窗机制进行分组,窗口长度为历史序列长度与预测序列长度之和,每次窗口移动一位,即相邻两组数据之间只有一位上的不同。在完成数据分组之后,截取70%组数据作为训练数据集,30%组数据作为验证数据集。
如图1所示,展示了本发明的整体结构。数据处理与分割部分在本发明结构的入口处,负责对原始数据做初步处理,形成预测模型所需的数据结构。图2是本发明实施例的详细结构示意图。
步骤2:借助于步骤1得到的训练数据集,在设备条件允许的情况下,每次随机选取32组训练数据,将每组数据中的历史序列和起始序列分别输入到两个波形分解(WaveformDecomposition)模块中,将输入的序列分解为低频分量(approximate coefficient)和高频分量(detail coefficient)。波形分解模块基于离散小波变换(Discrete WaveletTransform,DWT)原理,公式如下:
Figure BDA0003412729050000091
Figure BDA0003412729050000092
Figure BDA0003412729050000093
subject.to.x=0,1,2...,M-1
j=0,1,2,...,J-1
k=0,1,2,...,2j-1
u(x)是尺度函数(Scaling Function),v(x)是小波函数(Wavelet Function);Wu(0,k)和Wv(j,k)分别为近似系数(approximate coefficient)和细节系数(detailcoefficient),二者表示低频分量和高频分量;M为序列长度;j和k用于控制尺度函数的缩放尺度。
步骤3:将步骤2得到的低频分量和高频分量,将其分别输入到两个离散特征提取模块(Sepformer)中进行特征提取。每个离散特征提取模块中包含两个编码器(Encoder)和一个解码器(Decoder),将输入的对应分量输入到编码器中的离散网络(SeparateNetwork)进而提取全局特征和局部特征,最终得到对应于两个分量的两组全局局部特征。
如图3所示,展示了本发明离散特征提取模块(Sepformer)的整体结构,离散特征提取模块(Sepformer)包含两个编码器(Encoder)和一个解码器(Decoder)。编码器和解码器的核心模块都是离散网络(Separate Network,SN)。
如图4所示,展示了离散网络(Separate Network)的整体结构,离散网络采用波形提取模块(Waveform Extraction,WE)和离散注意力机制模块(Separate Attention,SA)层层提取全局特征(global feature)和局部特征(local feature)。波形提取模块会对输入序列进行分解,通过滑窗机制遍历整个输入序列求得窗口内均值,得到输入序列的全局趋势,使用输入序列减去得到的全局趋势,得到输入序列的局部波动。波形提取模块整体公式如下所示:
Figure BDA0003412729050000101
Figure BDA0003412729050000102
Figure BDA0003412729050000103
Figure BDA0003412729050000104
其中
Figure BDA0003412729050000105
Figure BDA0003412729050000106
分别表示波形的全局趋势和局部波动,用于作为输入,通过离散注意力机制模块提取全局特征和局部特征;
Figure BDA0003412729050000107
为第l层WE的输入序列;
Figure BDA0003412729050000108
为连接符号,用于连接不同的分块;AvgPool函数为均值池化函数,其设定一个滑动窗口,每次滑动一个单元,然后对窗口内的所有元素求均值,将所得数值赋值给当前单元。将进行分块,然后输入AvgPool中,
Figure BDA0003412729050000109
表示第i个分块。
如图5所示,展示了离散注意力机制模块(Separate Attention,SA),该模块用于进行特征提取。离散注意力机制模块先将输入序列分割成长度相同的块(Block,B),然后通过共享的注意力机制模块(Attention,AT)提取特征,接着通过前馈网络(Feed-ForwardNetwork,FFN)进行维度变换,按比例缩短每个块的长度,最终拼接后输出。离散注意力机制(Attention,AT)的计算公式如下所示:
Figure BDA0003412729050000111
Figure BDA0003412729050000112
其中,
Figure BDA0003412729050000113
为第l层离散注意力机制模块(SA)的输入序列;B表示输入序列得到的分块(Block);
Figure BDA0003412729050000114
分别表示Q、K、V在第l层第i个分块上的可学习权重矩阵;
Figure BDA0003412729050000115
Vi l
Figure BDA0003412729050000116
分别表示第l层Q、K、V和B的第i个分块。Q、K和V分别表示分块经过线性变换后得到的问题矩阵(query)、键值矩阵(key)和数值矩阵(value)。其中注意力机制定义为:
Figure BDA0003412729050000117
其中dmodel表示特征维度。
离散网络整体函数表达式如下所示:
Figure BDA0003412729050000118
其中Zl表示离散网络第l层的全局特征,Hl表示离散网络第l层的局部特征;XSN表示SN的输入。
步骤4:借助于步骤3得到的两组特征,分别在编码器后的隐藏层中进行维度对齐,再将维度对齐后的特征进行拼接,最终得到对应高低频分量的两组的全局特征和局部特征。
如图3所示,真实编码器(True Encoder)和预测编码器(Pred Encoder)输出的全局特征和局部特征分别进行拼接,其中真实编码器(True Encoder)输出的两种特征会经过前馈网络(Feed-Forward Network,FFN)进行纬度变换至与预测编码器(Pred Encoder)具有相同的维度,然后对两种特征各自进行拼接,得到整体的全局特征和局部特征。
步骤5:将步骤4得到的两组特征,分别输入各自离散特征提取模块里对应的解码器(Decoder)中,通过解码器中的离散网络(Separate Network)对全局特征与各层局部特征进行重构,生成对应于高频分量和低频分量的生成预测序列。
步骤6:对于步骤5得到的两组对应高低频分量的预测序列,通过波形重构(Waveform Reconstruction)模块进行小波分解的逆过程,对高低频分量进行重组,得到最终的生成预测序列。
步骤7:根据步骤6得到的生成预测序列,通过均方误差(MSE)和平均绝对误差(MAE)公式,计算生成的预测序列与真实序列之间的误差,再通过Adam优化器进行反向传播,更新网络参数。均方误差(MSE)和平均绝对误差(MAE)公式如下所示:
Figure BDA0003412729050000121
Figure BDA0003412729050000122
其中,y为预测值;
Figure BDA0003412729050000123
为真实值;n表示序列的长度。
步骤8:借助于步骤7更新网络参数后的模型与步骤1得到的验证数据集,选取32组验证数据作为输入,执行步骤2至步骤7,其中将步骤2中的验证数据替换成选取的32组测试数据。最终得到基于测试数据的生成预测序列。
步骤9:计算步骤8得到的基于验证数据的生成预测序列与预测序列之间的均方误差(MSE),求得所有组数据的均方误差(MSE)后求均值,最终得到基于验证数据集生成的预测序列。
步骤10:重复步骤2至步骤9,若借助于步骤9得到的均方误差(MSE)不再减小,说明模型表现无法再变好,则网络参数更新完毕,模型结束训练。
步骤11:将预测任务所给的输入序列输入到步骤10最终得到的训练好的模型中,进行序列预测,输出最终得到的预测序列,完成预测。
图6显示了本发明中两个方法:离散波形分解方法(SWformer)和微型离散波形分解方法(Mini-SWformer)。高频分量在时间序列数据中包含的信息量小,适当的减少高频分量可以一定程度上减少模型的计算量,从而降低模型的规模。基于这一理论基础,微型离散波形分解方法将离散波形分解方法中分解出来的高频分量及整个分支删减掉,进一步减小了模型的规模。
图7显示了在相同的实验条件下,本发明中的两个方法和Informer、LogTrans、Reformer、LSTMa和LSTnet等七种方法在ETTh1、ETTh2、ETTm1、Weather和ECL等五种数据集上的实验结果,衡量标准为均方误差(MSE)和平方绝对值(MAE)。在每种实验条件下,表现最好的模型的实验结果在表格中加粗表示。从图6表格中可以看到离散波形分解方法(SWformer)和微型离散波形分解方法(Mini-SWformer)对比其余五种方法均有着较大的提升。对比Informer方法,离散特征提取方法的MSE平均下降了22.53%,离散波形分解方法的MSE平均下降了19.29%,微型离散波形分解方法的MSE平均下降了16.54%。
图8显示了在相同的实验条件下,随着预测序列长度的增加,离散波形分解方法(SWformer)、微型离散波形分解方法(Mini-SWformer)与Informer在内存使用量上的比较和变化。可以看到随着预测序列长度越来越长,离散波形分解方法与微型离散波形分解方法在内存使用量上的优势会越来越大。对比Informer,离散波形分解方法在内存使用量上平均降低了52.62%,微型离散波形分解方法平均降低了68.02%。

Claims (8)

1.一种基于离散小波变换的轻量级时间序列预测方法,其特征在于,步骤如下:
步骤1:数据预处理,获得训练数据集和验证数据集;
步骤2:借助于步骤1得到的训练数据集,在设备条件允许的情况下,每次随机选取32组训练数据,将每组数据中的历史序列和起始序列分别输入到两个波形分解模块中,将输入的序列分解为低频分量和高频分量;
步骤3:将步骤2得到的低频分量和高频分量,将其分别输入到两个离散特征提取模块中进行特征提取;每个离散特征提取模块中包含两个编码器和一个解码器,将输入的对应分量输入到编码器中的离散网络进而提取全局特征和局部特征,最终得到对应于两个分量的两组全局局部特征;
步骤4:将步骤3得到的两组特征,分别在编码器后的隐藏层中进行维度对齐,再将维度对齐后的特征进行拼接,最终得到对应高低频分量的两组的全局特征和局部特征;
步骤5:将步骤4得到的两组特征,分别输入各自离散特征提取模块里对应的解码器中,通过解码器中的离散网络对全局特征与各层局部特征进行重构,生成对应于高频分量和低频分量的生成预测序列;
步骤6:对于步骤5得到的两组对应高低频分量的预测序列,通过波形重构模块进行小波分解的逆过程,对高低频分量进行重组,得到最终的生成预测序列;
步骤7:根据步骤6得到的生成预测序列,通过均方误差MSE和平均绝对误差MAE公式,计算生成的预测序列与真实序列之间的误差,再通过Adam优化器进行反向传播,更新网络参数;
步骤8:借助于步骤7更新网络参数后的模型与步骤1得到的验证数据集,选取32组验证数据作为输入,执行步骤2至步骤7,其中将步骤2中的验证数据替换成选取的32组测试数据;最终得到基于测试数据的生成预测序列;
步骤9:计算步骤8得到的基于验证数据的生成预测序列与预测序列之间的均方误差MSE,求得所有组数据的均方误差MSE后求均值,最终得到基于验证数据集生成的预测序列;
步骤10:重复步骤2至步骤9,若借助于步骤9得到的均方误差MSE不再减小,说明模型表现无法再变好,则网络参数更新完毕,模型结束训练;
步骤11:将预测任务所给的输入序列输入到步骤10最终得到的训练好的模型中,进行序列预测,输出最终得到的预测序列,完成预测。
2.根据权利要求1所述的一种基于离散小波变换的轻量级时间序列预测方法,其特征在于,步骤1具体方法如下:
选取合适的公共时间序列数据集,进行分组与分割以适应模型对数据格式的要求;首先根据需求设定每组数据中的历史序列长度、预测序列长度和起始序列长度,这三个长度分别对应每组数据中的三个部分:历史序列、预测序列和起始序列;采用滑窗机制进行分组,窗口长度为历史序列长度与预测序列长度之和,每次窗口移动一位,即相邻两组数据之间只有一位上的不同;在完成数据分组之后,截取70%组数据作为训练数据集,30%组数据作为验证数据集。
3.根据权利要求2所述的一种基于离散小波变换的轻量级时间序列预测方法,其特征在于,在长度上,起始序列长度小于等于历史序列长度,在数值上,起始序列与历史序列的后部分相同;历史序列与预测序列在位置上是前后相接的,每组数据的长度为历史序列长度与预测序列长度之和。
4.根据权利要求1所述的一种基于离散小波变换的轻量级时间序列预测方法,其特征在于,所述的波形分解模块基于离散小波变换原理,公式如下:
Figure FDA0003412729040000031
Figure FDA0003412729040000032
Figure FDA0003412729040000033
subject.to.x=0,1,2...,M-1
j=0,1,2,...,J-1
k=0,1,2,...,2j-1
u(x)是尺度函数,υ(x)是小波函数;Wu(0,k)和Wv(j,k)分别为近似系数和细节系数,二者表示低频分量和高频分量;M为序列长度;j和k用于控制尺度函数的缩放尺度。
5.根据权利要求1所述的一种基于离散小波变换的轻量级时间序列预测方法,其特征在于,所述的离散网络采用波形提取模块和离散注意力机制模块层层提取全局特征和局部特征;波形提取模块会对输入序列进行分解,通过滑窗机制遍历整个输入序列求得窗口内均值,得到输入序列的全局趋势,使用输入序列减去得到的全局趋势,得到输入序列的局部波动。
6.根据权利要求5所述的一种基于离散小波变换的轻量级时间序列预测方法,其特征在于,波形提取模块整体公式如下所示:
Figure FDA0003412729040000034
Figure FDA0003412729040000035
Figure FDA0003412729040000036
Figure FDA0003412729040000037
其中
Figure FDA0003412729040000038
Figure FDA0003412729040000039
分别表示波形的全局趋势和局部波动,用于作为输入,通过离散注意力机制模块提取全局特征和局部特征;
Figure FDA0003412729040000041
为第l层WE的输入序列;
Figure FDA0003412729040000042
为连接符号,用于连接不同的分块;AvgPool函数为均值池化函数,其设定一个滑动窗口,每次滑动一个单元,然后对窗口内的所有元素求均值,将所得数值赋值给当前单元;将进行分块,然后输入AvgPool中,
Figure FDA0003412729040000043
表示第i个分块。
7.根据权利要求6所述的一种基于离散小波变换的轻量级时间序列预测方法,其特征在于,离散注意力机制模块先将输入序列分割成长度相同的块(Block,B),然后通过共享的注意力机制模块(Attention,AT)提取特征,接着通过前馈网络(Feed-Forward Network,FFN)进行维度变换,按比例缩短每个块的长度,最终拼接后输出;离散注意力机制(Attention,AT)的计算公式如下所示:
Figure FDA0003412729040000044
Figure FDA0003412729040000045
其中,
Figure FDA0003412729040000046
为第l层离散注意力机制模块(SA)的输入序列;B表示输入序列得到的分块(Block);
Figure FDA0003412729040000047
分别表示Q、K、V在第l层第i个分块上的可学习权重矩阵;
Figure FDA0003412729040000048
Figure FDA0003412729040000049
分别表示第l层Q、K、V和B的第i个分块;Q、K和V分别表示分块经过线性变换后得到的问题矩阵(query)、键值矩阵(key)和数值矩阵(value);其中注意力机制定义为:
Figure FDA00034127290400000410
其中dmodel表示特征维度。
8.根据权利要求7所述的一种基于离散小波变换的轻量级时间序列预测方法,其特征在于,离散网络整体函数表达式如下所示:
Figure FDA0003412729040000051
其中Zl表示离散网络第l层的全局特征,Hl表示离散网络第l层的局部特征;XSN表示SN的输入。
CN202111536500.3A 2021-12-15 2021-12-15 一种基于离散小波变换的轻量级时间序列预测方法 Pending CN114219027A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111536500.3A CN114219027A (zh) 2021-12-15 2021-12-15 一种基于离散小波变换的轻量级时间序列预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111536500.3A CN114219027A (zh) 2021-12-15 2021-12-15 一种基于离散小波变换的轻量级时间序列预测方法

Publications (1)

Publication Number Publication Date
CN114219027A true CN114219027A (zh) 2022-03-22

Family

ID=80702457

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111536500.3A Pending CN114219027A (zh) 2021-12-15 2021-12-15 一种基于离散小波变换的轻量级时间序列预测方法

Country Status (1)

Country Link
CN (1) CN114219027A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115114345A (zh) * 2022-04-02 2022-09-27 腾讯科技(深圳)有限公司 特征表示的提取方法、装置、设备、存储介质及程序产品
CN115293244A (zh) * 2022-07-15 2022-11-04 北京航空航天大学 一种基于信号处理及数据约简的智能电网虚假数据注入攻击检测方法
CN118364286A (zh) * 2024-04-24 2024-07-19 山东省人工智能研究院 一种基于小波分解和多头外部注意力机制的轻量级云服务器负载预测方法
CN120144960A (zh) * 2025-02-28 2025-06-13 西安电子科技大学 一种基于MPDLinear模型的时序预测方法、设备和介质
CN120763597A (zh) * 2025-09-11 2025-10-10 国网江西省电力有限公司供电服务管理中心 基于分层小波注意力的非平稳时间序列预测方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR19980074795A (ko) * 1997-03-27 1998-11-05 윤종용 전역 기반 색도 상관성을 이용한 영상 부호화 방법
CN110826803A (zh) * 2019-11-06 2020-02-21 广东电力交易中心有限责任公司 一种电力现货市场的电价预测方法及装置
CN112862875A (zh) * 2021-01-18 2021-05-28 中国科学院自动化研究所 基于选择性机制注意力机制的雨图去雨方法、系统及设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR19980074795A (ko) * 1997-03-27 1998-11-05 윤종용 전역 기반 색도 상관성을 이용한 영상 부호화 방법
CN110826803A (zh) * 2019-11-06 2020-02-21 广东电力交易中心有限责任公司 一种电力现货市场的电价预测方法及装置
CN112862875A (zh) * 2021-01-18 2021-05-28 中国科学院自动化研究所 基于选择性机制注意力机制的雨图去雨方法、系统及设备

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115114345A (zh) * 2022-04-02 2022-09-27 腾讯科技(深圳)有限公司 特征表示的提取方法、装置、设备、存储介质及程序产品
CN115114345B (zh) * 2022-04-02 2024-04-09 腾讯科技(深圳)有限公司 特征表示的提取方法、装置、设备、存储介质及程序产品
CN115293244A (zh) * 2022-07-15 2022-11-04 北京航空航天大学 一种基于信号处理及数据约简的智能电网虚假数据注入攻击检测方法
CN115293244B (zh) * 2022-07-15 2023-08-15 北京航空航天大学 一种基于信号处理及数据约简的智能电网虚假数据注入攻击检测方法
CN118364286A (zh) * 2024-04-24 2024-07-19 山东省人工智能研究院 一种基于小波分解和多头外部注意力机制的轻量级云服务器负载预测方法
CN120144960A (zh) * 2025-02-28 2025-06-13 西安电子科技大学 一种基于MPDLinear模型的时序预测方法、设备和介质
CN120144960B (zh) * 2025-02-28 2025-11-28 西安电子科技大学 一种基于MPDLinear模型的时序预测方法、设备和介质
CN120763597A (zh) * 2025-09-11 2025-10-10 国网江西省电力有限公司供电服务管理中心 基于分层小波注意力的非平稳时间序列预测方法及系统

Similar Documents

Publication Publication Date Title
CN114219027A (zh) 一种基于离散小波变换的轻量级时间序列预测方法
CN114239718B (zh) 基于多元时序数据分析的高精度长期时间序列预测方法
CN111913849B (zh) 一种用于运维数据的无监督异常检测和鲁棒趋势预测方法
CN113347422B (zh) 一种粗粒度上下文熵编码方法
CN116596144B (zh) 融入频率注意力的混合深度学习电力负荷预测方法及系统
CN117852686A (zh) 基于多元自编码器的电力负荷预测方法
CN117690289B (zh) 一种基于掩码图注意力机制的交通路网编码表征学习方法
CN117236201B (zh) 一种基于Diffusion和ViT的降尺度方法
Huai et al. Zerobn: Learning compact neural networks for latency-critical edge systems
CN113761777A (zh) 一种基于hp-ovmd的超短期光伏功率预测方法
CN118657255A (zh) 一种基于小波多分辨率分解的深度学习工单量预测方法
CN119310655A (zh) 一种基于生成式ai的沙尘暴天气预测方法、系统、设备及介质
CN113949880B (zh) 一种极低码率人机协同图像编码训练方法及编解码方法
CN115600656A (zh) 一种基于分段策略与多成分分解算法的多元时间序列预测方法
Daems et al. Variational inference for SDEs driven by fractional noise
CN120148236A (zh) 一种预训练增强的时空Transformer网络交通流预测方法
CN119135910A (zh) 一种基于深度学习的图像编码方法、设备
CN117895486A (zh) 极端天气前、中及后期多源协同发电能力评估方法及系统
CN115631624B (zh) 改进互补集成经验模分解的时空卷积短时交通流预测方法
CN105956252A (zh) 基于生成型深信度网络的超短期风速多尺度预报建模方法
Le et al. Hierarchical autoencoder-based lossy compression for large-scale high-resolution scientific data
CN114841412A (zh) 一种海参生长水质中酸碱度的预测方法
CN120653919A (zh) 基于多尺度物理Transformer降水预测方法
CN120197747A (zh) 基于改进Autoformer模型的时序预测方法
CN118644976A (zh) 一种基于时空双向注意力机制的交通流预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination