时间序列预测02:经典方法综述自回归ARIMASRIMA指数平滑法等

时间序列预测02:经典⽅法综述⾃回归ARIMASRIMA指数平滑法等
机器学习和深度学习⽅法可以在具有挑战性的时间序列预测问题上取得不俗的表现。然⽽,在许多预测问题中,经典的⽅法,如SARIMA和指数平滑法(exponential smoothing ),容易优于更复杂的⽅法。因此,在探索更先进的⽅法之前,既要了解经典时间序列预测⽅法的⼯作原理,⼜要对其进⾏评估。本⽂介绍了时间序列预测的原始和经典⽅法。
【时间序列预测/分类】全系列45篇由浅⼊深的博⽂汇总:
1. 简单预测⽅法我的青春我的爱
在任何时间序列预测问题上,建⽴ 基准(baseline) 都是必不可少的。性能基准可以了解所有其他模型在相同问题上的实际执⾏情况。1.1 预测性能基准(Forecast Performance Baseline)
预测性能的基准提供了⼀个⽐较点。这是对同⼀个问题的所有其他建模技术的⼀个参考点。如果⼀个模型达到或低于基准的性能,那么应该调整或放弃该技术。⽤于⽣成预测以计算基准性能的技术必须易于实现,并且对特定于问题的细节必须很简单。⽬标是尽快获得时间序列预测问题的基准性能,以便能够更好地理解数据集并开发更⾼级的模型。做⼀个简单预测的好⽅法有三个特点:
简单:⼀种不需要训练或智能的⽅法。
快速:⼀种实现速度快、预测计算量⼩的⽅法。
可重复:⼀种确定的⽅法,意味着它在给定相同输⼊的情况下产⽣预期的输出。
1.2 预测策略(Forecasting Strategy)
简单的预测策略是那些对预测问题的性质⼏乎不作假设或完全不作假设,并且能够快速实现和计算的策略。如果⼀个模型能⽐⼀个简单的预测策略表现得更好,那么可以说它很有技巧。简单的预测策略有两⼤主题:
朴素的,或者直接使⽤观测值。
平均,或者使⽤以前的观测统计计算。
1.3 朴素预测策略(Naive Forecasting Strategy)
朴素预测涉及直接使⽤之前的观测结果作为预测,⽽不做任何更改。它通常被称为持久性预测,因为先前的观察是持久性的。对于季节性数据,这种简单的⽅法可以稍作调整。在这种情况下,可以将上⼀个周期中同时进⾏的观察结果保留下来。这可以进⼀步推⼴到测试历史数据中的每个可能的偏移量,这些历史数据可⽤于保存预测值。例如,给定序列:
[1,2,3,4,5,6,7,8,9]
我们可以将最后⼀个观察值(相对指数-1)保持为9,或者将第⼆个最后⼀个先前观察值(相对指数-2)保持为8,依此类推。
1.4 平均预测策略(Average Forecast Strategy)
在朴素预测之上的⼀步是对先验值求平均值的策略。所有先前的观测数据都被收集并取平均值,使⽤平均值或中位数,没有对数据进⾏其他处理。在某些情况下,我们可能希望将平均计算中使⽤的之前的时间步的值缩短到最后⼏个观察值。我们可以将此推⼴到测试平均计算中包含的每个可能的n个先验观测集的情况。例如,给定系列:
[1,2,3,4,5,6,7,8,9]
我们可以平均最后⼀个观测值(9),最后两个观测值(8、9),依此类推。对于季节性数据,我们可能希望对周期中与预测时间相同的最后n次在先观测值求平均。例如,假设该系列具有3个步骤的周期:
[1,2,3,1,2,3,1,2,3]
我们可以使⽤3的窗⼝⼤⼩,取最后⼀个观测值(-3或1),最后两个观测值(-3或1和-(3×2)或1)的平均值,依此类推。
2. ⾃回归⽅法(Autoregressive Methods )
⾃回归综合移动平均(ARIMA) 是应⽤最⼴泛的单变量时间序列预测⽅法之⼀。尽管该⽅法可以处理具有趋势的数据,但它不⽀持具有季节性成分的时间序列。对ARIMA的⼀个扩展称为季节⾃回归综合移动平均(SARIMA),它⽀持对序列的季节性成分进⾏直接建模。
2.1 ARIMA
**⾃回归综合移动平均模型(Autoregressive Integrated Moving Average Model)**是分析和预测时间序列数据的⼀类统计模型。它显式地满⾜了时间序列数据中的⼀组标准结构,因此提供了⼀种简单⽽强⼤的⽅法来进⾏熟练的时间序列预测。ARIMA是⾃回归综合移动平均的缩写。它是简单⾃回归滑动平均(ARMA)的推⼴,增加了差分的概念。这个缩略词的含义为:AR:⾃回归。⼀种模型,它使⽤观测值和⼀些滞后观测值之间的依赖关系。I: 差分。利⽤原始观测值的差分(例如从上⼀时间步的观测值中减去⼀个观测值)使时间序列平稳。
MA:移动平均。⼀种模型,它利⽤观测值与应⽤于滞后观测值的移动平均模型的残差之间的相关性。
吉广在线
这些组件中的每⼀个都在模型中作为参数显式指定。ARIMA(p,d,q)使⽤标准表⽰法,其中参数⽤整数值替换,以快速指⽰所使⽤的特定ARIMA模型。ARIMA的⼀个问题是它不⽀持季节性数据。这是⼀个具有重复周期的时间序列。ARIMA期望的数据不是季节性的,即季节性成分被去除,可以通过季节差异等⽅法进⾏季节性调整。海南师范大学学报
建⽴了⼀个包含特定项数和项数类型的线性回归模型,并通过⼀定程度的差分来准备数据,以使其平稳,即消除对回归模型有负⾯影响的趋势和季节结构。值0可⽤于参数,该参数指⽰不使⽤模型的该元素。这样,ARIMA模型可以配置为执⾏ARMA模型的功能,甚⾄可以配置为简单的AR、I或MA模型。对时间序列采⽤ARIMA模型假定产⽣观测的基本过程是ARIMA过程。这似乎很明显,但有助于激发在原始观测和模型预测的残差中确认模型假设的需要。
2.2 什么是季节性ARIMA
季节⾃回归综合移动平均(SARIMA)是ARIMA的扩展,它明确⽀持具有季节性成分的单变量时间序列数据。它添加了三个新的超参数来指定序列季节性分量的⾃回归(AR)、差分(I)和移动平均(MA),以及季节性时段的附加参数。
2.3 如何配置SARIMA
配置SARIMA需要为序列的趋势和季节要素选择超参数。有三种趋势要素需要配置。它们与ARIMA模型相同;具体来说:p: ⾃回归项数;d: 使之成为平稳序列所做的差分次数(阶数);
q: 滑动平均项数;季节性要素有四个季节性要素,但不是必须配置的ARIMA的⼀部分;P,D,Q遵循相同的定义,但适⽤于时间序列的季节分量。m(有的资料⽤s表⽰):时间序列的周期(季度为4 ,年度为12 ,等等)
SARIMA模型的数学表达式为:
其中指定了模型的特定超参数。重要的是,m参数影响P、D和Q参数。例如,⽉数据的m为12表⽰每年的季节性周期。 将利⽤模型中的第⼀个季节性偏移观测值,例如  或 。,将使⽤最后两个季节性偏移观测值 。类似地,D为1将计算⼀阶季节性差异, 将使⽤模型中的⼀阶误差(例如移动平均)。
可以通过仔细分析ACF(⾃相关函数(决定q值))和PACF图(偏⾃相关函数(决定p值))来选择趋势元素,查看最近时间步(例如1、2、3)的相关性。类似地,可以分析ACF和PACF图,通过查看季节滞后时间步骤的相关性来指定季节模型的值。
SARIMA (p ,d ,q )(P ,D ,Q )m
AP =1t −(m ×1)t −12AP =2t −(m ×1),t −(m ×2)Q =1
3. 指数平滑法(Exponential Smoothing Methods )
指数平滑是⼀种单变量数据的时间序列预测⽅法,它可以扩展到⽀持具有系统趋势或季节性成分的数据。它可以作为流⾏的Box-Jenkins-ARIMA⽅法家族的替代⽅法。
3.1 什么是指数平滑?
指数平滑是⼀种单变量数据的时间序列预测⽅法。时间序列⽅法,如Box-Jenkins-ARIMA⽅法家族,发展了⼀个模型,其中预测是最近观测或滞后的加权线性和。指数平滑预测⽅法类似于预测是过去观测值的加权和,但是模型显式地对过去观测值使⽤指数递减的权重。具体来说,过去的观测值是以⼏何递减的⽐率加权的。
使⽤指数平滑⽅法⽣成的预测是过去观测值的加权平均值,随着观测值的增长,权重呈指数衰减。换句话说,观察越近,相关的权重就越⾼。
指数平滑⽅法可以被视为同级⽅法,也可以替代流⾏的Box-Jenkins-ARIMA时间序列预测⽅法。总的来说,这些⽅法有时被称为ETS模型,指的是误差、趋势和季节性的显式建模。指数平滑时间序列预测⽅法主要有三种。⼀种假定没有系统结构的简单⽅法,⼀种显式处理趋势的扩展,以及添加季节性⽀持的最⾼级⽅法。
3.2 单指数平滑
三氧化钼
单指数平滑,简称SES,⼜称简单指数平滑,是⼀种⽆趋势性或季节性的单变量数据时间序列预测⽅法。它需要⼀个称为  的参数,也称为平滑因⼦或平滑系数。此参数控制在先前时间步的观测值的影响指数衰减的速率。  通常设置为介于0和1之间的值。⼤的值意味着模型主要关注最近的过去观测,⽽⼩的值意味着在进⾏预测时更多地考虑历史。
接近1的值表⽰快速学习(即,只有最近的值影响预测),⽽接近0的值表⽰缓慢学习(过去的观察对预测有很⼤影响)。超参数:
:平滑因⼦的⽔平。
匝间短路测试仪3.3双指数平滑
现代营销
双指数平滑是对指数平滑的扩展,它添加了对单变量时间序列趋势的⽀持。除了⽤于控制该⽔平的平滑因⼦的  参数外,还添加了⼀个附加的平滑因⼦以控制趋势变化影响的衰减,称为 。该⽅法⽀持以不同⽅式变化的趋势:加法和乘法,分别取决于趋势是线性的还是指数的。具有加性趋势的双指数平滑通常被称为 霍尔特线性趋势模型(Holt’s linear trend model),以⽅法发明者Charles Holt的名字命名。加性趋势:具有线性趋势的双指数平滑。
乘性趋势:具有指数趋势的双指数平滑。
对于更长的范围(多步)预测,趋势可能会继续不切实际。这样,随着时间的流逝抑制趋势可能是有⽤的。阻尼是指在将来的时间内减⼩趋势的⼤⼩,然后逐渐减⼩到⼀条直线(⽆趋势)。
与趋势本⾝的建模⼀样,可以使⽤相同的原则来抑制趋势,特别是对线性或指数抑制效果的相加或相乘。⼀个阻尼系数φ(p或φ)是⽤来控制抑制率。加法抑制:线性地抑制趋势。
乘法抑制:抑制这种趋势指数。超参数: :平滑因⼦的⽔平;:平滑因⼦的趋势;趋势类型:加法或乘法;抑制类型:加法或乘法;
:阻尼系数;
ααααβαβϕ
3.4 三重指数平滑
三重指数平滑是指数平滑的扩展,它显式地为单变量时间序列增加了对季节性的⽀持。这种⽅法有时被称为 Holt-Winters  指数平滑法,以该⽅法的两个贡献者 Charles Holt  和 Peter Winters  的名字命名。除了  和  平滑因⼦,还添加⼀个新的参数 来控制影响季节性的组件。与趋势⼀样,季节性可以建模为季节性的线性或指数变化的加法或乘法过程。加法季节性:具有线性季节性的三重指数平滑。
乘法季节性:三重指数季节性指数平滑法。
三重指数平滑是指数平滑最先进的变体,通过配置,还可以建⽴双指数平滑模型和单指数平滑模型。
作为⼀种⾃适应的⽅法,Holt-Winter指数平滑法允许⽔平、趋势和季节性(level,trend,seasonality)模式随时间变化。
此外,为了确保正确地建模季节性,必须指定季节性期间(期间)的时间步长。例如,如果该系列是⽉度数据,⽽季节周期每年重复,那么周期=12。超参数:
Alpha( ):平滑因⼦的⽔平。
Beta( ):平滑因⼦的趋势。Trend Type:加法或乘法。Dampen Type:加法或乘法。
Phi():阻尼系数。
Gamma():季节性平滑因⼦。Seasonality Type:加法或乘法。
Period:在季节性时期的时间步骤。
3.5 如何配置指数平滑?
可以显式地指定所有模型超参数。这对专家和初学者来说都是⼀个挑战。相反,通常使⽤数值优化来搜索并为模型的平滑系数(alpha、beta、gamma和phi)提供⽀持,从⽽获得最⼩的误差。
对于指数平滑法中包含的未知参数,从观测数据中进⾏估计是⼀种更稳健、更客观的求取值的⽅法。[…任何指数平滑⽅法的未知参数和初始值都可以通过最⼩化SSE(误差平⽅和)来估计。
指定趋势和季节性变化类型的参数,例如它们是相加的还是相乘的,以及它们是否应该被抑制,都必须明确指定。αβγαβϕγ

本文发布于:2024-09-21 15:50:24,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/328679.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:预测   时间   序列   季节性   趋势   指数
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议