概述
数学建模的过程中必然会出现许多难以预料的问题,哪怕仅仅是⼀个温度预测模型也有莫⼤学问,譬如预测⼆⼗四⼩时内的温度变化,这多变量时间序列短期预测确实让我伤透了脑筋。
查阅了不少资料后,⼩弟我也勉勉强强总结出⼀套⾏之有效的办法,如有错漏,还请各位⼤佬予以指正。
基本步骤往来业务核算
1、根据时间序列的散点图、⾃相关函数和偏⾃相关函数图识别其平稳性。
2、对⾮平稳的时间序列数据进⾏平稳化处理。直到处理后的⾃相关函数和偏⾃相关函数的数值⾮显著⾮零。
3、根据所识别出来的特征建⽴相应的时间序列模型。平稳化处理后,若偏⾃相关函数是截尾的,⽽⾃相关函数是拖尾的,则建⽴AR模型;若偏⾃相关函数是拖尾的,⽽⾃相关函数是截尾的,则建⽴MA模型;若偏⾃相关函数和⾃相关函数均是拖尾的,则序列适合ARIMA模型。
链接: .
4、参数估计,检验是否具有统计意义。
5、假设检验,判断(诊断)残差序列是否为⽩噪声序列。
⽩噪声在实际拟合模型的时候其实就是残余数,模型加上这个是为了解释只⽤ARMA部分预测不了的随机性。
6、利⽤已通过检验的模型进⾏预测。云梦县教育局
引⾔
要进⾏多变量时间序列的分析预测,⾸先对单变量进⾏建模,并分析判断其在建模过程中表现出来的种种特性,有的童鞋上来直接进⾏多变量分析,把变量⼀股脑的扔到这⾥。
然后直接确定,最后结果只能是……
⼯欲善其事必先利其器,让我们从单变量开始吧。石家庄雾霾治理
链接: .
具体步骤百度经验上有详细的介绍,这⾥不再赘述,反正⼤家对⽹上能搜到的东西也不是很感兴趣。下⾯直接把我建模过程中遇到的问题和⾃认为的中间简略说⼀下。
单变量时间模型
因为我要完成的是基于⼤量数据(近100天)的短时间(24⼩时)预测,故不必分析季节成分。
ARIMA模型要求序列是平稳序列,因此要对数据进⾏平稳性分析。
由上述序列的⾃相关图(ACF)和偏⾃相关图(PACF)分析可知,其都是拖尾的,说明序列是⾮平内蒙古农业大学学报
稳的。温度数据序列通常不是平稳序列,但⼀般⼀阶差分都是平稳的,因此可以通过差分做进⼀步分析。
*⾃相关函数ACF描述的是时间序列观测值与其过去的观测值之间的线性相关性。
活化钢*偏⾃相关函数PACF描述的是在给定中间观测值的条件下,时间序列观测值预期过去的观测值之间的线性相关性。
根据差分序列图,观察其平稳性,差分序列基本均匀分布在0刻度线上下两侧,因此可以认为差分序列是平稳的。差分闲话:差分,⼀般在⼤数据⾥⽤在以时间为统计维度的分析中,其实就是下⼀个数值 ,减去上⼀个数值 。
差分: .
差分序列的ACF和PACF都是拖尾的,因此,可对原始序列建⽴ARIMA(p,1,q)模型。2013年浙江省高考作文
链接:
经过对图像的分析处理,确定模型为ARIMA(2,1,13)