混频数据模型应用研究现状及展望

统计与决策2021年第8期·总第572期
1混频数据模型的提出
传统的计量经济模型都是基于同频数据进行建模分析,否则将面临模型无法识别的情况。然而,在日常经济环境中,受统计口径和方式的影响,不同类型的数据其频率存在一定差异。如股票、期货、商品价格、客流量等大多为日度甚至时度数据;价格指数、供应量、存栏量等大多为月度数据;国民生产总值、产业增加值等大多为季度数据;人口数、固定资产投资流量、种植面积等大多为年度数据。如何基于混频数据开展建模分析,成为学术界的一个研究热点。传统分析中,一般将涉及的混频数据先转换为同频数据,常用方法有两种:一是通过计算均值或取离散点替代等算法将高频数据降频;二是通过拟合、插值法或桥接模型法等算法将低频数据升频,但均存在高频数据损失有效信息或由于人为操作增加无效信息从而增加误差等问题,进而可能会对模型估计、策略选择带来影响。王春枝等[1]证明了变量间频率倍差越大,将高频数据直接等权低频化处理会导致模型估计的有效性越低。
传统回归模型进行预测估计时,大多需要知晓未来时刻解释变量的估计值,进而需要先对解释变量进行预测,然后再用预测值进行回归建模预测,从程序上来看势必会增加人为操作误差。混频数据模型则能完美避免上述问题:一方面,其能够将不同频率的变量纳入同一模型,充分挖掘高频数据的有效信息,综合考虑高低频变量的滞后阶数和权重函数进行建模;另一方面,其能避免传统计量模型在预测方面的不足和假设要求,可以根据解释变量的超前发生性进行提前预测[2]
2混频数据模型的演变发展
混频数据模型的发展演变过程大致可以分为3个阶
段:第一阶段是将混频数据预处理后应用到同频数据模型,主要方法有加总替代、插值拟合等,人为误差较大;第二阶段是利用分布滞后模型(Distributed Lag Model,DL )对混频数据进行建模,主要模型有自回归分布滞后模型(Autoregressive-Distributed Lag Model,ARDL )、多项式分布滞后模型(Polynomial-Distributed Lag Model,PDL )、几何分布滞后模型(Geometric-Distributed Lag Model,GDL )等,预测方面的及时性和修正功能不足;第三阶段是将混频数据进行参数化后构建混频数据模型进行估计预测,主要模型有混频数据抽样模型(Mixed Data Sampling,MIDAS )、混频向量自回归模型(Mixed Frequency VAR,MF-VAR )、混频动态因子模型(Mixed Frequency Dynamic Factor Models,MF-DFM )等,能无损地利用混频数据信息,并及时修正预
测结果[3]
2.1分布滞后模型(DL )
DL 模型能够将混频数据直接代入模型进行分析预测,是混频模型的前身,一般形式为:
Y t =α+åj =0n
åi =0K
βij X jt -i /m +εt
(1)
式(1)中,Y t 为t 期低频被解释变量,X jt 为第j 个高频解释变量,K 为高频解释变量的滞后阶数,n 为高频解释变量个数,m 为高低频数据的频率倍差的个数,εt 为随机扰动项,βij 为待估计滞后系数。
一般地,时间序列数据大多存在序列相关,当高频变量个数不止一个时则表现为多重共线性问题,故常在DL
混频数据模型应用研究现状及展望
培a,b ,李哲敏a,b
(中国农业科学院a.农业信息研究所;b.研究生院,北京100081)
摘要:混频数据模型能有效避免传统计量经济模型对不同频率数据“预处理”带来的有效信息损失或无
效信息虚增问题。文章将混频数据模型的演变发展分为3个阶段,系统梳理了MIDAS 模型及其衍生模型的提出背景及国内外应用领域;分别从预测方向及时效、变量指标选择、研究对象的频率差、滞后阶数及权重函数确定、基准模型比较5个方面分类介绍了混频数据模型的应用研究。最后,提出混频数据模型的未来研究方向可考虑拓宽理论模型应用领域,将现有金融经济领域的最新研究方法拓展应用到其他行业;引入统计学中变量选择的方法,更科学地筛选混频变量指标。
关键词:混频数据模型;模型比较;变量选择;滞后阶数;权重函数中图分类号:F224文献标识码:A 文章编号:1002-6487(2021)08-0023-06
基金项目:中国农业科学院创新工程项目(CAAS-ASTIP-2020-AII-02);农业农村部农业科研杰出人才经费资助项目
作者简介:吴培(1987—),女,贵州遵义人,博士,助理研究员,研究方向:农业监测预警、农业贸易。
(通讯作者)李哲敏(1970—),女,福建安溪人,研究员,博士生导师,研究方向:农业农村信息
监测、分析与预警。
理论探讨
DOI:10.13546/jki.tjyjc.2021.08.005
23
统计与决策2021年第8期·总第572期
模型中加上自回归项,变为ARDL 模型,其一般形式为:
Y t =α+φ1Y t -1+φ2Y t -2+ +φp Y t -p +åj =0n
åi =0K
βij X jt -i /m
-θ1εt -1-θ2εt -2- -θq εt -q
(2)
特别地,在DL 模型的滞后分布上加上某种约束,以减少待估滞后系数个数,如PDL 模型,假设滞后系数βij 可以用一个次数较低的多项式逼近其真实分布,βi =α0+α1i +α2i 2+⋯+αp i p
i =0 1 2  Kn ;
如GDL 模型,假设滞后系数βij 呈几何级数衰减,βi =β0γn ,n =0 1 2  0<γ<1。
DL 模型相对简单,经常用作基准模型来对比混频模型的优越性[2—6]。2.2
混频数据抽样模型(MIDAS )
基于DL 模型的思想和桥接模型的构建机理,2004年Ghysels 等[7]正式提出MIDAS 模型,即通过对高频数据赋予某种权重函数,将不同频率的数据构建在同一模型中,用于分析高频数据对低频数据的影响。一般地,一元h 步向前预测的MIDAS 模型可以表示为:
Y t =α+βB ()
L 1/m ;θX (m )
t -h +εt
(3)
式(3)中,Y t 为第t 期低频被解释变量,X (m )
t
为高频
解释变量,h 为高频数据提前预测低频数据的期数,B ()
L 1/m ;θ=åi =0K ω()i ;θL i /m ,为权重函数和滞后算子的多
项式函数,且B ()1;θ=åi =0K ω()i ;θ=1,L 1/m 是高频数据的滞后算子,有L i /m X (m )
t
=X (m )
t -i /m ,m 为t 期和t +1期之间高
频数据的个数,K 为高频数据的滞后阶数,εt 为随机扰动项,且服从均值为零的正态分布,α、β、θ为待定系数。
考虑到大部分时间序列数据往往存在自相关性,Cle-ments和Galv ão [8]提出引入被解释变量的自回归项从而提高MIDAS 模型的有效性,加入p 阶自回归项后的AR-MIDAS 模型可以表示为Y t =α+λY t -p +βB ()
L 1/m ;θX (m )
t
+ε(m )
t 。Gh-
ysels 等[9]认为直接在模型中加入自回归项会使解释变量对被解释变量产生季节反映,Andreou 等[10]提出自回归分布滞后混合数据抽样回归模型(Augmented Distributed Lag-Mixed Data Sampling,ADL-MIDAS ),其h 步向前预测模型的一般形式为:
Y t =α+åi =0
p -1
Φi Y t -i +βåj =0K -1åi =0
m -1
ωi +j *m (θ)X
(m )
m -i  t -j -h /m
+εt (4)
借助误差修正模型(ECM )处理非平稳数据的问题,G ötz 等[11]提出了混频误差修正模型(ECM-MIDAS ),高低频数据所处时期相同,并提供了两种构建方法,一是基于同频协整,二是基于混频协整,其中第一种方法得到的长期协整关系更为可靠,构建的模型也更准确,其h 步向前预测模型的一般形式为:
∆Y t =β0+åi =1p -1
Φi ∆Y t -i +
åk =1
K -1
βk ∆1/m
X
(m )
t -h /m -(k -1)/m
-χecm t -1+εt
(5)
式(5)中,∆1/m 表示高频变量的差分,p -1为低频变量差分项的滞后阶数,K +h -2为高频变量差分项的滞后阶数,χ表示误差修正速度,ecm t -1=Y t -1-α
0-α1X (m )
t -h -i /m 为协整回归得到的残差项,即误差修正项。
进一步地,针对高低频数据所处时期的不同情况,Miller [12]提出了协整混频模型(CoMIDAS ),其一般形式同ECM-MIDAS,误差修正项替换为ecm t -1=Y t -1-α0-α1X (m )
t -h /m ,使用月度金融协变量来预测全球实际季度经济
行为。孙毅和秦梦[4]的研究表明,ECM-MIDAS 模型较CoMIDAS 模型预测效果更好。
为更充分利用混频数据监测经济周期波动,基于马尔科夫区制转换模型(Markov Switching,MS ),Gu érin 和Mar-cellino [13]在MIDAS 模型中引入MS,提出了马尔科夫转移混频模型(MS-MIDAS ),用以预测美国和英国的GDP 总量经济行为和经济周期区制,其h 步向前预测模型的一般形式为:
Y t =β0 s t +β1 s t B ()
L 1/m ;θX (m )
t -h +εt  s t
(6)
式(6)中,s t 为马尔科夫链,通常假设转移概率固定
不变,p ij =Pr ()s t +1=j |s t =i ,åp ij =1。
此外,近年关于混频数据抽样模型的研究拓展很多,通过和传统模型结合,提出的组合混频数据抽样模型不胜枚举,如Engle 等[14]将GARCH 模型和MIDAS 模型结合,提出了GARCH-MIDAS 模型,用于分析低频变量对高频变量的影响;Marcellino 和Schumacher [15]将因子模型和MIDAS 模型结合,提出了FA-MIDAS 模型;Colacito 等[16]为研究动态相关关系提出了动态条件关联混频模型(DCC-MI-DAS );Ghysels 等[17]提出了MIDAS 分位数回归模型等。2.3
混频向量自回归模型(MF-VAR )
Zadrozny [18]在VAR 模型的基础上提出了混频向量自回归(Mixed Frequency VAR,MF-VAR )的思想,后经过Mariano 和Murasawa [19,20]、Mittnik 和Zadrozeny [21]的拓展,目前MF-VAR 模型的建模方法主要是将每一个低频数据选定一些高频数据与之对应,通过对选定高频数据赋予权重转变为新的低频数据,对于缺失数据主要运用卡尔曼滤波或贝叶斯混频数据方法,其h 期混频因果关系检验预测模型的一般矩阵形式为[22]:
Z (τL +h )=åk =1
p
A ()h k Z ()τL +1-k +ε()
h (τL )
(7)
式(7)中,Z (τL )=[x H ()τL  1'
⋯ x H ()τL  m '
y L (τL )']’为m 个高频变量x H 和1个低频变量y L 的矩阵,τL 为低频数
据的时间刻度,A ()
h k 为待定系数矩阵。2.4
混频动态因子模型(MF-DFM )
MIDAS 模型和MF-VAR 模型中能容纳的变量个数相对有限,模型应用具有一定的限制,且经济周期的波动与众多宏观变量的相互作用和协同运动有关。Aruoba 等[23]结合状态空间模型,提出了适合日月混频数据的
MF-DFM,Banbura 等[24]进一步结合动态因子模型,增加模
升频24
型可以容纳数据的维度,对模型进行了改进,并通过预测GDP增速验证了模型的有效性。设众多宏观变量能被一个频率为日度的不可观测的共同随机因子x
t
所解释,且服从AR(p)过程,则MF-DFM模型的一般形式为[25]:
y it =α
i
i
x
t
j=1
n
γ
ij
y
it-jD
it
(8)
式(8)中,y
it 为低频数据,β
i
为不可观测的共同因子
的贡献水平,D为低频数据每个月包含的天数,γ
ij
为宏观
变量i与其滞后期j的相关性,ε
it 为不相关序列,且与x
t
的白噪声序列不相关。
3混频数据模型应用的分类
3.1应用领域
近年来,MIDAS模型及相关衍生模型被广泛应用于各种领域。Ghysels等[7]提出MIDAS模型的初衷即预测金融市场波动,此后其理论体系不断完善、衍生模型不断丰富、应用领域不断拓宽;徐剑刚等[26]首次将MIDAS模型引入国内应用于金融领域,刘金全等[2]将模型的应用拓展到中国宏观经济,此后逐渐扩展应用于国内不同领域,如服务业、旅游业、生态环境等。
Penev等[27]将MIDAS模型分析雨水数据(日度)分析水质数据(两周)的趋势。Bangwayoskeete和Skeete[28]将MI-DAS模型应用于旅游业,证明引入谷歌趋势搜索数据能提高旅游业需求的预测精度。Scipio[29]运用周度数据构建MIDAS模型预测荷兰年度失业率,证明其预测精度较年度同频数据模型提高约15%,较周度同频数据模型提高约10%。秦梦等[30]构建了基于季度GDP和年度能源消费总量的MIDAS模型,预测2020年中国能源消费总量为49.3亿吨标准煤。孙毅和秦梦[31]构建同频模型(DCC-GARCH)和混频模型(DCC-MIDAS)证明中美大豆期货市场存在动态的相关关系。秦华英和韩梦[32]运用MIDAS模型分析季度GDP对年度二氧化碳排放量的预测效果。陈磊等[33]选取5个月度一致指标以及1个季度一致指标,采用混频动态因子方法构建了中国服务业景气指数,对服务业的景气波动进行了详细测定和分析。
3.2预测方向及时效
高频数据含有大量的基础信息,通过对高频变量进行频率对齐,将其转化为低频变量,充分挖掘利用其有效信息,再通过对低频变量的参数施加多项式权重约束函数,从而提高低频数据的预测精度,是目前混频数据模型应用的主要形式。刘汉等[34]构建了月度景气指标与季度实际GDP增长率之间的MF-VAR模型,且证明其多步滚动迭代样本的实时预报和短期预测具有精确性、有效性与适用性。周建和唐成千[35]利用5个高频月度变量(投资、出口、消费、国房景气指数、发电量)构建MIDAS模型对中国季度GDP进行预测,结果表明中国宏观经济对于房地产市场比较敏感。
亦有部分学者通过构建反向MIDAS模型,在高频实时预测中纳入低频信息,实现低频数据对高频数据的反向预测。Foroni等[36]提出的反向U-MIDAS(RU-MIDAS)即能实现低频变量对高频变量的走势预测,但仅在频率倍差较小时能取得很好的实证效果。许启发等[37]提出了反向有约束混频数据抽样模型(RR-MIDAS),实现低频对高频的反向预测,基于MIDAS模型和RU-MIDAS提出的RR-MI-DAS,能适应因变量和自变量之间的各种倍差,实现低频对高频的反向预测,且在频率倍差为22时仍表现出较好的预测精度。
在时效方面,学者们普遍认为MIDAS模型更适合于短期预测,MF-VAR模型更适合于长期预测。Kuzin等[38]利用MIDAS模型和MF-VAR模型对欧洲地区GDP增长率进行了预测,比较发现,MIDAS模型更适合短期预测,MF-VAR模型更适合长期预测。郑挺国和尚玉皇等[39]比较各类MIDAS模型发现,在MIDAS模型中引入自回归项能明显提高预测精度,且短期预测效果甚佳。龚玉婷等[40]构建AR-MIDA
S模型分析CPI的预测有效性,发现短期利率、长短期利差、股票收益仅在收益水平上影响CPI短期走势,引入粮食、长期利率、能源商品市场的收益和波动将有效提高CPI短期预测。
3.3变量指标选择
随着混频数据模型应用研究的不断深入,学者们普遍认为在预测精度和效果方面,多元混频模型优于一元混频模型,组合混频模型优于多元混频模型。在对被解释变量进行预测分析时,如何从众多的影响因素中筛选或重组得到合适恰当的解释变量显得至关重要。目前对混频模型中解释变量的选择主要仍是通过经验选择,部分学者采用了Granger因果关系分析、景气分析、提取公因子等方法。王维国和于扬[41]依据Granger原因,从消费、投资、政府支出和进出口等众多显著性指标中选择社会消费品零售总额、固定资产投资完成额、进出口总额、国房景气指数作为影响GDP的指标。张蜀林和杨洋[42]从影响汇率变动的9个主要宏观经济变量(政府支出、外汇储备、广义货币供应量、外商直接投资、贸易条件、非贸易品与贸易品价格比、贸易开放度、国外净资产、美联储基准利率)中,通过消除共线性和相关性较弱的不显著性变量筛选出外汇储备、贸易条件、非贸易品与贸易品的相对价格比、美联储基准利率4个解释变量。刘汉等[34]将21个月度景气指标分为先行指标、一致指标和滞后指标3组,分别构建MF-VAR模型预测季度GDP,结果显示,先行指标组MF-VAR模型预测效果总体上好于其他两组,最终剔除了9个预测无效变量后,选择12个相对有效变量进行预测分析。陈磊等[43]利用景气分析法,筛选出4个月度一致指标,结合季度GDP 增长率构建四区制的MS-MF-DFM模型,提取共同因
子作为反映宏观经济运行的一致景气指数,从经济增长高低和经济波动强弱的双重视角对我国经济周期的运行特征进行分析。周德才等[44]选取中国新增贷款类、货币供应类、利率类、汇率类、房地产类、股价类共计6类30个金融状
25
统计与决策2021年第8期·总第572期
况变量,对每个类别的数据分别抽取两次结构公因子,最终得到新增信贷、货币供应量、利率、汇率、房地产、股价等6个货币政策传导渠道结构公因子构成的日月混频数据,基于MF-DFM模型构建了中国实时金融状况指数(RTF-CI)。陈磊等[33]利用时差相关分析、K-L信息量等多种方法,从170多个服务业和宏观经济相关经济指标中,筛选出5个月度一致指标(消费者信心指数、社会消费品零售额、规模以上港口货物吞吐量、非制造业PMI、财新中国服务业PMI)和一个季度一致指标(服务业增加值),采用MF-DFM构建了中国服务业景气指数,分析服务业的景气波动形势。
3.4研究对象的频率差
混频数据模型应用初期主要是针对月度高频变量预测季度低频变量,随着模型逐渐完善,形式逐渐多样化后,可以适用于任率倍差。Mariano等[20]拓展得到MF-VAR要求混频数据频率倍差为固定值
(如月度和季度的倍差为3,周度和月度的倍差为4)。Andreou等[10]提出ADL-MIDAS模型后实证发现,在原始月度高频数据基础上引入991个日度金融指标,由于每年每月的交易日数不同,频率倍差为65~93,虽然不同频率倍差会提高模型的估计难度,但将有效提高季度GDP的预测精度。Apriglia-no等[45]选取日度(取每月前28个数据)和月度混合指标用于预测欧元区季度GDP增长率,结果表明,组合U-MIDAS 模型较多元U-MIDAS模型在预测精度、解决共线性方面都具有比较优势。陈强等[46]构建MIDAS-AR分析混频日度股市收益(上证综合指数收盘价)对月度CPI的影响,频率倍差为21(每月21个交易日)。刘宽斌和张涛[47]采用周度和月度混频数据,取每月前28天的搜索量,计算关键词在每周7天中的平均搜索量,利用网络搜索高频数据结合混频抽样数据模型的预测方法,能较大程度上提高CPI的样本内拟合精度以及样本外预测精度,从而成功捕捉CPI “拐点”。许启发等[37]提出的RR-MIDAS能适应因变量和自变量之间的各种倍差,在频率倍差为22时仍表现出较好的预测精度。
3.5滞后阶数及权重函数确定
MIDAS模型回归估计的两个关键问题即确定滞后阶数(高频变量滞后阶数K和低频变量自回归滞后阶数p)和权重函数(主要有Beta权重函数、Beta-Non-Zero权重函数、Almon权重函数、指数Almon权重函数、step权重函数和无约束权重函数6种形式)。根据模型定义,K越大则应用模型中的高频数据越多,认为模型估计将越显著。如刘金全等[2]认为当K越大时,MIDAS模型估计的θ分布就越近真实值,而K越小就越接近于同频数据模型估计结果,θ的分布会比较发散。刘汉和刘金全等[48]认为K也不
是越大越好,还要根据实际情况判断,另外,由于K的取值并不影响模型中估计变量的个数,故传统的AIC、SIC、HQ准则无效,通常结合模型估计及样本内预测的均方误差(MSE)等因素来综合判断。Andreou等[10]指出,当模型中存在AR (p)项时,可以使用AIC或SIC等信息准则来确定判断
AR-MIDAS模型的滞后期数。左喜梅和郇志坚等[49]实证得出,随着K值的增加,模型预测效果不断增强,但K值越大包含的信息越多,数据对模型会产生额外的“噪音”,负面影响也会越大。刘宽斌和张涛[47]认为,K值太大需要更多的滞后数据,而K值太小则问题较为严重,可能导致模型估计精度降低,因此在确定K值时需不断测试比较模型预测精度和效果从而确定最优K值。
Ghysels等[50]通过比较Beta权重函数、Almon权重函数、指数Almon权重函数、step权重函数和无约束权重函数等多种权重函数的估计误差发现:5种权重函数在波动分析和多项式构建方面没有显著性差别;虽然在短期预测(h 较小)时Beta权重函数估计效果好,估计高频数据模型时Beta权重函数效果更好,估计低频数据模型时指数Almon 权重函数效果更好,但是5种权重函数估计预测结果差别不大。类似的,诸多学者建模前均对Ghysels等[50]提及的5种权重函数及Beta-Non-Zero权重函数其中的几种进行比较分析发现,Beta、Almon、指数Almo权重及无约束4种权重函数的使用概率较高,预测效果普遍较好。于扬等[51]用高频月度PMI对低频季度GDP进行预测,讨论了6种不同权重函数构建MIDAS模型,发现无约束权重函数构建的非限制AR(1)-MIDAS模型样本内预测效果最佳。毛志勇和于扬[52]发现,随着K值的不同,6种权重函数下模型的拟合优度及样本内预测精度指标亦有所变化,当K为
13时,Almon权重函数下的模型预测精度最好;当K增至30时,最优权重函数为Beta;当K增至30以上时,虽然6种权重函数下的模型样本内预测精度均有所下降,但K值较大时亦有很多弊端。周建和唐成千[35]将6种权重函数对比发现,当高频解释变量滞后阶数较小时,Beta、BetaNN和无约束3种权重函数下构建的MIDAS模型的预测精度较好,但随着高频解释变量滞后阶数的增加,3个模型的预测精度明显变差,直到K增至22左右时,预测精度普遍好转。3.6基准模型比较
前文模型介绍时提及,分布滞后模型相对简单,常用作基准模型来对比混频模型的优越性[53,54];另外,亦有许多学者选择传统时间序列同频模型进行比较分析,如AR模型、ARMA模型、GARCH模型等;此外,当首次构建新型MIDAS模型或比较几种不同类型的MIDAS模型的优越性时,常选择较简单的MIDAS模型或初始模型进行对比分析。如殷克东等[55]构建了海洋经济增长的MF-VAR模型,比较发现多元MF-VAR模型较一元MF-VAR模型在预测方面具有比较优势。孙毅秦梦[4]以U-MIDAS为例,推导出ECM-MIDAS和CoMIDAS模型,通过对3种模型的预测精度比较后,最终选择预测效果最好的加入误差修正项的ECM-MIDAS模型。许启发等[37]基于MIDAS模型和RU-MIDAS提出的RR-MIDAS后,通过与3种传统模型(RW模型、AR模型、ARDL模型)和RU-MIDAS模型比较得出,RU-MIDAS的样本内预测精度最高,RR-MIDAS模型的样本外预测结果最优,泛化能力好。
26
统计与决策2021年第8期·总第572期
4未来研究方向
4.1拓展应用领域
近几年,关于混频数据模型的应用研究越来越多,但大多仍集中在经济金融领域,少有涉猎服务业、旅游业、海洋经济、生态环境等。未来的研究方向,一方面可以进一步拓宽混频数据模型在其他领域的应用,如农业、制造业、建筑业、教育行业、交通运输业等;另一方面可以将现有宏观经济、房地产、股票波动的前沿理论和方法进行行业拓展,如编制行业景气指数。周德才等[56]基于日度的股票、汇率、短期利率、期货价格和月度的货币供应量、房价、社会融资规模7个日月混频数据和MF-MS-DFM模型,得到金融景气状态转移概率后,进一步提取共同因子编制了我国首个混频非对称金融景气指数(MFMS-FPI),能够很好地识别2002年以来我国的金融景气阶段变化(GDP)和货币政策周期变化(CPI)等。周德才等[57]利用不良贷款率等15个月度、季度混频金融变量,编制了中国首个混频金融稳定指数(MF-FSI),并基于此构建混频IS-Phillips模型分析货币政策目标选择和时效选择等问题。类似地,可以将上述方法应用于其他领域,如旅游业,编制混频非对称旅游市场景气指数;如服务制造业,编制混频服务业稳定指数;如生态环境,编制混频非对称水资源景气指数;如农业,编制混频粮食安全稳定指数等。
4.2自变量筛选
从统计学上来看,变量选择主要有两类方法,一是基于回归分析的变量选择,宗旨是筛选相关关系较大的变量,常用有逐步回归法、LASSO法;二是基于景气预测的指标分类,宗旨是筛选时间先后关系的先行、一致、滞后指标,常用的有峰谷对应法(图示法)、时差相关法、KL信息量法、马场法、循环聚类法、三角函数法。目前关于混频模型的变量选择方面主要基于经验选择,少有涉猎回归分析和景气分析的变量选择,未来可多考虑引用统计学上变量选择的方法,更科学地筛选有用指标。郑挺国和尚玉皇[39]认为,金融变量较经济变量具有较好的预测能力,在预测中体现了领先因子的性质,故可选取包含更多未来信息的金融变量对季度GDP进行预测。许启发等[37]选择了4个较为常用的影响SHIBOR的变量,提出未来可以全面综合考虑国内外经济影响因素,运用LASSO等方法筛选解释变量。
参考文献:
[1]王春枝,穆楠,赵国杰,等.混频数据抽样模型等权低频化处理的估
计偏误研究[J].统计与决策,2018,(10).
[2]刘金全,刘汉,印重.中国宏观经济混频数据模型应用——基于MI⁃DAS模型的实证研究[J].经济科学,2010,(5).
[3]刘汉.中国宏观经济混频数据模型的研究与应用[D].长春:吉林大
学学位论文,2013.
[4]孙毅,秦梦.混频误差修正模型的有效性探讨[J].统计与决策,2018,
(13).
[5]于扬,王维国.我国资产价格对CPI影响效果的研究——基于混频
数据模型的分析[J].价格理论与实践,2017,(4).
[6]Ghysels E,Santa C P,Valkanov R.There is a Risk-return Tradeoff Af⁃ter All[R].Cirano Working Papers,2003.
[7]Ghysels E,Santa C P,Valkanov R.The MIDAS Touch:Mixed Data Sampling Regressions Models[R].Escholarship,2004.
[8]Clements M P,Galvão A B.Macroeconomic Forecasting With Mixed-fre⁃quency Data:Forecasting US Output Growth[J].Journal of Business& Economic Statistics,2008,26(4).
[9]Ghysels E,Santa C P,Valkanov R.Predicting Volatility:How to Get Most Out of Returns Data Sampled at Different Frequencies[J].Jour⁃nal of Econometries,2006,(131).
[10]Andreou E,Ghysels E,Kourtellos A.Should Macroeconomic Fore⁃casters Use Daily Financial Data and How?[J].Journal of Business &Economic Statistics,2013,(31).
[11]Götz T B,Hecq A,Urbain J P.Forecasting Mixed-frequency Time Series With ECM-MIDAS Models[J].Journal of Forecasting,2014,33 (3).
[12]Miller J I.Mixed-frequency Cointegrating Regressions With Parsimo ⁃nious Distributed Lag Structures[J].Journal of Financial Economet⁃rics,2014,12(3).
[13]Guérin P,Marcellino M.Markov-switching MIDAS Models[J].Jour⁃nal of Business&Economic Statistics,2013,31(1). [14]Engle R F,Ghysels E,Sohn B.On the Economic Sources of Stock Market Volatility[R].Discussion Paper,2009.
[15]Marcellino M,Schumacher C.Factor MIDAS for Nowcasting and Forecasting With Ragged-edge Data:A Model Comparison for Ger⁃man GDP[J].Oxford Bulletin of Economics&Statistics,2010,72(4).
[16]Colacito R,Engle R,Ghysels E.A Component Model for Dynamic Correlations[J].Journal of Econometrics,2011,164(1). [17]Ghysels E,Plazzi A,Valkanov R.Why Invest in Emerging Markets? The Role of Conditional Return Asymmetry[J].Journal of Finance, 2016,71(5).
[18]Zadrozny P.Gaussian Likelihood of Continuous-time ARMAX Mod⁃els When Data are Stocks and Flows at Different Frequencies[J]. Econometric Theory,1988,4(1).
[19]Mariano R S,Murasawa Y.A New Coincident Index of Business Cy⁃cles Based on Monthly and Quarterly Series[J].Journal of Applied Econometrics,2003,18(4).
[20]Mariano R S,Murasawa Y.A Coincident Index,Common Factors,and Monthly Real GDP[J].Oxford Bulletin of Economics and Statistics, 2010,72(1).
[21]Mittnik S,Zadrozeny P A.Forecasting Quarterly German GDP at Monthly Intervals Using Monthly IFO Business Conditions Data[J]. CESifo Working Paper Series,2004.
[22]刘汉,宋海岩,王永莲.入境旅游人数、收入与我国经济增长——基
于混频Granger因果关系检验的实证研究[J].经济管理,2016,(9).
[23]Aruoba S B,Diebold F X,Scotti C.Real-time Measurement of Busi⁃ness Conditions[J].Journal of Business&Economic Statistics,2009, 27(4).
[24]Banbura M,Giannone D,Reichlin L."Nowcasting"in the Oxford Handbook of Economic Forecasting(Oxford Handbooks in Econom⁃ics)[M].Oxford:Oxford University Press,2011.
27
统计与决策2021年第8期·总第572期

本文发布于:2024-09-22 07:17:15,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/1/357160.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:模型   预测   数据   变量   分析   函数
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议