金融市场极端风险状态预测模型及其应用

收稿日期:2021-11-30
修回日期:2021-12-13
及其应用
肖艳丽向有涛
(湖北省社会科学院,湖北武汉430077)
摘要:随着经济全球化发展和国内金融市场的逐步开放,中国金融市场也遭受着来自国外金融风险的威胁与挑战。充分考量中国金融市场部分特征化事实,结合中国的现实情况,以中国金融市场为研究对象,选取了13个代表性指标,利用2005年1月—2021年6月的数据构建了中国金融市场风险指数,并且通过事件匹配方法检验指数识别作用的有效性。进一步,运用XGBoost 模型预测中国金融市场极端风险,采用多种评价指标将其与传统的SVM 、GBRT 、RF 和MLP 模型进行比较研究,并利用配对样本T 检验和弗里德曼检验对各个模型预测效果的差异进行显著性检验。最后结合SHAP 和LIME 方法展示了不
同特征指标对中国金融市场风险的贡献度。实证结果表明:(1)所构建的指数较好地符合了我国金融市场风险变化的实际情况;(2)XGBoost 预测模型对于极端金融风险样本识别能力较强、准确性较高,与其余模型相比,其预测性能更加优异,而且具有明显的统计检验意义。(3)利用Shapley 和LIME 方法挖掘出了影响中国金融市场风险的主要因素及其时变特征,且阈值效应的发现有利于金融部门对金融市场风险进行针对性的审慎监管。
关键词:金融市场风险;压力指数;极端风险预测模型;极端梯度提升树;Shapley 值;可解释性中图分类号:F832.5文献标识码:B 文章编号:1674-2265(2022)03-0008-10DOI :10.19647/jki.37-1462/f.2022.03.002
作者简介:肖艳丽,女,管理学博士,湖北省社会科学院副研究员,研究方向为农村金融;向有涛,男,湖北省社会科学
院,研究方向为金融风险管理。
一、引言
自20世纪以来,世界金融市场一直处于动荡发展中,连续不断的金融危机给有关国家及世界经济带来了严重影响。我国正处于向经济高质量发展的转型阶段,金融系统与实体经济存在结构性矛盾问题,因此,中国金融市场安全面临来自内部的压力和外部环
境的冲击(郭娜等,2020)[1]。在全球金融一体化和数pm2.5杭州
字信息技术的不断发展下,国际经济和金融环境愈发复杂、面临更大的不确定性,金融风险和危机的传染性增强。在错综复杂的外部环境和内部条件下,对我国过去十几年的金融风险演变过程、波动情况进行评价分析,测度金融市场风险和构建可靠有效的极端风险预测方法,具有重要的现实价值和意义。
从国内外研究来看,在金融市场风险的度量上,
主要采取三种方法:第一种是模型法,主要通过DD (银行挤兑)模型、GARCH (广义自回归条件异方差)模型和NN (神经网络)等方法对金融市场风险进行刻画,评估一个国家发生金融风险的可能性(范
小云等,2013)[2]
。第二种是早期的信号法,借助已经
发生过金融危机的国家的经济形势来研究风险发生的共同信号指标,但信号法作为一种借鉴他国的经验而建立的风险识别与预警方法,具有一定的片面性,难以适用中国这种没有真正爆发金融危机的国家(许涤龙和陈双莲,2015)[3]。第三种是金融压力指数
(FSI )法,最早由Illing 和Liu (2006)[4]提出,该指数
通过度量给定时期内金融压力来分析市场风险的相对水平,可以克服指数时滞问题,综合反映金融市场的
风险情况。如Manamperi (2015)[5]通过对不同的FSI
的比较研究,发现所有指数均能够比较好地描述金融市场风险的变化状况。马勇和黄科(2019)[6]从货币、债券、股票、外汇和银行部门选取了10个代表性指标构建了FSI,结果显示其对宏观经济周期具有良好的预测能力。另外,丁岚等(2019)[7]结合CRITIC和标准差倒数权重法构建静态和动态权重的中国FSI。与前两种方法相比,金融压力指数法能够对包含银行、股票和债券等在内众多金融市场进行综合测度,具有计算方法灵活和计算结果直观的特点,在金融市场风险状态的识别上具有比较明显的优势(Louzis和V ouldis,2012)[8]。
鉴于上述,本文采用FSI对我国金融市场风险进行刻画和识别,进而为下文金融市场极端风险预测模型的构建奠定基础。极端金融风险预测一直都是学术界关注的焦点与热点,到目前为止,国内外学者已经运用Logit(逻辑回归)、NN和SVM(支持向量机)等对极端金融风险进行了有关预测研究(Ch
atzis等,2018)[9],并取得了不错的效果。但是也存在着假设条件苛刻、过拟合和易陷入局部最小等问题。其中SVM模型具有优越的泛化能力,被广泛运用于风险预测研究中,取得了良好的预测效果(温廷新和孔祥博,2020)[10]。Ahn等(2011)[11]通过实证研究发现,SVM模型在金融市场风险预测效果上要优于NN模型。然而,如果将其用来预测金融市场极端风险状态,可能存在预测效果较差的问题。原因在于SVM 模型在面对极端金融风险这种非平衡样本时,其决策分类超平面会偏向少数样本,导致模型容易出现预测失误(王鹏和黄迅,2018)[12],而XGBoost(极端梯度提升树)作为一种高效的集成学习方法,能够有效地构建增强树和并行运算,与SVM相比,其模型效果和运行效率更好(肖艳丽和向有涛,2021)[13]。目前,已有文献多以SVM、NN及其改进方法为主,并且关于XGBoost模型的研究主要集中于用户分析、价格预测和信用评估等,没有发现将其应用于极端金融风险预测的实证研究。所以,本文引入XGBoost模型作为极端金融风险预测模型,以克服传统方法在极端风险预测中的不足,进而为中国金融监管部门和有关机构防范金融市场风险提供一种应用方法。
第一,本文基于前人的研究,结合我国金融市场的特点,从银行、债券、股票、外汇、保险和房地产等市场,选取13个代表性指标,结合CDF转换、等权重和主成分分析等方法综合得到了FSI,并通过事件识别方法,验证了其识别作用,其应用能够为中国金融市场风险状况的分析提供依据,对金融市场风险水平情况进行相应判断。第二,在运用FSI度量中国金融市场风险的基础之上,进一步构建了金融市场极端风险XGBoost预测模型,对整体金融市场风险进行了定量研究,并采用总体分类准确率
TR、几何平均正确率G和少数类度量值F等多种评价指标,将其与其余模型进行比较研究,全面反映了XGBoost预测模型对于金融市场极端风险的预测能力,从而丰富了有关我国金融市场风险的研究内容和极端金融风险的预测方法。第三,引入Shapley和LIME解释模型对本文提出的XGBoost模型的预测结果进行分析,采用Shapley和LIME方法提炼出了特征指标对于中国金融市场极端风险的贡献度,加深了对金融市场风险时间变化特征以及指标阈值效应的认识。
二、金融市场极端风险状态预测模型设定
(一)XGBoost模型
XGBoost是一种开源的高度可扩展的梯度提升的集成学习方法(Chen和Guestrin,2016)[14],已经在各个领域中得到了广泛应用(He等,2018)[15]。与GBRT(传统梯度提升树)相比,兼具线性规模求解器和树学习算法。XGBoost通过将正则项引入损失函数中,且对损失函数进行了二阶泰勒展开,能够较好地权衡模型自身的复杂程度和损失函数的下降程度,从而可以更好地处理和控制过拟合问题的产生和提高模型的求解效率。
设数据样本为:
S=(x
i
,y
i
),i=1,2,3,⋯,n,x
i∈R m,y i∈R(1)其中,m为数据样本的维数,n为样本个数。假设有h个决策树(h=1,2,3,⋯,t),则定义损失函数如下:Objective(t)=∑i=1n l(y i,y(t)i)+∑h=1tΩ(f h)(2)
其中y(t)
i
=∑h=1t f h(x i)=y(t-1)i+f t(x i),f h∈E,E为回归树
的集合空间,f
h
为回归树,x
i
为第i个数据的特征向
量,y
i
为真实值,y(t)
i
表示预测值。此外,为了控制模型出现过拟合的现象,加入正则项①。结合上式,对损失函数进行泰勒展开可得:Objective(t)≈∑i=1néëùû
12w i f2t(x i)+g i f t(x i)+Ω(f t)+C(3)
其式(3)中g
i
和w
i
分别定义为α
y
(t-1)
l(y
i
,y(t-1))和
α2
y
(t-1)
l(y
i
,y(t-1))。
(二)基于FSI的金融市场风险状态识别方法
FSI的主要作用是度量金融市场潜在风险,及时
发现金融市场的运行情况,其在定量研究金融风险水平上具有明显优势:一方面,其计算出来的压力指数会与金融风险水平同步变化,能够为金融不稳定提供早期预警信号;另一方面,其可以对因金融体系的不确定性而承受的总体风险水平进行反映和刻画。目前,多数研究者和金融相关部门都采用它来度量金融
市场风险的变化情况(淳伟德和肖杨,2018)[16]
。FSI
的构建方法主要有四种:等方差权重法,等权重法,因子分析法和CDF 转换法。其中CDF 转换法消
除量纲和正态分布假定对指数的影响,不同于等方差权重法需要金融指标满足正态分布的要求。FSI 的计算公式如下:
FSI t =∑i =1
n X it w it
(3)
马基雅维利主义
其中,FSI t 为t 期的金融压力指数,X it 为第i 个
子市场在t 时期的值,w it 是指在t 时期子市场所对应的权重。
在FSI 的建立过程中,首先,利用经验累积分布
函数对基础指标进行转换(Hollo 等,2012)[17]
,从而
保证所构建指数的可靠性。其次,对每个子市场已经完成转化的基础指标进行算术平均,进而合成子市场的风险压力指数X it =1s ∑j =1
s
x i,j,t ,其中s 为第i 个子市场
中指标的个数。最后,由于金融压力可以被视为影响各子市场压力指数共同变动的主要因子(陈忠阳和许悦,2016)[18]
,所以本文采用主成分分析法对子市场指数的主要成分进行提取,从而确定子市场指数的权重w it 。
基于上述,计算出来FSI 后,需要对其进行识别,以确定金融市场是否存在极端风险。
(三)金融市场风险识别模型性能评价
为了对金融市场极端风险预测模型的综合性能进行更加全面地评价,不仅要评估模型的预测精度是否
优越,还要对模型的稳健性进行考察。先运用TR 和AUC 对预测模型的整体情况进行评价。然后,采用针对不均衡样本的评估指标对金融市场极端风险预测模型预测精度进行评估(G 和F )。其中,G 值综合分析了预测模型对极端风险类与非极端风险类样本的预测效果,若G 较大,则说明模型预测两类样本的精度都较高,反之,模型精度越小;而少数类样本的F 主要考察了模型对负样本(金融市场极端风险类样本)的预测性能,若F 较大,说明模型对金融极端风险类样本的预测性能更优,反之亦反之。
参政消息报设TP 和TN 分别表示对金融市场非极端风险样本和极端风险样本预测正确的数量,FN 和FP 分别表示预测错误的数量。混淆矩阵表示模型预测分类的结果(见表1)。根据表1中混淆矩阵的结果,可分别计算出TR 、AUC 、G 和F ,具体计算过程见表2。
表1:金融市场风险状态混淆矩阵
实际的金融类别
实际为极端风险状态实际为非极端风险状态合计预测的金融类别
预测为极端风险状态TN FN TN+FN 预测为非极端风险状态
FP TP FP+TP
合计
TN+FP FN+TP
表2:模型分类准确率评估指标
三、实证研究与结果分析(一)数据选取与处理
FSI 不仅能够反映金融市场本身的脆弱性,而且可以体现来自外部的冲击所造成的风险和不确定性。金融市场是一个完整的系统,主要包括证券市场、银行信贷体系和国际金融市场等子金融市场。考虑到我国金融市场体系和监管的条件,各个市场之间存在一定分割,所以先通过构建各个子金融市场的压力指数,然后采用PCA 法合成FSI 。目前,指标主要来源于银行、保险、证券和外汇等市场(丁岚等,
2019)[7]
,可以及时提供金融市场风险信息(包括信用
风险、流动性风险和市场风险等),且指标包含的信息具有互补性,在金融市场风险较强时又具有相关性,其中银行市场体系是关注的重点(孙蕾,
2016)[19]
。此外,考虑到房地产市场在我国经济发展
中的重要地位和作用,结合我国金融市场的实际特点,本文最终选取银行、股票、保险、债券、外汇和房地产等六大子金融市场中的13个特征指标用以构建我国FSI 。
鉴于数据可得性和统计期限的约束,本文选取2005年1月—2021年6月的特征指标数据作为研究对象,能够比较全面地反映金融市场风险的变化。本文数据来源于国泰安数据库、中经网数据库、中国人民银行网站、中国统计局网站、中国银保监会网站和中央国债登记结算有限责任,部分缺失数据采
用插值法补齐,部分季度数据使用Eviews转换为月度数据。
(二)金融市场风险状态评价
金融市场风险状态的准确划分是进行准确预测的前提和关键,所以,须对已经构建的FSI进行分析,并与金融市场实际情况进行比较,进而讨论该指数对金融市场风险状态划分的合理性和有效性。本文
构建的FSI样本区间为2005年1月—2021年6月,如图1所示。此外,本文还提供了经过Hodrick-Prescott滤波方法处理后得到的FSI趋势项。
在图1中,FSI能够比较准确地刻画和描述金融体系的实际运行情况,其主要事件压力大小反映在了指数的走势变化上。可以大致发现中国金融市场经历了以下几个发展阶段:第一阶段为2006年1月—2008年2月,FSI出现持续震荡上行的趋势,并在2008年到达了峰值。这主要是受美国次贷危机所引起的全球性金融危机和国内股市泡沫破灭的影响。随着2008年11月中国政府扩大内需、刺激经济增长的十项措施出台,市场信心得到恢复,降低了中国金融市场风险压力水平。第二阶段为2009—2011年,中国金融市场风险开始上升,出现了较大的波动变化。此时段内,2009年底以希腊债务危机为开端的欧债危机爆发并于2011年下半年全面爆发,加之国内采取了紧缩的货币政策导致流动性减弱,这都导致了中国金融市场风险压力的增大。第三阶段为2014年6月—2015年6月,2014年下半年我国金融市场风险水平出现上升趋势,主要源于我国经济面临下行压力使得金融市场不确定性增加。紧接着2015年“股灾”导致股市出现较大震荡,FSI明显上升,出现相对高点。第四阶段为2018年3月—2019年4月,2018年中美贸易摩擦出现,并呈现越演越烈的趋势,对中国国际贸易和外汇市场造成了一定的冲击,引起FSI走高,指数出现阶
表3:六大子金融市场的特征指标说明
市场范围银行市场股票市场保险市场债券市场外汇市场房地产市场指标符号
LRU
BBI
BRV
SMV
CMAX
IMV
IGR
BMV
TS
ERMV
ERV
REIG
REIC
指标名称
贷款利率波动性
银行业景气指数
银行间市场7日回购利率波动率遗传病论文
股票市场波动率
股票价格下跌变量
保险赔付额波动性
保险赔付额增长率
债券市场波动性
期限利差
汇率市场脆弱性
汇率波动率
房地产投资增长率
房地产指数变化率
计算方法及说明
当前一年期贷款利率/一年移动时间窗口最小值
表示银行业对未来经济发展的信心
反映短期资金需求,越大风险越高
上证指数日度收盘指数ln收益率绝对值的月平均值
上证指数当月收盘指数/一年移动时间窗口最大值
当前月保险赔付额/一年滚动时间窗口最小值
当月与上月保险赔付额之差/上月保险赔付额
上证国债指数市场月度收益率
1年期国债与10年期国债到期收益率之差
外汇储备/M2
人民币兑美元汇率对数收益率的绝对值
房地产投资累计同比增长
表示国房景气指数变化率(P1-P0)/P0
注:第t期对数收益率绝对值的计算公式为R
t =|
|ln()p t p t-1。
注:1表示金融市场极端风险样本点,0代表金融市场非极端风险样本点。
图1:FSI及趋势线
段性高点。
(三)金融市场极端风险预测
通过以上对事件与指数的描述性分析,可以比较直观地发现FSI 在不同时期的特征存在差异。此外,由于无法直接观察到整个金融市场是否处于极端风险
状态,而Du Mouchel (1983)[20]
汉字与中国心选择10%左右的样本
数据作为极端风险样本进行研究,取得了比较好的研究效果。所以,本文选取FSI 最高的10%的样本作为金融市场极端风险样本(这些样本对应的FSI 均在0.67026以上),即极值尾部,其他90%的数据作为非极端风险样本。根据极值理论,运用EVT 对尾部建模主要有两种极值模型,即传统的分块样本
最大值模型(BMM )和超越门限模型(POT ),其中对于充分高的门槛值,超过门槛值的样本数据近似服从广义帕累托分布(GPD )簇。GPD 的形式可以用下式表示:
G β,γ()x =ìíî
ïïïï1-(1+γx β)1
γ,γ≠0
1-exp (-x β),γ=0(4)
其中γ为形状参数,β为规模参数。因此,本文对极值尾部样本使用“伪极大似然估计方法(QM-LE )”估计GPD 簇分布函数的参数,从而获得尾部GPD 分布曲线与经验分布的拟合结果。从图2可以直观地看出,GPD 分布与经验分布的拟合效果较好,表明本文设定的金融市场极端风险样本的门槛值是合适的。另外,本文采用前一期(t-1期)的特征指标预测当前(t 期)中国金融市场的极端风险状态(0或1)。
为了让实证结果更加可靠和准确,本文利用K 折交叉验证(K-fold cross-validation )方法对金融市场极端风险预测模型进行研究。已有研究表明,k 在取5时对模型的预测效果影响不显著(崔少泽等,
2021)[21],所以本文将k 值确定为5。首先,5折交叉
验证将所有样本集划分成5个大小相同的样本子集;其次,依次遍历5个样本子集,每次将当前子集j 作为模型的测试集,其余样本子集作为交叉验证的训练
集;最后,当5个样本子集遍历完成后,把5次模型评估指标的平均值作为最终的评估指标,用于考察XGBoost 预测模型的有效性。
此外,以AUC 最大化作为模型参数选择的目标,结合5折交叉验证和随机搜索法(Random Search ,RS )对XGBoost 模型的核心参数进行优化选择,有利于提高参数选取的效率和准确性,回避样本抽样的随机性对预测模型性能的影响,其最优参数如表4所示。
对本文所提出的XGBoost 预测模型和其他模型分别绘制ROC 曲线如图3所示。纵轴是Sensitivity ,横轴是Specificity 。XGBoost 模型的ROC 曲线明显包住了其余模型,表明XGBoost 预测模型的预测能力要显著优于RF 、SVM 和K 最近邻等方法。
为了对模型的预测精度进行更加全面地分析,进一步计算XGBoos t 预测模型的TR 、AUC 、G 和F 的评价指标值,且结合其他方法模型进行相应地比较研究,实验对比结果如表5所示。在表5中,加粗的数字为各个指标得分的最大值,结果显示XGBoost 模型在预测金融市场极端风险状态的效果显著,其在各个指标上的表现突出,均优于其余模型方法,从而说明XGBoost 预测模型能够有效提升我国金融市场极端风险的预测精度。另外,可以看出,RF 、决策树和K 最近邻的G 和F 值都较低,表明非对称
样本对这几类方法的预测能力有比较严重的影响,而XGBoost 模型为
1-F (X )(o n l o g s c a l e )1e -04
5e -045e -03高平黑猪
5e -02经验分布
GDP 分布0.7
0.8
0.9  1.0
1.1
1.2
x (on log scale )
图2:FSI 指数尾部经验分布与GPD 分布拟合效果图
图3:各模型ROC 曲线比较
表4:XGBoost 预测模型的最优参数
参数名称树的最大深度学习率每个叶子里面的最小权重和参数符号max_depth eta min_child_weight 参数范围[1,10][0.01,0.5][0,10]最优参数值
60.38
0.7

本文发布于:2024-09-21 17:33:00,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/270425.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:风险   金融市场   预测   模型   极端   进行   样本
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议