基于BP神经网络的股市大小盘风格轮动预测

第36卷第3期
计算机仿真2019年3月文章编号:1006-9348 (2019 )03-0239-04
基于B P神经网络的股市大小盘风格轮动预测
郭怡然,王秀利
(中央财经大学信息学院,北京100081)
摘要:针对我国股票市场上明显的大小盘风格轮动特征,提出了大小盘风格轮动预测模型,用于预测未来大小盘股票的相对 收益。模型采用基于遗传算法优化权重的BP神经网络算法,以上证50指数和中证500指数代表大小盘股票表现进行分 析,从指数收盘价和成交量数据中提取不同信息作为输人指标,对比不同指标预测效果的优劣。结果发现B P神经网络模型 对中期风格轮动有比较好的预测效果,且提取价量数据特征进行预测比用原始数据直接预测正确率更高。
关键词:神经网络;遗传算法;股市风格
中图分类号:TP391 文献标识码:B
Stock Market Style Rotation Prediction Based on BP Nerve Network
GUO Yi-ran,W ANG Xiu-li
(School of Information, Central University of Finance and Economics, Beijing 100081, China)
A B S T R A C T:Aiming a t the obvious r o tation of the s t y l e between large-sized and small-sized stocks in our country,
a scale s t y l e ro t a t i o n prediction model i s proposed t o predict the r e l a t i v e returns of large and small stocks i n order t o
earn excess returns.The model uses the BP neural network algorithm which adopts genetic algorithm t o optimize the weight.The analysis was based on the Shanghai Stock Exchange 50 Index representing large —sized stocks and the China Securities 500 Index representing small-sized stocks. This paper extracted several features from the index price data as the inputs of the model and compared the pros and cons of these features.The results show t hat the BP neural network model based on genetic algorithm has an excellent performance, and the accuracy i s higher t o use features as input than the o r iginal data.
K E Y W O R D S:Nerve network; Genetic algorithm; Stock market s t y l e
i引言
在我国股票二级市场上,有明显的风格轮换的特征[n。风格是指将股票从市值规模、行业、板块等角度进行分类,相 类似的股票分为一组,不同组股票具有不同风格。关于风格 的研究,在上世纪90年代就开始出现,并且当时在欧美市场 出现了诸多基于风格的投资基金,均有不错的收益。我国A 股股票也有大小盘及行业板块的区分,并且在不同市场时 期,不同风格会出现收益高低的差异。相较于行业风格轮 动,大小盘风格轮动更为明显且有迹可循,在某段时期大盘 股或小盘股收益会明显优于另一类,且这种优势在一段时间 后会切换,因此可以通过在不同时期配置不同风格的股票组 合,赚取超额收益。大小盘投资风格轮动的出现源于投资者 对于不同市场出现的不同反映。历史经验表明,小盘股一般 具有高成长性,从长期来看,小盘股相对大盘股有收益溢价, 但小盘股波动相对较大,不稳定,在熊市尤其是市场急剧下跌时,风险更大。大盘股较为稳定,但在市场稳中向好时,持 有大盘股收益相对较低。投资者追求的是高收益、低风险,市场风格的切换也就是投资者对于市场未来预期的变化,基 于对市场的不同预期,对大盘股或小盘股有不同偏好,导致 大小盘风格轮动的形成。经研究发现,中国股市有明显的中 期风格动量轮转,相对于持续持有小盘股或大盘股,大小盘 风格轮换策略收益更高[2]。同时,由于上证50指数成分股 均为大盘股,中证500指数偏小盘股,且两者均有对应股指 期货,可以进行卖空操作,因此可以通过两指数的股指期货 对冲,进行大小盘风格套利。
目前对于股市风格的研究,多采用协整检验、向量自回 归模型和格兰杰因果检验等时域分析方法来完
成,采用机器 学习算法分析预测股市风格轮动的研究较少。股市预测为 非线性预测,采用非线性的方法有更好的效果m。本文将采 用基于遗传算法改进的B P神经网络来进行分析,基于上证 50指数以及中证500指数的价量信息,计算相关指标,滚动 预测未来一段时间内的大小盘风格轮动情况[<]。
收稿日期:20丨8-01-05
—239—
2风格预测模型
2.1 B P 神经网络原理
人工神经网络是模仿生物大脑神经元,进行分布式并行
信息处理的算法,可用于分类和预测,对于拟合非线性函数, 具有较好的效果,且具有自适应、自学习
和容错性。B P 神经 网络是应用最为广泛的神经网络算法。它一般由输人层、隐 藏层、输出层构成。输人层神经元个数与输入因子数量相 同,输出层神经元个数与结果数相同。它根据计算结果与标 准结果的误差,逆向传播修改神经网络的权重,直到误差达 到一定精度为止。三层B P 神经网络模型如图1所示。
图1 BP 神经网络
B P 神经网络优化步骤如下:1) 初始化网络权值,输人训练集,计算网络输出结果,即 预测值;
2) 将预测值与训练样本真实值进行比较,计算误差;3) 根据误差对神经网络的权值进行调整;4)
重复前三步步骤直至误差收敛到期望值,或训练次
数达到预设上限。
2.2遗传算法优化的神经网络模型
传统B P 神经网络容易陷人局部最优解,为了提高算法 的全局捜索能力,考虑采用遗传算法进行优化[5]。遗传算法 是一种启发式算法,仿照生物进化过程,采取优胜劣汰的方 式,寻最优解。它具有较好的全局搜索能力,将其与B P 神 经网络结合,采用遗传算法优化神经网络的权重,可以较好 解决陷人局部最优的问题。
用遗传算法优化神经网络权值,若采用传统的二进制编 码,计算量过于庞大,因此本文采用实数编码的遗传算法[6]。
实数编码遗传算法的求解过程如图2所示。1)
对个体进行编码,传统编码方法为二进制编码,但是 二进制不能很好地表示实数,所以在表示网络权值时,采取 浮点数编码。将所有权值连在一起,构成一个个体。
2) 初始化种。随机生成规模为M 的初始种。3)
通过适应度函数计算适应度。适应度即表示当期种 中每个个体的优劣,本文的适应度函数采用以下方式
E  =
~ ct)2 ⑴其中h 为目标值A
为计算值,n 为样本数。
240 —
图2遗传算法优化权重流程
4)选择运算
根据个体的适应度,将较好的个体按照一定规则遗传到 下一代。本文选择赌的方法,设体总数为每个个 体的适应度为则每个个体被选中的概率为
fih
Pi
(2)
(3)
M
1
^ 1
将当前体中所有个体适应度累加,生成一列随机数,
长度为体规模M ,将其从小到大排序,对每个随机数进行 判断,若随机数小于当前适应度累加值,则将当前个体遗传
到下一代。
5) 交叉运算
将两个染体基因进行交叉,生成两个新的个体。交叉 以概率进行,交叉的过程如公式所示。
lx \*' = ax \ + (1 - a )x 2
= (1 - a )x \ + ax '2
a 是0到1的随机数。6) 变异运算
变异运算是对某个个体的基因直接进行变动,增加搜索
范围,使体具有更大多样性,防止陷人局部最优。变异以 概率进行,变异的过程如公式所示
*'*' = x ' + h  * (max - x ') * r
rand  m o d  2=0 x ' - k * (x ' - min) rand  m o d  2 = 1
广为0到1的随机数,t 为0到1的系数为权重的最
大值,mire为权重的最小值。
7) 计算经过选择、交叉和变异过程之后的新种的适
应度,重复上述三个操作,直至误差低于预期阈值或达到最 大迭代次数[7]。
(4)
3
基于股票指数的风格预测仿真
中国股市的大小盘风格,可以通过两支最典型的股票指
数反映。上证50指数成分股均为规模大、流动性好的最具 代表性的优质大盘股票;中证500指数成分股为沪深证券市
初始化种
输出层
隐藏层
场内小市值公司。两支指数关注度极高,且均拥有对应股指 期货,可以进行卖空操作,通过预测两指数的收益率髙低可 以一多一空进行套利。通过W I N D金融终端,获取到上证50 指数与中证500指数从2010年1月1日至2017年7月31 日的日度收盘价、日度成交量数据。将前80%的数据作为训 练集,后20%的数据作为测试集,进行预测。上证50指数和 中证500指数的价量数据分别如图3、图4所示。
图4中证500价量数据
预测时,采用滚动预测的方式,滚动窗口为1个交易曰,以保证数据的最大利用率。根据当前时点前N天的交易数 据计算得到神经网络输人指标,输出结果为预测未来M天 上证50指数和中证500指数收益率相对高低。若中证500 指数收益率更高,则神经网络输出结果为1,表示当前风格为 小盘股占优,可以考虑多配置小盘股或多中证500股指期 货、空上证50股指期货进行套利;若上证50指数收益率更 高,则输出为0,表示当前风格为大盘股占优,可以考虑多配 置大盘股或多上证50股指期货、空中证500股指期货进行 套利。
3.1提取价置数据特征
由于所有信息中,价量信息最为重要,且为指数未来走 势判断的最基本依据,因此主要采用股票指数的价量信息计 算输人指标。此前相关研究一般采用原始数据直接作为神 经网络的输入,但这种形式包含信息有限,信噪比过低,本文采用提取原始数据特征值的方式,提高输入信息的有效性。提取特征包括均值、方差和拟合斜率。均值表示历史所选取 时间段内的一般水平,方差表示该时间段内波动性,斜率为 该时间段内数值拟合一次函数的斜率,表示该时间段内的总 体趋势。选取前60个交易日指数价量数据预测未来20个 交易日两指数收益率相对高低,计算均值、方差和拟合斜率 进行预测准确率为59% ,用原始数据直接输入进行预测准确 率为51%。因此采用历史数据均值、方差和拟合一次函数斜 率比直接使用原始价量数据进行预测更加有效。
3.2辅助预测指标
在基础指标的基础上,考虑到预测目标为判断两指数相 对收益,因此增加两指数比值作为辅助预测指标。基于股市 大小盘风格的轮动特征,大盘股或小盘股均不会表现长期持 续优于另一类,因此,当中证500指数与上证50指数比值处 于历史低位时,比值有上升的可能性,即未来中证500指数 表现优于上证50指数,小盘股优于大盘股;当中证500指数 与上证50指数比值处于高位时,有下降的可能性,即未来上 证50指数表现优于中证500指数,大盘股优于小盘股。因此计算中证500指数与上证50指数
比值,并将当前比值与 历史比值进行对比,计算历史水平指标,有助于提高预测未 来两指数相对收益的准确率。用当前比值减去历史最低值,除以历史最高值与最低值的差,标准化为0到1区间,表示 当期市场比值所处的历史水平。
^r a t i o^(5)
max-min
选取时间段内该指标值如图5所示。
.5^ 、分、分、分、才
图5比值历史水平
增加该指标后,正确率稍有提升,达到62%。
进一步考虑基于此指标进行分类预测。当目前两指数 比值处于不同历史水平时,训练不同的模型,预测时根据比 值历史水平指标采用对应模型进行预测。观察训练集数据,确定分界点分为三组:比值水平低于〇.75为第一组,比值介 于0.75和0.8之间为第二组,比值高于0.8为第三组。进行 分组预测,效果得到显著提高,预测准确率提升到70%。
3.3预测时间长度分析
原有输人数据指标不变,改变预测期的时间长度,原预
—241
测期为使用历史60日、40日、20日三个时间段交易价量信 息分别计算均值、方差、斜率指标预测未来20个交易日收益 情况,对比将预测期改为5个交易日,数据输入为5日、10 日、20日值;以及将预测期改为30个交易日,数据输入为30 日、60日、90日值,研究短期高频次的预测效果以及长期低 频次
预测效果。与原定预测期为20交易日进行对比,结果 发现,将预测频率降低或升高,预测精度均有所下降,印证之 前关于风格周期长度的研究,即1个月(20个交易日)最为 明显。
4结果分析
由以上结果发现,在因子输人方面,相较于直接使用原 始价量信息,提取时间序列均值、方差、拟合斜率特征用于神 经网络预测更为有效,降低了输人数据的信噪比且减小了模 型计算量和复杂度。加人当前比值处于历史水平位置这一 指标对预测效果有一定改善,当比值处于历史最高位或最低 位时,很难长期持续,反向变动的可能性大大增加。在预测 时间段的选取方面,以20个交易日,即一个月作为预测周 期,预测效果最优,基于短期趋势会延续、长期可能发生反转 的市场规律,输人数据分别计算短期(前20个交易日)、中期 (前40个交易日)、长期(前60个交易日)指标。将以上指标 作为输人因子,且根据所处指数比值所处历史位置的不同,分三种情况分别训练神经网络,有较好的预测效果。正确率 结果如表1所示。
表1策略正确率对比
输入因子策略1策略2策略3策略4
收盘价V
成交量V
收盘价均值V V V
收盘价方差V V V
收盘价拟合斜率V V V
成交量拟合斜率•V V V
比值所处历史水平V V
根据比值水平分组V 预测准确率51%59%62%70%5结束语
本文采用经过遗传算法优化的B P神经网络,来预测股
市大小盘风格,遗传算法具有较强的全局优化能力,神经网
络具有良好的对非线性函数的拟合能力。在此模型基础上,
采用上证50指数和中证500指数的价量信息进行仿真,提
取指标,比较不同的输人因子,对两者在未来一段时期内的
涨跌进行预测。最终发现将两指数比值所处历史水平、20 日、40日和60日价格数据的拟合斜率、均值、方差以及成交
量数据的拟合斜率作为输人因子,按照比值历史水平分为三
类分别训练和预测,有较好的效果。
参考文献:
[1]韦立坚,等.中国股票市场风格轮动效应及基于适应市场假说
的解释[J].管理学报,2012,9(7) :943.
[2]肖峻,宇熹,陈伟忠.中国股市风格动量实证研究[J].财经科
学,2006 2006(3) :23-29.
神经网络预测
[3] Q Sun,W G Che,H L Wang.Bayesian Regularization BP Neural
Network M odel for the Stock Price Prediction[M].Foundations
and Applications of Intelligent Systems.Springer Berlin Heidel­
berg, 2014:521-531.
[4]徐颢华,顾海峰.股指期货短期价格预测模型研究一基于差
分BP神经网络模型[J].金融理论探索,2014,155(3):27-
32.
[5]王唯贤,陈利军.股票价格预测的建模与仿真研究[J].计算
机仿真,2012,29(1 ):344-347.
[6]张彤,张华,王子才.浮点数编码的遗传算法及其应用[J].哈
尔滨工业大学学报,2000,32(4) :59-61.
[7]付晓明,王福林,尚家杰.基于多子代遗传算法优化B P神经网
络[J].计算机仿真,2016,33(3):258-263.
厂■P W、
[作者简介]
郭怡然(1993-),女(汉族),四川省成都市人,硕士
研究生,主要研究领域为组合投资;
王秀利(1977-),男(汉族),山东省高唐县人,副教
授,硕士研究生导师,主要研究领域为投资组合优
化、数据挖掘。
(上接第132页)
[14] Liu Fangrui,et al.A variable step size INC MPPT m ethod for PV
systems[J].IEEE Transactions On Industrial Electronics, 2008,
55(7) :2622 -2628.
[15]李雅梅,隋場.一种改进的光伏电池最大功率点跟踪控制方
法[J].电源技术,2015,39(7):1416-1418.
[16]王立乔.分布式发电系统中的光伏发电技术[M].北京:机
械工业出版社,2014.
[作者简介]
孟超(I993-),男(汉族),云南人,硕士研究生,
研究方向为农业电气化与自动化;
赵咪(1980-),女(汉族),新疆人,副教授,硕士
研究生导师,主要研究方向为智能电网故障诊断与
控制等(通讯作者);
周伟绩(1983-),男(汉族),新疆人,讲师,主要研究方向:新能源并 网控制等。
242 —

本文发布于:2024-09-21 22:48:24,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/2/360897.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:预测   进行   风格   指数   比值   研究   采用   历史
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议