一种基于图形特征库的决策股价趋势洞察方法

著录项
  • CN202010883174.2
  • 20200828
  • CN111967685A
  • 20201120
  • 山西墨丘利科技有限公司
  • 周志刚;白增亮;罗继伟;李文琴
  • G06Q10/04
  • G06Q10/04 G06Q40/04 G06Q40/06 G06K9/62

  • 山西省太原市综改示范区太原学府园区长治路249号
  • 山西(14)
摘要
股票价格预估属于金融大数据分析与股票投资领域。现有的股票价格预测方法要么缺乏合理的数学可解释性(如基于深度学习的股价预测),要么难以根据股票价格的时序变化实时演化模型。本发明公开了一种基于图形特征库的决策股价趋势洞察方法,旨在通过股票交易历史数据构建股票价格或标准化映射后的图形特征库,待预测股票通过标准化、基于小波去燥平滑化后,采用动态时间归整算法将图化的待预测股票与图形特征库中的图形进行相似性计算,并引入决策算法用相似的图形来预估目标股票未来的股价。其中,图形特征库的最小化构建直接影响股票价格预测的精度与效率,且该问题是NP难题,本发明提出一种基于贪心策略的启发式算法来实现对图形特征库最小化的近似,能够根据金融数据的增量变化来自适应地对图形特征库中的图形基进行调整。
权利要求

1.一种基于图形特征库的决策股价趋势洞察方法,其特征在于包括:

1)候选图形特征库的构建:本专利使用已有的股票图形来预测股票价格未来的走势;

候选图形特征库的构建包含两个方面,其一是将股票数据进行标准化映射;其二是选取有代表性的股票走势图形组建图形特征库;

候选图形特征库通过以下步骤进行构建:

步骤a:将股票交易数据做标准化映射:选取函数F(S,Γ)将股票日线交易数据S(O,H,L,C,V) (其中O代表股票开盘价, H 代表当日股价最高值,L代表当日股价最低值,C代表股票收盘价,V代表股票交易量)进行标准化映射,其映射后的曲线集合为Γ,相应地将Γ称作F下的特征图形;

步骤b:将每一只股票Si的日线交易数据进行划分:给定时间阈值窗口大小为T,记录其最大值和最小值所对应的交易日TH和TL:若TH>TL,则以TH为起点向后查随后的最小值所对应的交易日TL'(若TL'等于时间窗口的终端Wend则将时间窗口向后扩展X个单位时间,直至TL'<Wend )并将TL和TL'之间的股票交易数据作为候选特征库图形,然后将时间窗口的起点Wstart滑动到TL'+1;若TL>TH,则以TL为起点向后查随后的最大值所对应的交易日TH'(若TH'等于时间窗口的终端Wend ,则将时间窗口向后扩展X个单位时间,直至TH'<Wend )并将TH和TH'之间的股票交易数据作为候选特征库图形,然后将时间窗口的起点Wstart滑动到TH'+1;重复执行该步骤,直至时间窗口的终点Wend大于该股票交易数据序列的终端数据所对应的交易日;

步骤c:迭代地执行步骤b,直至所有股票的日线交易数据被划分结束,形成候选特征库图形库;

2)图形平滑化处理:本专利采用小波去噪方法对时间序列进行平滑处理;图形平滑化主要包括以下步骤:

步骤d:小波函数选择:根据金融数据对小波紧支撑性、支撑宽度、对称性、正交性、消失矩的要求选择最适合的小波函数;

步骤e:分解层数的选择:根据多分辨率分析理论,分解层次越高, 去掉的低频成分越多,去噪效果越明显, 但失真度也相应增大;反之,分解层次越低,则难以达到图形平滑化的效果;由于本专利的目的旨在部分去除白噪声的干扰, 因此为提高图形准确性,分解层次不宜太高;为此,本专利通过对候选图形库进行采样,测试样本在不同分解层数的信息损失,从中选择合适的小波分解层数;

3)图形特征库最小化:图形特征库最小化旨在剔除库中冗余的图形特征,使得在随后的图形决策中消除非独立图形的干扰;然而图形特征库最小化问题是一个NP-hard问题,因此本专利提出一个基于贪心策略的启发式算法来实现对图形特征库最小化的近似,步骤如下:

步骤f:若图形特征库为空,则在候选图形特征库中任选一个图形直接放入图形特征库;若图形特征库不为空,则将利用动态时间归整算法(Dynamic Time Warping,DTW)计算该图形与图形特征库中已有图形的相似性,若不存在相似性高于阈值ε,则将该目标图形加入图形特征库;若存在相似性高于阈值ε且相似性高于阈值ε的个数大于1,则将该目标图形加入图形特征库并将相应的相似性高于阈值的预入库图形移除;

4)基于决策理论对待判别的股票价格运行趋势进行预测:

步骤g:给定待预测的股票,分别与图形特征库中的所有图形进行DTW相似性计算,通过决策算法对股票未来的趋势进行投票,并最终得出该股票价格趋势的预测。

2.根据权利要求1所述基于图形特征库的决策股价趋势洞察方法,通过以下步骤实现:

步骤一:本实施方式首先构建候选图形特征库,主要包含两个方面,其一是将股票数据进行标准化映射;其二是选取有代表性的股票走势图形组建图形特征库;

步骤一一:由于不同股票间价格差异很大,因此需要将股票交易数据做标准化映射;本专利使用一种均线函数F对原始数据进行标准化处理,均线算法数学原理如下:

EMA(t)为t天的移动平均线,EMA(t-1)为昨日移动平均线,n为周期,price为原始价格序列,t天映射t个不同权值,当t=1时,EMA(t)=price. 由上式可知,相较于直接使用股票交易价格,移动平均函数EMA能够更有效地利用历史数据:

EMA(t1)为快速移动平均线,其中t1∈[2, 100], 这里默认为12,EMA(t2)为慢速移动平均线,t2∈[2, 100],这里默认为26,两者差值可以反映股票投资者在不同周期下持股成本的差异:

对上述DIF进行加权平均,其中m∈[2, 100],这里默认为9,

给定股票S,通过标准化函数F(S,Γ)得到Γ=(DIF, DEA, BAR)三条无量纲的标准化曲线;

步骤一二:进行候选图形特征选择,以每只股票的日线交易数据为基础,按照股票价格的运行周期进行划分(这里,所谓的“股票价格的运行周期”是指在一个时间窗口内股票价格“从区间左侧最低价运行至区间最高价再到区间右侧最低价”或是“从区间左侧最高价运行至区间最低价再到区间右侧最高价”);给定时间阈值时间窗口大小为T,记录其上最大值和最小值所对应的交易日TH和TL:若TH>TL,则以TH为起点向后查随后的最小值所对应的交易日TL'(若TL'等于时间窗口的终端Wend,则将时间窗口向后扩展X个单位时间,直至TL'<Wend )并将TL和TL'之间的股票交易数据作为候选特征库图形,然后将时间窗口的起点Wstart滑动到TL'+1;若TL>TH,则以TL为起点向后查随后的最大值所对应的交易日TH'(若TH'等于时间窗口的终端Wend ,则将时间窗口向后扩展X个单位时间,直至TH'<Wend )并将TH和TH'之间的股票交易数据作为候选特征库图形,然后将时间窗口的起点Wstart滑动到TH'+1;重复执行该步骤,直至时间窗口的终点Wend大于该股票交易数据序列的终端数据所对应的交易日;

步骤一三:以整个沪深A股市场所有上市公司股票为全总域,迭代地执行步骤一二,直至所有股票的日线交易数据被划分结束,形成候选特征库图形库;

步骤二:本专利采用小波去噪方法对时间序列进行平滑处理;图形平滑化主要包括以下步骤:

步骤二一:基于阈值去噪的小波函数选择:设一个含噪声的序列F(t),可用以下模型表示:

上述公式中s(t)为真实序列,e(t)为白噪声;

假设噪声e(t)是均值为零、方差为σ2的白噪声;

设小波函数为φ(t),We(a,t)是e(t)的小波变换,根据连续小波变换理论可得:

由假设知道:

将其代入上式中可以推理出:

步骤二二:分解层数的选择;根据多分辨率分析理论,分解层次越高, 去掉的低频成分越多,去噪效果明显, 但失真度也相应增大,反之,分解层次越低,则难以达到图形平滑化的效果;由于本专利的目的旨在部分去除白噪声的干扰, 因此为提高图形准确性,分解层次不宜太高;为此,通过对候选图形库进行采样,测试样本在不同分解层数的信息损失,从中选择合适的小波分解层数,选择分解层数N=4;

步骤三:图形特征库最小化:图形特征库最小化旨在剔除库中冗余的图形特征,使得在随后的图形决策中消除非独立图形的干扰;然而图形特征库最小化问题是一个NP-hard问题,因此本专利提出一个基于贪心策略的启发式算法来实现对图形特征库最小化的近似,步骤如下:若图形特征库为空,则在候选图形特征库中任选一个图形直接放入图形特征库;若图形特征库不为空,则将利用动态时间归整算法(Dynamic Time Warping,DTW)计算该图形与图形特征库中已有图形的相似性,若不存在相似性高于阈值ε,则将该目标图形加入图形特征库;若存在相似性高于阈值ε且相似性高于阈值ε的个数大于1,则将该目标图形加入图形特征库并将相应的相似性高于阈值的预入库图形移除;

由于传统的DTW算法对周期序列的距离计算效果不是很好,比如两个经过平移后但周期相同的序列(形状相似但是存在相位差),计算出的相似距离很不理想;鉴于此,提出一个改进后的DTW算法:

(1)先求两个序列seq1与seq2最大公共子串,长度记为a;

(2)因为seq1和seq2是数值序列,在求最长公共序列时,设置了一个最大标准差的偏移容忍;也就是说,两个数值在这个标准差内,认为也是公共序列中的一部分;

(3)定义一个衰减系数:

当两个序列的公共子序列越长,则可得出衰减系数越小,进而实现对算法的改进;

步骤四:基于决策理论对待判别的股票价格运行趋势进行预测;

步骤四一:给定待预测的股票,分别与图形特征库中的所有图形进行DTW相似性计算;

步骤四二:将图形特征库中图形与给定待预测的股票匹配的终点为起点,分别计算其后股票价格的涨跌幅(如1个单位周期、5个单位周期),最终通过体投票对待预测股票未来的趋势(或股价)进行预测;即令图形特征库中图形集合为S={S1, S2, ..., Sm},与待预测的股票S*所匹配的终点分别记为{Ts1, Ts2, ... ,Tsm},相应地,相似度分别记为{K1,K2, ..., Km},其后一个单位周期的股票涨跌幅分别记为:

,

其后N个单位周期的股票涨跌幅可分别记为:

最终待预测的股票S*的未来N个周期的股票价格预测值为:

3.根据权利要求2所述方法,其特征在于:股票日交易数据的标准化函数的选择,步骤一一可以使用知名的股票技术指标将股票价格进行标准化映射,如CCI指标、KDJ指标、MACD指标等。

4.根据权利要求2或3所述方法,其特征在于:候选图形基准数据所选择股票交易数据可以是任意时间周期,如1秒、5秒、30秒、60秒,120秒、周、月、季、年等,相应地,所比较的待预测股票的价格预测周期也与图形特征库中所选用的时间周期相同,这样使得本专利可以实现对股票全时间周期的预测。

5.根据权利要求2、3或4所述方法,其特征在于:提供的决策机制不再是整个图形特征库,步骤四二采用最相似机制(Top-K)和相近阈值(相近度大于60%)机制作为参数限定参与决策的体论域;由于图形特征库图形基较多,增加限制参数后不仅可以加速预测过程,而且剔除不相近的图形特征可以提升相近图形特征的权重,进而提升预测精度。

说明书
技术领域

本发明涉及金融大数据分析与股票投资领域,尤其涉及一种基于图形特征库的决策股价趋势洞察方法。

股票市场作为金融市场中的重要组成部分,为推动我国经济改革,促进经济发展发挥了重要的作用,而股票市场价格波动是股市运行的基础,也是股票投资者关注的焦点。所以研究股市价格波动可以有效的把控股票市场的规律,增强金融市场的稳定性以及为投资者做出正确的投资决策提供一定的依据。对于股票市场价格波动分析,目前分为两大体系,其中一种是基于股票的各类技术指标为基础论证股票趋向、买卖等分析方法。此类方法主要针对股票市场自身的日常交易状态包括价格变动、交易量与持仓量的变化等参数,按照时间顺序绘制成对应的图形,然后针对这些图形进行分析研究,以预测价格趋势的方法。例如刘叶玲(2010)应用股市中三个具有典型意义的技术指标(RSI,KDJ和5日平均线)建立了非线性回归预测模型,对股票的价格走势进行了短期预测。但是目前相关文献中并没有合适的方法计算投资者当前股票对应的时间窗口图形与经典K线形态(例如老鸭头形态)的相似度。另外一种是运用机器学习等算法构建复杂的数学模型从而实现股票的分析以及预测,其中运用较多的学习模型是神经网络,例如郭建峰(2017)使用改进后的神经网络算法对股票短期价格进行了仿真实验,改进后的BP神经网络具有更快的收敛速度以及更好的准确性。孙德山(2019)运用递归神经网络并结合主成分分析方法建立基于主成分分析的递归神经网络预测模型,结果表明相对比ARIMA模型更加适应于股票价格的短期预测。李艺君(2020)建立了一种二层人工神经网络的股价指数预测模型,得出结论样本量和输入层变量选取恰当,网络学习训练次数足够时,使用BP神经网络预测股价指数变动趋势的结果较为准确。除了神经网络之外,不同的学者还运用了其他的学习模型,张晶华(2019)用深度学习支持向量机模型对上证指数进行数值预测。谈叙(2013)根据随机森林、决策树中各变量、节点信息增益大小进行特征抽取进而建立金融时间序列预测模型,提高了模型预测精度以及鲁棒性,降低了模型的复杂度。除了上述机器学习算法之外,小波分析在金融时间序列分析与预测中也发挥了重要的作用。程昌品(2010)利用Mallat算法对股票收益率原始时间序列进行小波分解,进而用ARIMA-SVM模型进行预测,发现无论均方误差以及平均误差都相对于独立模型有较大的提升。郑承利(2012)使用小波分析沪深300指数序列分解为1个高频序列和3个低频序列,将四个分解序列作为神经网路输入变量进行建模预测。

上述工作都力求运用不同的方法分析以及预测金融时间预测,但是也有存在着一些不足:一、基于神经网络股价预测缺乏合理的数学可解释性,根据行为分析学对投资者“完全理性”的假设,投资者无法依据解释的信息作出决策;二、以上几乎所有模型均采用全局模式(将所有的数据用于模型的建立)进行预测或分析。从技术角度而言,基于全局模型的预测方法通常采用单一的预测模型进行复杂时间序列建模。但针对一个变化异常复杂的非线性、非平稳序列,很难以使用单一的预测模型进行预测。而复杂时间序列潜在的内部规律往往是随时间变化而不断变化的,所构造的预测模型也应该追踪这种变化,所以一般情况下全局预测模型的更新计算代价很高。此外,对海量时间序列数据进行全局建模时建模的速度很慢。三、从效用性出发,作为指导投资者做出决策的重要依据,上述模型均给出了未来预期股价的变化区间,但是投资者的实际需求是何时买入或卖出股票而不是关注未来股价的具体数值。本发明公开了一种基于图形特征库的决策股价趋势洞察方法,旨在通过股票交易历史数据构建股票价格或标准化映射后的图形特征库,待预测股票通过标准化、基于小波去燥平滑化后,采用动态时间归整算法将待预测股票与图形特征库中的图形进行相似性计算,并引入决策算法用相似的图形来预估目标股票未来的股价。其中,图形特征库的最小化构建直接影响股票价格预测的精度与效率,且该问题是NP难题。本发明提出一种基于贪心策略的启发式算法来实现对图形特征库最小化的近似,能够根据金融数据的增量变化对图形特征库中的图形基进行自适应地调整。

本发明的目的在于克服现有技术中存在的上述问题,提供一种基于图形特征库的决策股价趋势洞察方法(AGroup Decision Method of Insighting into Stock PriceTrend Based on Graphic Feature Library)。

为实现上述技术目的,达到上述技术效果,本发明通过以下技术方案实现:

一种基于图形特征库的决策股价趋势洞察方法,包括:

1)候选图形特征库的构建:本专利使用已有的股票图形来预测股票价格未来的走势。候选图形特征库的构建包含两个方面,其一是将股票数据进行标准化映射;其二是选取有代表性的股票走势图形组建图形特征库。候选图形特征库通过以下步骤进行构建:

步骤a:将股票交易数据做标准化映射。选取函数F(S,Γ)将股票日线交易数据S(O,H,L,C,V) (其中O代表股票开盘价, H 代表当日股价最高值,L代表当日股价最低值,C代表股票收盘价,V代表股票交易量)进行标准化映射,其映射后的曲线集合为Γ,相应地将Γ称作F下的特征图形;

步骤b:将每一只股票Si的日线交易数据进行划分。给定时间阈值窗口大小为T,记录其最大值和最小值所对应的交易日TH和TL:若TH>TL,则以TH为起点向后查随后的最小值所对应的交易日TL'(若TL'等于时间窗口的终端Wend则将时间窗口向后扩展X个单位时间,直至TL'<Wend )并将TL和TL'之间的股票交易数据作为候选特征库图形,然后将时间窗口的起点Wstart滑动到TL'+1;若TL>TH,则以TL为起点向后查随后的最大值所对应的交易日TH'(若TH'等于时间窗口的终端Wend ,则将时间窗口向后扩展X个单位时间,直至TH'<Wend )并将TH和TH'之间的股票交易数据作为候选特征库图形,然后将时间窗口的起点Wstart滑动到TH'+1;重复执行该步骤,直至时间窗口的终点Wend大于该股票交易数据序列的终端数据所对应的交易日;

步骤c:迭代地执行步骤b,直至所有股票的日线交易数据被划分结束,形成候选特征库图形库;

2)图形平滑化处理:本专利采用小波去噪方法对时间序列进行平滑处理;图形平滑化主要包括以下步骤:

步骤d:小波函数选择。根据金融数据对小波紧支撑性、支撑宽度、对称性、正交性、消失矩的要求选择最适合的小波函数;

步骤e:分解层数的选择。根据多分辨率分析理论,分解层次越高, 去掉的低频成分越多,去噪效果越明显, 但失真度也相应增大;反之,分解层次越低,则难以达到图形平滑化的效果。由于本专利的目的旨在部分去除白噪声的干扰, 因此为提高图形准确性,分解层次不宜太高。为此,本专利通过对候选图形库进行采样,测试样本在不同分解层数的信息损失,从中选择合适的小波分解层数;

3)图形特征库最小化:图形特征库最小化旨在剔除库中冗余的图形特征,使得在随后的图形决策中消除非独立图形的干扰。然而图形特征库最小化问题是一个NP-hard问题,因此本专利提出一个基于贪心策略的启发式算法来实现对图形特征库最小化的近似,步骤如下:

步骤f:若图形特征库为空,则在候选图形特征库中任选一个图形直接放入图形特征库;若图形特征库不为空,则将利用动态时间归整算法(Dynamic Time Warping,DTW)计算该图形与图形特征库中已有图形的相似性,若不存在相似性高于阈值ε,则将该目标图形加入图形特征库;若存在相似性高于阈值ε且相似性高于阈值ε的个数大于1,则将该目标图形加入图形特征库并将相应的相似性高于阈值的预入库图形移除;

4)基于决策理论对待判别的股票价格运行趋势进行预测:

步骤g:给定待预测的股票,分别与图形特征库中的所有图形进行DTW相似性计算,通过决策算法对股票未来的趋势进行投票,并最终得出该股票价格趋势的预测。

本发明的有益效果是:

本发明针对股票价格趋势预测问题,提出一种基于图形特征库的决策股价趋势洞察方法,通过构建图形特征库,形成股票图形基,采用DTW算法对目标股票价格序列进行相似性计算,并利用决策算法预测股票价格的运行趋势;为提升图形特征库的普适性与泛用性,对股票价格实施标准化映射并通过小波函数对其进行平滑化处理。本专利所提方法具有很强的现实指导性,图形特征相似性比较直观,并为广大投资者所接受和认可,而不像人工神经网络等机器学习算法是一个黑箱的模型,投资者完全无法理解其内在机理。投资者可以通过查询一个特定图形在较短的时间内得到所有与该股票形态相近的历史形态,并通过对历史数据的挖掘来预估当前股票价格的运行趋势。

当然,实施本发明的任一产品并不一定需要同时达到以上的所有优点。

为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图:

图1为四种阈值去噪方法分析比较图;

图2为基于小波阈值去燥基本步骤示意图;

图3为不同种类小波函数特性图;

图4为四种投资方法在股价趋势预测准确率方面的对比图;

图5为四种投资方法在股票交易数据增量叠加60个单位时间后股价趋势预测准确率方面的对比图;

图6为四种投资方法在股价正负1%区间准确率方面的对比图;

图7为四种投资方法在股票交易数据增量叠加60个单位时间后股价正负1%区间准确率方面的对比图。

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。

本文发布于:2024-09-24 04:26:16,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/1/72496.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议