基于主成分(pca)与思维进化(mea)优化神经网络算法的股票预测

基于主成分(pca)与思维进化(mea)优化神经⽹络算法的股票预测
这是⼀篇科研论⽂的实证模仿求解,由于数据量不是很⼤,可能存在过拟合的情况,过拟合的处理就⽐较⿇烦了,嘿嘿,我们暂时忽略这个,后期出⼀个专门处理过拟合与⽋拟合处理,欢迎⼤家浏览,⼤家⼀起进步学习,*源码和源数据这我这⾥,需要可以留⾔。*
⼀、数据的选择
1.数据来源—-取值国泰安或者同花顺
训练样本与检验样本的选取(检验样本需要包括10⽉30⽇数据)
⼆、数据预处理
在科学研究中,经常要将多变量样本提供的信息进⾏相关研究,但在许多情况下,各个变量之间不是独⽴的,它们之间存在或⼤或⼩的相关性。这不仅使研究变得复杂,还可能使研究结果不理想。在这⼀点上,我们需要⼀个减少变量个数的降维⽅法,不能使⽤盲⽬的主观的消除,主成分分析是分散的⼀组变量的数据,关注⼏个综合指标统计数据的探索性分析⽅法。利⽤降维的思想,多个变量为少数⼏个不相关的主成分,从⽽描述数据集的内部结构,所以都达到降维的⽬的,并可以在更⼤程度上保持数据完整性。
1.主成分分析(分别对交易类指标和基本⾯指标进⾏降维再综合)
主成分分析(principal component analysis)是1901年Pearson对⾮随机变量引⼊的,1933年Hotelling将此⽅法推⼴到随机向量的情形,主成分分析和聚类分析有很⼤的不同,它有严格的数学理论作基础。
中国3d电视试验频道
主成分分析的主要⽬的是希望⽤较少的变量去解释原来资料中的⼤部分变异,将我们⼿中许多相关性很⾼的变量转化成彼此相互独⽴或不相关的变量。通常是选出⽐原始变量个数少,能解释⼤部分资料中的变异的⼏个新变量,即所谓主成分,并⽤以解释资料的综合性指标。所以,主成分分析实际上是⼀种很好降维⽅法。
1.1输⼊向量的确定灰童谣
本⽂拟将19个交易指标和12个基本⾯指标运⽤SPSS做主成分分析,分析步骤和结果如下:
(l)输⼊原始数据⾄SPSS,将其标准化。
(2)将标准化后的数据做主成分分析,输出的部分结果如下表:
表1.1 交易指标主成分分析表
表1.2 基本⾯指标主成分分析表
趋势分析上表中第⼀列数据为各主成分对应的特征值,第三列为各主成分的累积⽅差贡献率。
为保证原始数据的完整性,本⽂在选取主成分个数时不拘泥于特征值⼤于1和累积⽅差贡献率⼤于80%的⼀般准则。由此我们从交易指标数据中提取4个主成分,从基本⾯指标数据中提取7个主成分。
A.碎⽯图
表 19个交易指标碎⽯图r2v
表 12个基本⾯指标碎⽯图
B.主成分系数表
将以上数据带⼊SPSS中,将每⼀列的数据除以主成分相对应的特征值的平⽅根便可得到各主成分中每个指标所对应的系数。系数矩阵如表1.3:
表1.3交易⾯指标主成分系数表
表1.4 因⼦得分
将表中每个指标所对应的系数与各指标相乘后求和即得到主成分⽉ 11个主成分的函数表达式。
上述式中表⽰原始变量经标准化后的数据,
2.数据归⼀化处理
归⼀化的⽅法是什么,公式,MATLAB的实现代码 本⽂采⽤的数据归⼀法为最⼤最⼩法,函数形式如
下:
式中,xmin为序列中的最⼩数;xmax为序列中的最⼤数。
在案例中,归⼀法函数采⽤Matlab⾃带函数mapminmax实现,其代码表达式为:
%% 归⼀化
% 训练集
[Pn_train,inputps] = mapminmax(input_train);
Pn_test = mapminmax(‘apply’,input_test,inputps);
% 测试集
[Tn_train,outputps] = mapminmax(output_train);
Tn_test = mapminmax(‘apply’,output_test,outputps);
新标准英语第七册
三、训练过程与模型的确定
1.隐含层数确定
选取⼀个隐含层的原因:
1989年,RoberHecht-Nielsen证明了对于任何闭区间内的⼀个连续函数都可以⽤⼀个隐含层的BP⽹络来逼近。因⽽,⼀个3层的BP⽹络可以完成任意的n维的映射。只有学习不连续函数时才需要两个隐含层,故⼀般情况下最多需要两个隐含层。并且,为了更加与实际⽣活接轨,我们选取单隐含层,多⼀层⽹络复杂度会增加很多,运⾏时间加长,代码效率下降,当运⽤调试好的⽹络时候,达不到⾼效的⽬的,在保证预测精确度的前提下,选⽤单隐含层⽹络。
2.误差与迭代次数设定
力学与实践
初始设定 ⽬标迭代次数10000,训练⽬标最⼩误差0.001
3.隐含层节点数确定
隐层节点数的确定是神经⽹络设计中⾮常重要的⼀个环节,⼀个具有⽆限隐层节点的两层BP⽹络可以实现任意从输⼊到输出的⾮线性映射。但对于有限个输⼊到输出的映射,并不需要⽆限个隐层节点,
这就涉及到如何选择隐层节点数的问题,⽽这⼀问题的复杂性,使得⾄今为⽌尚未到⼀个很好的解析式,隐层节点数往往根据前⼈设计所得的经验和⾃⼰进⾏试验来确定。⼀般认为,隐层节点数与求解问题的要求、输⼊输出单元数多少都有直接的关系。⽽且,隐层节点数过少,则⽆法产⽣⾜够的连接权组合数来满⾜若⼲样本的学习;隐层节点数过多,则学习以后⽹络的泛化能⼒变差。
先根据隐含层公式求解出最有隐含层范围,先采⽤经验公式求出最佳隐含层的⼤致范围,然后,在保证⽹络结构,学习效率=0.1的前提下,每个隐含层训练6次求出每个隐含层下的⽹络性能,⽐较得到最优隐含层

本文发布于:2024-09-21 22:13:42,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/50624.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:成分   指标   分析   隐含   节点   数据   隐层
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议