基于神经网络预测方法

     
    目: 基于神经网络预测方法在 
      投资统计数据分析中的应用
    院:         
    业:         
    级:  1                  
学生姓名:               
    号:           
指导教师:             
基于神经网络预测方法在投资统计数据分析中的应用
甘氨酸亚铁摘要:基于主成分-神经网络预测模型,并将该预测模型应用于社会固定资产投资统计数据分析。研究对象时统计年鉴中按照行业分固定资产投资统计数据,该数据含有中国31个省直辖市自治区从2003年至2012年来的社会固定总资产数据,每个样本有农林牧渔业、采矿业等十九个变量数值,通过对建立神经网络模型用于预测201331个省直辖市自治区的社会固定资产投资数据,并将该数据与2013年的真实数据作对比,研究基于神经网络的预测算法在本文数据分析中的应用,同时,与线性预测方法作对比,发现主成分-神经网络预测算法效果比较好.通过我所引用的文章,既了解了社会固定资产投资方面的知识,又学习了数据挖掘中的预测算法.
关键词:主成分分析,预测,神经网络,数据挖掘
1. 前言
1.1  选题背景
2013年,面对错综复杂的国内外形势,党中央、国务院团结带领全国各族人民深入贯彻落实党的十八大精神,坚持稳中求进工作总基调,坚持宏观政策要稳、微观政策要活、社会
政策要托底的思路,统筹稳增长、调结构、促改革,探索创新宏观调控方式,经济社会发展稳中有进、稳中向好,实现了良好开局.2013年的统计数据来看,2013年我国的国内生产总值(GDP)增速比较平稳,其中,在第一季度增长了百分之七点七,在第二季度增长了百分之七点五五,在第三个季度增长率百分之七点七,由第二季度的GDP增速下降再到第三季度的GDP增速的回升,最后使得GDP增速又达到百分之七点七,趋于稳定.
注:2012年国内生产总值增速为初步核实数,2013年为初步核算数。
1 国内生产总值同比增增长速度
    以“政商重构 市场还权”为主题的2014网易经济学家年会夏季论坛中,全国政协常委、经济委员会副主任,工业和信息化部原部长李毅中在会上表示,2013年,当年的投资和GDP的比例大76.7%,而这个比例“十一五”是59.5%,“十五”是41.58%,“九五”是32.83%,随着时间的推移,固定资产投资和当年GDP的比例是越来越高,高达76%.
2013年,全年固定资产投资(不含农户)436528亿元,比去年增长19.6%(扣除价格因素实际增长19.2%),实际增速比去年略微回落0.1个百分点.
分行业看,第一产业投资9241亿元,同比增长32.5%,增速比1-11月份加快0.8个百分点;第二产业投资184804亿元,增长17.4%,增速加快0.1个百分点;地酸产业投资242482亿元,增长21%,增速回落0.5个百分点。第二产业中,工业投资181864亿元,增长17.8%,增速回落0.1个百分点;其中,采矿业投资14750亿元,增长10.9%,增速回落1.1个百分点;制造业投资147370亿元,增长18.5%,增速回落0.1个百分点;电力、热力、燃气及水的生产和供应业投资19744亿元,增长18.4%,增速加快0.7个百分点.
2 近几年全社会固定资产投资
全社会固定资产投资是全世界都在研究的课题之一,它的英文翻译为Total Investment in Fixed Assets.全社会投资和全社会固定资产投资是两个不同的概念,全社会投资包括社会固定资产投资和全社会不固定资产投资两个方面,而这里研究的是全社会固定资产投资.
全社会固定资产投资的具体定义是指用货币的形式来表现的建造固定资产活动和购置固定
油酸甲酯资产活动方面的工作量,它是一种综合性的指标,反映的主要是全社会的固定资产投资的规模,全社会的固定资产投资的速度,全社会的固定资产投资方面的比例关系,全社会的固定资产投资相关的使用方向。它的本质是指反映固定资产投资方面的相关的信息.
1.2 选题来源
左拉
本文的选题数据来源于《2014年中国统计年鉴》[1],该年鉴统计了中国自改革开放以来三十多年的汇总多方面的经济数据,并且按照时间、按照地区等多方面划分来研究中国的经济数据.
1.3 数据挖掘
数据挖掘[2] [3]是一门综合性的研究学科,它综合了数学知识、概率知识、数据库知识、生物知识等各种学科的交叉学科,并且在当前社会的经济、数学、生物、科学等多方面的领域里均有着广泛的应用.
四月的声音
预测[4]-[7]在我们目前的社会生活中有着广泛的应用。预测是数据挖掘中的重点知识之一,
预测就是利用我们目前的数据和现有的条件来预测将来的数据,从而为当前我们需要了解的信息提供大概的动向和趋势。预测在数据挖掘中有着很多的预测算法,包括线性预测算法,神经网络预测算法,灰序列预测算法等多种预测算法.
2 理论知识介绍
2.1 线性预测算法
线性预测算法是预测算法中的一种常用的预测算法,它主要是利用数据之间线性的关系建立起来的一种线性预测的算法,满足线性预测算法的数据模型一般数据呈现线性关系.
2.2 几种神经网络预测算法
神经网络预测算法是通过神经网络的算法来达到预测的目的。神经网络是生物学中的知识,通过神经细胞里各种结构来模拟当前的数据信息,从而建立模型来传递数据信息的目的.
3 人工神经网络
下面主要介绍几种神经网络算法,包括BP神经网络算法、RBF神经网络算法.
BP[8-10]神经网络算之神经网络算法是神经网络算法中常用的一种算法,它包含有两个阶段,一个是正向的数据传播的阶段,另一个是反向的误差反馈的阶段.
    BP神经网络算法重点在于它的双向性,将样本进行参数处理后进行学习训练,经过网络训练学习,从而计算误差函数陈运泰E,判断误差是否收敛,如果收敛则输出权重,如果不收敛,
则继续计算权重然后进行网络训练学习再计算误差函数E,直到误差函数收敛为止。输出权重后,赋值给中间层和输出层之间的权值,从而进行实现预测算法。正向的传递是数据信息的传递,反向的传播是计算误差函数收敛的传递.
    RBF [11-13神经网络算法是指径向基函数神经网络算法,它主要是利用径向基函数作为其节点的阶段函数,从而达到预测的目的.
    RBF神经网络的英文全称为Radial Basis Function Neural Network,它包含有三个级别的层次,第一层为输入层,把数据样本的信息作为输入层。第二次为隐含层,隐含层的计算函数为径向基函数,它使用平滑的曲线进行计算,有利于计算权值,从而将神经网络的学习过程训练更好。第三层为输出层.
径向基函数的表达式为:,最常用的为高斯函数,表达式如下:
                 
其中为实数常数,且>0. =2的高斯函数是傅里叶变换的特征函数.
2.3 主成分分析
主成分分析[14-16]的英文全称为Principal Component Analysis,因此,主成分分析可以简写为PCA .
    主成分分析是指将数据从高维通过数据的计算映射到低维数据信息的过程。它一般从一个维度映射到另一个维度,通过线性代数的方式来体现两种维度之间的关系.
    主成分分析就是利用少数变量来表示多种变量之间的过程,它将信息进行压缩,将冗余信息去除,通过线性代数的方式来体现主成分和变量之间的关系.
建立主成分-神经网络模型的具体方法如下:
1)对数据进行预处理。由于一般的数据信息存在着缺项或者零信息,在数据计算的时候带来不方便,所以要对数据先进行预处理,即,使用数据计算的方式将数据信息映射到同一个范围内或者可以比较的范围内.
2)对数据进行主成分分析。将进行预处理后的数据进行主成分分析,达到降维的目的,从而得到主成分分析的结果.
3)将得到的主成分结果进行神经网络预测。在神经网络算法中,一般包含有输入层和输出层,将得到的主成分结果作为神经网络的输入层进行计算,按照神经网络自身的算法进行预测,得到预测结果.
将主成分-神经网络预测模型表示为流程图,见图4.
     
4 主成分-神经网络预测模型
基于主成分-神经网络的预测模型,先通过SPSS软件进行主成分分析,然后再通过MATLAB编写代码来实现该预测模型.
3. 多种预测方法在社会固定资产投资统计数据分析中的应用
肌酸酐3.1 社会固定资产投资数据
2014年中国统计年鉴》是中华人民共和国国家统计局出版的统计年鉴,统计了中国自八十年代以来在各个方面的经济数据,从2014年中国统计年鉴显示的统计数据可以透视出中国很多的经济数据和经济发展情况,对研究我国的经济发展有着重要的作用.
社会固定资产投资统计数据包含有年份,合计以及农林牧渔业、采矿业等十九个变量,年份是从2003年到2013年,中国统计年鉴统计的19个变量从19个不同的行业来划分各个行业的全社会固定资产投资.
文章针对的是《中国统计年鉴》中的社会固定资产投资统计数据,及全国31个省、直辖市、自治区的2002年至2012年的社会固定资产投资方面的统计数据预测全国31省、直辖市、自治区的2013年的社会固定资产投资数据,并与实际的2013年的31个省、直辖市、自
治区实际数据作比较,建立不同的预测模型.
3.2 线性预测模型在统计数据分析中的应用
将统计数据中的数据信息进行多元线性回归计算。文章采用的是多元线性回归模型。对数据建立多元线性回归模型,对数据进行预测.
文章采用的方法是使用SPSS软件来实现多元线性回归方法.
多元线性回归是建立因变量和多个自变量之间的线性关系,在文章中,因变量是来年的社会固定资产数据,自变量是31个省直辖市自治区本年度的变量,包括农林牧渔业、采矿业等十九个变量。31个省直辖市自治区本年度的社会固定资产投资统计数据,见附录.
经过建模,使用多元线性回归方法中的进入法进行多元线性回归,将十九个变量移去一些,排除制造业、电力热力燃力及水生产和供应业等十三个变量,见表1.
建立的多元线性回归模型保留了农林牧渔业、采矿业、建筑业等六个变量,建立模型如表3所示

本文发布于:2024-09-20 22:42:01,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/233165.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:预测   数据   投资   社会   神经网络   算法   进行   线性
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议