基于遗传算法优化的BP神经网络在考研结果预测中的应用

黑铉语言信麵与电睡
China Computer & Communication2021年第1期基于遗传算法优化的B P神经网络考研结果
预测中的应用
李驰
(四川大学锦城学院计算机科学与软件工程系,四川成都611731)
摘要:通过遗传算法先对BP神经网络的初始权值和阈值进行优化后,再将BP神经网络用于考研结果的预测模型中。实验表明,这种优化后的预测模型因为克服了收敛速度慢、易产生局部最小等缺陷,比单纯使用BP神经网络建立的预测 模型准确度更高。将这个预测模型用于考研报名之前供学生预测参考,方便学生做出合理的决策,具有一定的实际意义。
关键词:考研;预测;BP神经网络;遗传算法
中图分类号:TD712 文献标识码:A文章编号:1003-9767 (2021) 01-038-04
Application of BP Neural Network Based on Genetic Algorithms Optimization in Prediction of Postgraduate Entrance Examination
神经网络预测
LI Chi
(Department of Computer Science and Software Engineering,Jincheng College of Sichuan University,Chengdu Sichuan611731, China) Abstract:F irs tly,the in itia l weight and threshold of BP neural network are optimized by genetic algorithm,and then BP neural netw ork is used in the pre diction model of the results o f the postgraduate entrance exam ination.The experim ent shows that the optim ized prediction model overcomes the shortcomings o f slow convergence speed and easy to produce local m inim um,so it is more accurate than the pre diction model established by BP neural network alone.This pre diction model can be used as a reference for students to make a reasonable decision before applying fo r postgraduate entrance examination.
Key words:postgraduate entrance exam ination;prediction;BP neural network;genetic algorithms
〇引言
随着社会对于高素质知识型人才的需求越来越迫切,我 国报考研究生的人数呈现逐年大幅増加的趋势。最近几年的 数据显示,研究生的录取比例始终维持在1/3左右。考研作 为一种个人的教育投资,虽然会得到预期的考研收益,但是 无形中也会耗费许多时间、金钱和精力,这就是所谓的“考 研机会成本”。做出考研与否的决策之所以有一定风险,是 因为考研是否成功是一个不确定的结果。一方面,
每年2/3 考研失利的学生如果能够提前预测考研失利的结果,当初就 不会参加考研了,而是把多余的时间精力用于准备就业等其 他更重要的事情上去;另一方面,少部分学习能力较强但因 为缺乏自信本来可以考研成功但没有选择考研的学生如果能 够提前预测到考研成功的结果,肯定就选择报考了。虽然这 种100%的提前预测考研结果是不可能做到的,但是可以通 过建立一些计算模型尽可能提高这种预测的准确性。
近年来,已有一些文献在研究关于考研结果预测的问题,例如李春林、李国昌等分别从博弈论和体特性上对是否应 该参与考研进行了理论上的定性分析,但缺少定量的数据支 撑[12]。张凤霞等利用支持向量机技术对考研问题进行了预测,但主要是对选择考研还是就业的决策进行预测,而不是对考 研成功与否的结果本身进行预测。本文尝试利用基于遗传算 法优化的BP神经网络对考研成功与否的结果进行预测。
1 B P神经网络和遗传算法原理
1.1BP神经网络
神经网络系统中应用最多的当属BP神经网络,它的基 本思想是学习过程由信号的正向传播与误差的反向传播两个 过程构成。正向传播时,输人样本从输入层传入,经过各隐 层处理后,传向输出层。当实际输出与期望值有误差时,转 向误差的反向传播阶段。误差反传将误差通过隐层向输人层 逐层反传,
并在各层分摊误差,这些误差即作为修正各单元 权值的依据[3]。以上过程将循环执行,直到满足某个收敛条件。
作者简介:李驰(1974—),男,四川成都人,硕士研宄生,副教授。研宄方向:软件开发、信息安全、智能信息处理、机器学习。
2021年第1期
n与电雇
China Computer & Communication算语言
下面简单介绍一下典型的三层BP神经网络的算法。所谓三 层包括输人层、隐层和输出层,如图1所不〇
XQ X\X2…Xi…Xn] Xn
图1三层BP神经闲络
其中,
JO7"为隐层输出向量,〇=(〇,,〇2,…,为输出层输出向 量,扣W2,…A...为期望输出向量,7、酽分别为隐层 和输出层的权值向量。
对于输出层和隐层分别有:
m
〇*=/(E w,>v)(i) J=〇
y j=f(L vj xi)(2) i=0
其中,变换函数办)均为单极性Sigmoid函数。
网络输出与期望值的误差可以定义为:
E^i(dk-f(±w/kf(±vpXi))f(3) L k=l y=0^=0
由公式可以看出,此误差是各层权值%、々的函数,因此调整权值可以改变误差。为使此误差不断减小,应使权值 调整量与误差的梯度下降成正比。根据这个思路,对BP算 法推导(详细过程略),得出结论:
Aw;*=lSkyj=7](dk-ok)ok{\-ok)yj(4) l
Av=7^.(5)
从以上公式可以i出,每一层权值调整量都等于学习率 々、局部梯度厶或者各和上一层输出信号乃或者;c,■三者的乘积。同时,每一层局部梯度的计算都要用到上一步计算的结果,即前一层的局部梯度是后一层局部梯度的加权和。1.2遗传算法
遗传算法是一种模仿自然界生物进化机制发展起来的随 机全局搜索和优化方法。它能在搜索过程中自动获取积累有 关搜索空间的知识,并自适应控制搜索过程以求得最优解。
遗传算法的步骤如下。第一,染体编码。标准遗传算 法对初始体中各个个体的基因采用固定长度的二进制符号 串进行编码。第二,个体适应度的检测评估。算法将适应度 函数作为评判个体优劣的唯一标准,它与目标函数有关,必 须为非负数。第三,遗传算子操作。这个步骤包括3个算子 操作,分别是选择、交叉和变异。这3个子步骤将一直循环
迭代,直到满足某个收敛条件才停止。
2遗传算法优化B P神经网络的详细设计
2.1遗传算法优化B P神经网络的思路
每种智能算法都有自身的优缺点及其对应的适用场合。
B P神经网络能实现一个从输人到输出的映射功能,它具有实 现任何复杂非线性映射的功能,同时也具有自学习、泛化和 容错能力,这使得它特别适合于求解内部机制复杂的问题。遗传算法非常适合用来求解最优化问题〇
单纯使用BP神经网络来预测模型容易产生收敛速度慢、产生局部最小值和初始权值阈值不好确定等问题。所以,本 文的思路是先利用遗传算法的全局搜索能力确定出最优的BP 神经网络权值和阈值范围,再利用BP神经网络进行局部最 优解的搜索。
2.2BP神经网络的具体设计
2.2.1输入节点的确定
影响考研结果的因素有很多,包括主观因素、客观因素、环境因素和自身因素等。为简化W,本文选取了 5个最重要的 因素,側是专业深《、数学成绩、英语成绩、髙考成绩和报 考因素。其中,专业课成绩和数学成绩都以平均值为准;英语成
绩通过六级的设为90分,通过四级考试的为75分,没有过四级
的为60分;高考成绩为超过录取线的相对分数;报考因素满分 为100分,每出现下列因素扣去10分:报考985或者211重点 大学、跨省、跨专业、报考热门专业。截据样本举例如表1所示。
表1部分输入样本数据
Student Number Professional Course Score^lglish Score College Entrance Examination Scores Register Factor Pubmed Results 185877512100failure 27982901790success 3837760970failure 47279602180failure 58180751380failure 2.2.2网络结构的确定 /为输出节点数即1,«为1~ 10的常数)可以取为6。
采用典型的三层B P神经网络,由于模型是一个判断考    2.2.3归一化处理
M否成功I分类所点数U含层f为避免不醜理意义和不同量纲的数据縣的重要地位点数根据经验公式w=+a(其中,w为输人节点数即5,不同,同时也为了防止产生净输入绝对值过大引起的神经元
-0 4
-0.6
30
35
0.05 • /
-
°0    5
10
15
20
25 30
Epochs
图2
迪传算法的适应度曲线
将在遗传算法中获得的最优权值阈值作为初始值代人
BP 神经网络训练,使用平方差求和作为误差参数,在第19
次迭代后基本收敛。而作为对比,在保持相应参数不变的情 况下,仅使用BP 神经网络建立模型,模型在第50步后仍未 有完全收敛。收敛速度的对比结果如图3所示。另外,对优 化前后的47个样本进行了预测。用遗传算法优化的BP 神经 网络能正确预测40个结果,预测精度为85.11%;单独使用
BP 神经网络能正确预测38个结果,预测精度为80.85%。由
于该模型是一个二值分类问题,当实际输出误差大于0.5时, 预测失败。预测精度的比较结果如图4示。
据包括47人,其中考研成功的11人。
首先,根据经验在[-1,1]内随机产生43个权值阈值作为 初始值并进行实数编码。利用遗传算法对其进行优化,如图 2所示,在第26次迭代之后适应度曲线趋于平稳,说明此时 已经获得了最优个体。
genetic algorfthms
D.3fiy~------------------------------------9- - _^_—-----------------II
0.3
饱和现象,需要对数据进行归一化处理[4]。
其中,A 表示原始数据, 最大值和最小值。2.3遗传算法的具体设计和.
(6)
分别表示数据变化的
2.3.1编码
为提高精度和扩大搜索空间,本文选用实数编码。由于
BP 神经网络的结构为5-6-1,根据以上公式[5],对于要优化 的权值个数为5x 6+6x 1=36个,阈值个数为6+1=7个。于
是编码长度为36+7=43。2.3,2适应度
这里目标函数确定为误差平方和。由于目标函数为极小 值问题,所以采用倒数将目标函数转换为适应度函数。同时, 为了避免分母为零,在分母上加1[6]。
1 + [(
式_0,-)2
(7)
其中,4为第,个训练样本的期望输出,巧为第#个训练 样本的实际输出,夕为训练样本数。2.3.3选择
适应度越大的个体被选中复制到下一代的概率就越大, 本文采用最为常用的赌选择法:
Pr
(8)
!•/;
其中,《为种数,这里取10。2.3.4交叉
由于采用了实数编码,所以这里选用算数交叉算法' 交 叉概率为〇.7,第第位交^_的公式为:
\ajk =
ajk {\-b )+aikb
2.3.5变异
(9)
这里采用均勻变异法m ,即用符合某一范围均勻分布的 随机数以一较小的概率(这里取0.05)替换个体编码串中的 原有基因,新基因值为:
^
^
~
(1〇)
其中,和^分别为个体在>/位的最小值和最大值,
於为[〇,1]内均勻分布的随机数。
3结果与分析
本文将本校计算机学院最近7届学生的数据作为样本输
入模型,参加考研的一共137人,其中考研成功的31人。 将这些数据分为两组,
组为训练数据,包括90人参加考
研的学生,其中包含了考研成功的20人;另一组为测试数
BP v s  G A -B P
Epochs
图3
收敛逋度的比较结果
Comparison of the prediction arror
10
20
30 40 50
Samples
围4
预测精度的比较结果
• G A-BP
—*—B P
真饯语言
信■与电腦
China  Computer  & Communication
2021年第1期
J
0f c U J 1Q «J e n l >M  tu n
J
o t ul
2021年第1期
信懇与电胭
China Computer & Communication其技语言
4结语
通过将遗传算法用于优化B P神经网络的初始权值阈值,提高了预测模型的准确率和收敛速度。此预测模型用于考研 前的决策具有一定的参考意义,可以帮助学生在考研和就业 的两难决策中做出一个相对合理、明智的选择,以避免出现 本文开头提出的两种考研决策失误。当然模型的预测准确率 有待进一步提高。一方面,影响考研的主客观因素很多,这 就需要仔细甄别进行特征提取;另一方面,智能算
法中分类 算法还有很多,例如朴素贝叶斯分类法、决策树、支持向量机、K近邻法等,需要逐一对比精选。
参考文献
[1]李春林,万平.考研过程中的博弈分析[J].河北经贸大学
学报:综合版,2009(3):80-83.
[2] 李国昌,任笑良.成功考研大学生的体性特征分析[J].
中国地质大学学报:社会科学版,2013(1):145-148.
[3] 张凤霞,范丽亚,张凡龙.基于支持向量机的大学生考研
预测[J].聊城大学学报:自然科学版,2010(2):7-10.
[4] 韩力.人工神经网络教程[M].北京:北京邮电大学出版
社,2006.
[5] 仲云飞,梅一销,吴邦彬,等.遗传算法优化B P神经网络在
大坝扬压力预测中的应用[J].水电能源科学,2012(6):98-101. [6] 段侯峰.基于遗传算法优化B P神经网络的变压器故障诊
断[D].北京:北京交通大学,2008.
[7] 王志斌,孔亚楠,刘永成,等.遗传算法优化B P神经网络
的大功率L E D结温预测[J].光电子.激光,2014,7(25):1303- 1309.

本文发布于:2024-09-21 23:33:42,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/1/361738.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:预测   考研   神经网络
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议