基于迁移学习的分层注意力网络情感分析算法

数字信号处理系统
文章编号:1001 ̄9081(2018)11 ̄3053 ̄04DOI:10.11772/j.issn.1001 ̄9081.2018041363基于迁移学习的分层注意力网络情感分析算法
曲昭伟1王㊀源1∗王晓茹2
体育学刊1.北京邮电大学网络技术研究院北京100876 ㊀2.北京邮电大学计算机学院北京100876
∗通信作者wyuan@bupt.edu.cn
摘㊀要:文本情感分析的目的是判断文本的情感类型ꎮ传统的基于神经网络的研究方法主要依赖于无监督训练的词向量ꎬ但这些词向量无法准确体现上下文语境关系ꎻ常用于处理情感分析问题的循环神经网络(RNN)ꎬ模型参数众多ꎬ训练难度较大ꎮ为解决上述问题ꎬ提出了基于迁移学习的分层注意力神经网络(TLHANN)的情感分析算法ꎮ首先利用机器翻译任务训练一个用于在上下文中理解词语的编码器ꎻ然后ꎬ将这个编码器迁移到情感分析任务中ꎬ并将编码器输出的隐藏向量与无监督训练的词向量结合ꎮ在情感分析任务中ꎬ使用双层神经网络ꎬ每层均采用简化的循环神经网络结构  最小门单元(MGU)ꎬ有效减少了参数个数ꎬ并引入了注意力机制提取重要信息ꎮ实验结果证明ꎬ所提算法的分类准确率与传统循环神经网络算法㊁支持向量机(SVM)算法相比分别平均提升了8.7%及23.4%ꎮ关键词:情感分析ꎻ循环神经网络ꎻ迁移学习ꎻ分布式表示ꎻ注意力机制
中图分类号:TP389.1㊀㊀文献标志码:A
电子管风琴
高中英语写作教学
Transferlearningbasedhierarchicalattentionneuralnetworkforsentimentanalysis
QUZhaowei1WANGYuan1∗WANGXiaoru2
1.InstituteofNetworkTechnology BeijingUniversityofPostsandTelecommunications Beijing100876China
陇东学院学报2.CollegeofComputerScience BeijingUniversityofPostsandTelecommunications Beijing100876ChinaAbstract Thepurposeofdocument ̄levelsentimentanalysisistopredictusers sentimentexpressedinthedocument.Traditionalneuralnetwork ̄basedmethodsrelyonunsupervisedwordvectors.However theunsupervisedwordvectorscannotexactlyrepresentthecontextualrelationshipofcontextandunderstandthecontext.RecurrentNeuralNetworkRNN gene
rallyusedtoprocesssentimentanalysisproblemshascomplexstructureandnumerousmodelparameters.Toaddresstheaboveissues aTransferLearningbasedHierarchicalAttentionNeuralNetworkTLHANN wasproposed.Firstly anencoderwastrainedtounderstandthecontextwithmachinetranslationtaskforgeneratinghiddenvectors.Then theencoderwastransferredtosentimentanalysistaskbyconcatenatingthehiddenvectorgeneratedbytheencoderwiththecorrespondingunsupervisedvector.Thecontextualrelationshipofcontextcouldbebetterrepresentedbydistributedrepresentation.Finally atwo ̄levelhierarchicalnetworkwasappliedtosentimentanalysistask.AsimplifiedRNNunitcalledMinimalGateUnitMGU wasarrangedateachlevelleadingtofewerparameters.Theattentionmechanismwasusedinthemodelforextractingimportantinformation.Theexper
imentalresultsshowthat theaccuracyoftheproposedalgorithmisincreasedbyanavervageof8.7%and23.4%comparedwiththetraditionalneuralnetworkalgorithmandSupportVectorMachineSVM .
存在主义哲学Keywords sentimentanalysis RecurrentNeuralNetworkRNNtransferlearning distributedrepresentation attentionmechanism
㊀㊀随着互联网技术的发展和社交网络的普及ꎬ越来越多的用户选择在社交网站上发表自己的观点ꎬ产生了大量的评论信息ꎬ这些评论信息表达了用户的情感彩和情感倾向性ꎬ因此ꎬ通过对评论文本进行情感分析可以判断评论文本中的情感取向ꎬ应用于市场分析以及相关产品推荐上ꎮ
1㊀相关工作
文本情感分析又称为观点挖掘ꎬ利用自然语言处理㊁文本分析等方法对带有情感彩的文本进行分析㊁处理㊁推理和归纳[1]ꎮ
情感分析方法主要有基于情感词典匹配的方法以及基于机器学习的方法ꎮ随着深度学习逐渐成为自然
语言处理领域研究热点ꎬ利用深度学习的方法解决情感分析问题的技术飞速发展[2]ꎮ在自然语言处理领域ꎬ例如循环神经网络(RecurrentNeuralNetworkꎬRNN)等深度神经网络在处理情
感分析问题时具有明显优势ꎮ长短期记忆网络(LongShort ̄TermMemoryꎬLSTM)可以捕捉到评论语句中的长期依赖关系ꎬ从整体上理解文本的情感语义ꎬ与卷积神经网络(ConvolutionalNeuralNetworkꎬCNN)相比ꎬRNN更适合处理序列信息ꎮLi等[3]研究了树结构的LSTM网络ꎻCho等[4]提出了门循环单元(GatedRecurrentUnitꎬGRU)ꎬ与LSTM网络相比ꎬ具有更少的参数ꎻRavanelli等[5]将一种加权循环单元应用于语音识别领域ꎬ实验结果证明该结构具有较好的语音识别效果ꎮ
JournalofComputerApplications
计算机应用2018 38 11 3053-3056 3062㊀ISSN1001 ̄9081
CODENJYIIDU㊀
2018 ̄11 ̄10
http //www.joca.cn
㊀㊀收稿日期:2018 ̄04 ̄29ꎻ修回日期:2018 ̄06 ̄28ꎻ录用日期:2018 ̄07 ̄05ꎮ㊀㊀基金项目:国家自然科学基金资助项目(61672108)ꎮ
㊀㊀作者简介:曲昭伟(1970 )ꎬ男ꎬ吉林辽源人ꎬ教授ꎬ博士ꎬ主要研究方向:数据挖掘㊁人工智能ꎻ㊀王源(1994 )ꎬ女ꎬ吉林长春人ꎬ硕士研究生ꎬ主要研究方向:人工智能㊁深度学习ꎻ㊀王晓茹(1980 )ꎬ女ꎬ北京人ꎬ副教授ꎬ博士ꎬ主要研究方向:计算机视觉㊁人工智能ꎮ

本文发布于:2024-09-22 07:04:54,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/413142.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:情感   分析   神经网络   文本
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议