针对突发公共事件的舆情监测与可视化分析

钢丝生产
第39卷 第6期吉林大学学报(信息科学版)Vol.39 No.62021年11月Journal of Jilin University (Information Science Edition)Nov.2021文章编号:1671⁃5896(2021)06⁃0712⁃08
针对突发公共事件的舆情监测与可视化分析
收稿日期:2021⁃05⁃25
基金项目:国家自然科学基金资助项目(61502052);吉林省科技计划基金资助项目(20200301054RQ;20200601004JC;20180101047JC)作者简介:赵剑(1980  ),男,长春人,长春大学教授,博士,主要从事网络空间安全㊁大数据分析与可视化㊁人机交互及人工智
能研究,(Tel)86⁃177****9007(E⁃mail)zhaojian@ccu.edu㊂
赵 剑a ,b ,董文华a ,b ,史丽娟c ,匡哲君b ,毕京晓b ,c ,王晢宇a ,b ,强文倩a ,b
(1.长春大学a.网络安全学院;b.计算机科学技术学院;c.电子信息工程学院,长春130022)
摘要:突发公共事件爆发导致的舆论传播给社会各界带来了重大困扰,为提前到舆情点,将舆论扼杀在摇篮中,构建了一套包含可视化分析结果和归因分析的体系㊂该体系以舆情事件为主题,利用数据采集技术,结合情感分析和文本处理的方法,对舆情信息进行监测和分析,通过实验证明该体系对突发公
共事件的分析是有效的㊂通过监测舆情过程中情绪波动变化情况,最终达到辅助政府决策的目的,为以后的突发公共事件的分析奠定基础㊂
关键词:突发公共事件;舆情分析;情感变化;可视化
中图分类号:TP391.1文献标识码:A
Public Opinion Monitoring and Visual Analysis for Public Emergencies
ZHAO Jian a,b ,DONG Wenhua a,b ,SHI Lijuan c ,KUANG Zhejun b ,
BI Jingxiao b,c ,WANG Zheyu a,b ,QIANG Wenqian a,b
(a.School of Network Security;b.School of Computer Science and Technology;c.School of Electronic Information Engineering,Changchun University,Changchun 130022,China)Abstract :The spread of public opinion caused by the outbreak of public emergencies has caused major distress to all sectors of society.An effective method is to find public opinion points in advance and stifle public opinion in the cradle.A system including visual analysis results and attribution analysis is constructed.The system takes public opinion events as the theme,uses data collection technology,and combines sentiment analysis and text processing methods to monitor and analyze p
ublic opinion information.Experiment results show that this system is
effective for the analysis of public emergencies.By monitoring the changes in mood fluctuations in the process of public opinion,the purpose of assisting the government in decision⁃making is finally achieved,laying a foundation for the analysis of future public emergencies.Key words :public emergencies;public opinion analysis;emotional changes;visualization 0 引 言在网络信息化时代背景下,突发公共事件的爆发都依赖于现代新媒体的传播,这引起了社会的广泛关注,而公共卫生事件的爆发带来的一系列谣言信息刺激着公众的情绪变化㊂若不能有效地遏制谣言传播,很容易引发体情绪极化现象,加大政府处理舆情事件的难度㊂因此正确认识人们的情绪变化情况,将有助于各级政府相关措施的发布,从而有效地缓解公众情绪问题,为更好地采取相关工作奠定基础[1]㊂笔者以 COVID⁃19”疫情为例,对公共卫生事件进行相关分析,主要工作如下:
1)针对微博疫情数据进行情感分析,绘制情感波动曲线图;2)根据情感分析结果,分析产生波动的原因,绘制词云图并对其进行解释;
3)利用中国疫情防控实验室发布的新闻措施,采用聚类方法和LDA(Linear Discriminant Analysis)主题分析,确定措施与分析结果之间的相关性,验证分析结果的准确性㊂
通过以上3项工作的分析和验证过程,证明实验方案的有效性,利用情绪变化图分析公众对疫情的
态度,以辅助政府决策,更快地解决这类事件带来的各种隐患㊂1 研究现状
近年来,国内外许多学者对舆情分析进行了研究,彭云等[2]提出了语义关系约束的主题模型SRC⁃LDA(Semantic Relation Constrained LDA)有效地提取海量评论文本中的商品特征和情感词,进而获取情感倾向㊂张宜浩等[3]提出了一种深度情感分析和多视图协同融合的混合推荐方法,用于用户评论等短文本的情感及语义分析,同时利用LSTMLSTM(Long Short⁃Term Memory)实现了上下文的情感分析,解决了用户评分极度不均匀的问题㊂李勇敢等[4]使用LDA⁃Collocation 模型实现了中文微博情感自动分类,并利用依存关系建立了6个评价对象,对其使用归并算法实现了计算机自动抽取情感要素㊂周亚东等[5]基于时间属性进行焦点特征提取,进而识别话题内容焦点,更加准确的分析网络舆情㊂秦涛等[6]采用人机混合技术,提出了基于排序学习的舆情事件演化趋势重要性评估算法,充分利用了少量标注样本中的专家知识,建立了舆情演化态势感知模型㊂徐迪[7]构建了基于空间可视化理论和技术的大数据舆情研判体系,实现了舆情事件的空间可视化,弥补了静态处置缺陷㊂这些模型的构建有效提高了舆情的监控力度,若能在此基础上对公众的言论进行实时监控,则将有利于政府准确㊁实时地掌握舆情变化情况㊂笔者使用情感分析对微博舆情信息进行可视化表达,通过词云图㊁LDA 主题分析以及聚类分析等方法对可视化结果进行展示,并通过我国疫情防控实验室发布有效措施和手段验证分析结果的可行性和准确性㊂
snis872
针对新冠肺炎疫情,通过中国社会科学院社会学研究所发布的社会心态调查结果显示[8]:从2020年1
月下旬到2月中旬,公众情绪的反应从疫情初期较高的负向情绪和较低的正向情绪逐渐发生变化,图1 情绪变化图
Fig.1 Mood change graph
乐观㊁平静情绪从2.5左右上升到3.5左右㊂担忧㊁
环丙基硼酸
恐惧㊁愤怒和恐慌情绪逐步下降,下降范围接近0.5㊂
如图1所示,从变化趋势看,积极乐观的情绪达到3.5
以上,消极恐惧的情绪有较为明显的回落㊂
由此可知,疫情期间人们的情绪发生了较大波
动,如果能将这种波动直观地展示,可更好地了解人
们的情绪变化情况,并结合文本分析结果分析波动产
生的原因,进一步采取措施能对政府相应政策的颁布
起到一定的作用,还能对政府制定相关措施起到了决
策支持㊂2 分析体系的建构2.1 体系结构笔者的体系结构以文本分析为基础,情感分析为可视化呈现的视觉效果,通过自然语言处理中的情感分析实现公众情绪的数据可视化,制作情感波动曲线图,采集微博数据对接相应的舆情事件,使用数据库作为舆情分析的资源地,构建一体化的舆情分析可视化体系,如图2所示㊂该体系通过文本分析㊁词云分析针对情感结果进行归因分析,提供必要的理论支撑,表达公众一段时间内的情绪变化情况,最后通过政府发布的通知举措对该分析结果进行验证,确定分析结果的可行性和正确性,以供政府部门提供辅助决策[9]㊂
3
17第6期赵剑,等:针对突发公共事件的舆情监测与可视化分析
图2 体系结构图Fig.2 Architecture diagram
2.2 数据采集该模型的体系结构主要需要两方面的数据信息:一是公共情绪分析的表达平台
微博,其作为全球最大的中文社交网络平台,数据开放程度高,从其获取相关数据进行情感分析对突发公共疫情的防治和措施的颁布具有一定的指导意义;二是验证结果的平台
疫情防控实验室,由其发布的信息是我国各地方政府针对此次新冠疫情发布相关信息来源,也是笔者对分析结果进行验证的主要检索文件,其具
体信息采集过程如图3所示
优日
㊂图3 数据采集流程图Fig.3 Data collection flow chart 2.3 研究方案2.3.1 情感分析近年来,突发事件发生时,公众对自己所接受到的舆情信息会自然产生情绪反应,并将其发布在网络上,这种情绪波动现象能作为一种信息检索线索,供笔者分析深层次的原因㊂社交媒体上的言论对公众的情绪和情感的影响,将对社会和政治体制产生很大影响[10]㊂因此针对突发性的公共事件有必要收集相关信息并对其进行情感分析,以为制定对应的解决措施提供一定的依据㊂
情感分析包含多种分析方法和分析角度,常常被用于表征社会关系㊂笔者使用的情感分析方法是情感倾向性分析,其主要作用是识别文本情绪的积极性与消极性,通过采用文本分词㊁去停用词等方法对文本进行处理,利用贝叶斯机器学习算法进行训练文本,计算出概率较大的类别㊂进而通过情绪值绘制出情感波动曲线图,分析情感变化趋势[11]㊂2.3.2 词云分析词云分析主要针对爬取到的数据文本,利用已有的关键词词库进行分词,对分词结果中关键词出现频率较高的前100位以视觉上的突出显示,并过滤大量无意义信息,可以让浏览者迅速把握疫情关键词,关注疫情重点[12]㊂具体方法:首先进行数据清洗,其次利用wordcloud 和matplotlib 对清洗后的数据进行
417吉林大学学报(信息科学版)第39卷
高频词统计,并生成词云和高频词排序表,从而清晰地表达话题的重点[13]㊂
2.3.3 文本聚类文本聚类是一种依据相似度进行文本聚类的方法,主要包括以下几个步骤:分词㊁去
除停用词㊁构建词袋空间VSM(Vector Space Model)㊁TF⁃IDF(Term Frequency⁃Inverse Document Frequency)构建词权重㊁使用聚类算法进行聚类[14],例如K ⁃Means(K ⁃Means Clustering Algorithm),DBSCAN(Density⁃Based Spatial Clustering of Applications with Noise),BIRCH(Balanced Iterative Reducing and Clustering using Hierarchies)等㊂笔者采用jieba 分词对采集到的文本进行一个分词工作,jieba 分词首先通过对照字典生成句子的有向无环图,再根据选择的模式不同,根据词典寻最短路径后对句子进行截取或直接对句子进行截取[15⁃16]㊂对未登陆词(不在词典中的词)使用HMM(Hidden Markov Mode)发现新词㊂由于jieba 词库的缺陷,很难处理比较复杂的文本,因此笔者利用load userdict()函数增加词库,优化分词效果,根据中文停用词表去除停用词,进而统计所有文档的词集合,构建词袋空间,再通过TF⁃IDF 算法构造文本向量矩阵㊂而由于文本向量矩阵非常稀疏,故利用PCA(Principal Component Analysis)降维,构造出较为稠密的矩阵,最后通过K ⁃means 的文本聚类算法得到话题聚类的结果[17]㊂
led镜前灯
3 计算结果与验证
3.1 情感分析结果微博作为人们情绪表达的场所,笔者采用SnowNLP 情感分析,结果得到的数据在0~1之间,当结果大于0.5时,这句话的情感表达为积极的一面,越接近1越积极,小于0.5时,正好相反㊂
活动装置
图4 1月⁃6月微博采集公众信息情感变化曲线Fig.4 Graph of sentiment changes in public information collected on Weibo from January to June 笔者针对微博疫情以 新冠肺炎疫情”为关键词,通过高级搜索的方法,分别以热点方式爬取每个月的
数据,并且存入数据库中㊂采用SnowNLP 的方式计算
每条微博的情感值,并取每个月的平均值,绘制情感变
化图[18]㊂如图4所示,从2020年1月出现疫情开始,1月份的情绪值还处于偏下的程度,即人们的情绪处于
消极状态,而进入2月份,可以看到积极的言论所占比
例在不断的增大,由图4也可以看到从2月开始每个月
的情感平均值都在0.5以上,且2月到5月的情感值是逐渐积极的,这与医疗工作者的不断努力息息相关,也
与党和政府的政策有很大的关系㊂进入6月份以后,北京地区突发新冠肺炎,人们开始出现恐慌,消极情绪逐渐增多,情绪值变低㊂对比图5和图6,5月份㊁6月份两个月的词云图可以发现,6月份 北京”㊁
出现”㊁ 确诊”㊁ 检测”㊁ 病例”等词汇所占比例增加,即6月份北京地区疫情的出现给人们带来了新一轮的情绪变化,但总体而言还是相对积极的㊂       
 图5 5月文本内容词云图       图6 6月文本内容词云图
    Fig.5 Word cloud diagram of May text content Fig.6 Word cloud diagram of June text content 综上所述,公众情绪在1月处于较低下状态,当时正处于疫情初发期,随着政府处理和医疗工作者的努力,人们情绪迅速回涨,从2月开始到3月进入一个平缓期,4月份人们开始工作,情绪再度上涨,到6月初,北京地区再次出现新冠肺炎,人们情绪开始下跌,出现了骤降现象㊂5
17第6期赵剑,等:针对突发公共事件的舆情监测与可视化分析
3.2 结果验证中国社会组织公共服务平台疫情防控实验室为我国各地发布的有关疫情防控工作提供信息,对其信息绘制词云图能了解国家官方发布的主要内容,笔者通过对官方政策文件的发布和分析结果进行对比,验证该方案的实用性㊂
验证实验调取了2020年从1月17日⁃5月17日期间在中国社会公众服务平台发布的防控工作官方信息,利用词云图对整体的工作进行说明,词云图中通过字体的大小反应关注的重点㊂如图7所示,首先,从最突出的几个字可以看出:官方信息更多的是关注 疫情”㊁ 防控”㊁ 社会”㊁ 组织”㊁ 工作”等,图7 
疫情防控实验室词云统计结果图Fig.7 Word cloud statistical results map of the epidemic prevention and control laboratory
同时也可以看出官方对这次疫情的发布的主要话题是
关于新冠肺炎的疫情防控工作㊂其次, 企业”㊁ 捐
赠”㊁ 口罩”㊁ 物资”㊁ 参与”㊁ 志愿者”等在其中
也表现的比较明显,说明各级政府为了防控此次疫
情,各企业㊁公众以及志愿者等众志成城,为抵抗疫
情尽自己的一份力量㊂最后,可以看到, 医院”㊁ 慈善”等也非常突出,疫情期间,医疗工作者的无私奉献给人们在特殊时期的生活创造出平稳的工作环境
和学习环境,政府提倡人们要感谢医疗工作者的付
出㊂以上这些都反映了我国在新冠肺炎期间政府的态
度和采取的措施㊂为进一步验证微博情感分析结果和疫情防控实验室发布的通知㊁举措之间的对应关
系[19]㊂实验对1月⁃5月每个月的结果进行对比分析,结果如表1所示㊂笔者主要选取了1月和4月2个月的内容进行详细分析㊂如图8为对1月份政府发布内容,进行文本聚类的结果,结果分成两类,结合图9的词云图显示,一类是发布的相关措施主题,一类是抗击疫情主题㊂1月份疫情扩散严重,人们的情感值普遍偏低,因此政府发布的通知都是积极引导抗击疫情;4月份,利用LDA 主题和词云图两种方式分析,此时是人们返工的时间,多数工作者开始恢复正常的工作,情感值偏向积极,分析结果如图10和11所示,4月份的主题是各单位㊁各企业抗击疫情的通知㊁措施㊂       图8 1月份文本聚类结果图      图9 1月份抗击疫情词云结果图        Fig.8 January text clustering      Fig.9 Word cloud result map of the fight             result graph          against the epidemic in January 表1 1月⁃5月对应分析结果Tab.1 Correspondence analysis results from January to May
月份情感值微博分析主题政策发布主题是否对应10.484武汉疫情新冠初发期
积极引导抗议疫情加强防护是20.646疫情防控㊁保护措施防护物资口罩志愿者参与抗议是30.652无症状感染者复工问题疫情防控企业复工复产防控是40.711高校开学㊁工作㊁旅游单位疫情防控㊁复产有效防控是50.723防控㊁美国疫情慈善㊁国际防控救援队是
60.558北京㊁疫情防控617吉林大学学报(信息科学版)第39卷

本文发布于:2024-09-22 21:23:14,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/1/155557.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:分析   疫情   情感   进行   情绪
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议