基于大数据的网络体信息认知研究——海量网络舆情信息主题提取研究

ACADEMIC RESEARCH    学术研究摘要:当前大数据技术已经得到前所未有的发展,利用大数据手段可以帮助我们从数据库中快速到大
量隐含的、具有潜在价值的数据信息。论文首先明确互联网社交时代的网络体,具体从熟悉人和陌生人
两个层面进行分析,进而研究海量网络舆情传播规律和预警机制,最后基于大数据的研究视角,提出网络
舆情的信息主题提取路径:一是选取具有舆情代表性的有限数据集合;二是对网络舆情进行语义分析和数据
的标准化转换。
关键词:大数据;网络舆情;传播;预警;信息提取
一、前言
在互联网信息技术高速发展的今天,越来越多的人们习惯于在网络上获取信息。同时,各种自媒体百花齐放,有媒体提出“人人都是KOL(意见领袖)”的概念。当每个人都具备话语权,都能输出自己的观点
的背后,是网络信息冗杂、盲目,而且数据量越来越庞大,难以采集与提炼。近年来,在我国网络社交媒体中,贴吧、论坛因其讨论主题集中、传播受众自成一圈的特,反而限制了信息的快速流传和跨圈传播。相较之下,主要基于文本的有新浪微博、今日头条等在信息舆情的发源、发酵之中体现出越来越重要的地位。
信息舆情的传播是网络社交媒体发展的一个客观现象,有其传播学上的客观规律,也与事件发生的具体内部环境、外部环境、涉及人等特点息息相关。有部分从事运营、营销的工作者和学者们已经对此产生了兴趣,并有相当的研究和实践成果。但究其根本,社交网络的主体是人,人是复杂不可测度的存在,人们的参与意识使信息舆情的传播在许多细节上存在不可控的现象。从科技进步的角度来说,人们自主吸纳、传播信息的意识还跟不上急速成长的社交网络的发展速度,从而产生了大量的跟风、传播谣言等错误舆情体事件。如果仅仅依靠道德标准或法律法规来约束人们的网络社交行为,据此来提高全民的信息获取、吸收质量,那显然是效率低下且短期内很难实现的[1]。近年来,国家数次发布、修订互联网信息法,国家网信办屡次发文强调清朗网络的建设等,都是为了从道德标准和法律法规层面上逐步改善人们的网络信息获取环境。在此基础上,如果以大数据的方式从海量舆情信息中提取主题,帮助快速发现舆情事件,挖掘舆情事件中的核心诉求,并发现潜在的意见领袖,或可加快清朗网络环境的建设,并更好地帮助商家进行文化传播、产品营销等。能够从冗杂、海量的信息数据中提取出舆情主题关键词,使人们获取网络信息的效率得到提高,在网络上营造良好的舆论环境,使信息不对称造成的网络体事件得到遏制和缓解,这无疑是有很好的实践意义。
本文首先明确参与舆情信息的“网络体”的概念,基于网络体,重点讨论舆情信息的呈现方式与主题挖掘特点,并通过数据爬取讨论信息主题抽取的可行性与必要性,最后对互联网社交形式的网络体建设提出建议。
二、互联网社交时代的网络体
(一)熟悉人的网络社交体。基于即时通讯的、QQ、MSN等可以说是近年来使用率较高的网络社交媒介,参与者是典型的“熟悉人”。这一类的即时通讯媒介的用户以具有一定互相认识的基础为前提,形成关系结构较为稳定的网络社交体。与此类似的是点对点长文本、图片、视频信息往来的使用者,其通讯对象同样是具有一定认识基础的,但相较于即时通讯媒介的用户,此类用户之间的关系结构较弱。总体来说,这两大类网络社交体都是基于“熟悉人”而形成的。熟悉人的网络社交体,虽然各自有不同的信息渠道和兴趣需求,但彼此之间受社交关系影响,有较好的意见认同感[2]。
(二)陌生人的网络社交体。基于主题讨论的论坛、贴吧使用者之间的关联进一步减弱,但在兴趣趋向上仍具有一定的共性。主题论坛和贴吧等,都依靠“主题”来吸引相关用户,并根据“主题”形成讨论话题。聚集在这类社交媒介上的网络体,其诉求和情感倾向接近,在某些共同话题上较易形成体认同的意见。除了在共同的兴趣领域有所共鸣外,这一类的网络体之间的关系结构较弱,大部分人缺乏生活中的人际网连接。
基于影音媒体的B站、抖音、快手使用者,基于短
基于大数据的网络体信息认知研究
——海量网络舆情信息主题提取研究
吴春琼    鄢冰文    郁榕睿    陈    娜
139
ACADEMIC RESEARCH    学术研究
文本信息共享交互的新浪微博、今日头条使用者等,其社交关联进一步减弱。这一类的网络社交媒介虽然都具备大数据兴趣推送机制,能在一定程度上聚合相近兴趣领域的使用者,但其本身而言,大部分是没有生活中的人际网交互基础的,这就造成许多信息交互者之间仅仅在一段文字或几分钟的影音表述中完成短暂的信息交互,之后就带着信息碎片各奔东西。这一类的网络体之间的关系结构脆弱,在短期内实现信息共享交互,随即又各自断开连接,是一种典型的“陌生人的网络社交体”。这一类的网络体之间几乎不存在稳定的关系结构,其聚合有一定的偶然性。
三、海量网络舆情传播规律和预警研究
网络舆情的研究具体涉及政治学、传播学、经济学、以及社会学等多种学科知识。实际上来说,网络舆情可以是公众意见的反映同时也可以是公众情绪的反映,其产生的主要危害是网络不良舆论会影响人们的心理健康和社会稳定。基于网络产生和传播的舆情借助大数据技术和互联网平台,可以实现舆论向更容易、更快的方向转化。基于此,对网络舆情主体信息进行提取的前提便是进一步厘清网络舆情的传播规律[3]。网络信息是网络舆情传播的重要载体,因此根据网络信息数量的变动趋势和规模可以窥探网络舆情传播的基本规律。首先从众多网民的角度分析,网络舆情在演变过程中显示出极强的“体极化”效应,网民大量使用同质性的词语成为网络舆情的总体基调;在网络舆情的数量特征方面,舆情数量的关注度并不随着时间的增长而产生变化。其次从网络舆情的探究主题来看,大多数的网络舆情议题存在情绪彩浓厚、研究分散和分析浅显等基本特质;从网络舆情的具体演化过程来说,网络舆情在传播过程中会形成多个关键节点和研究阈值,舆情的发生与现实事件的变化存在相对应的关系,网络舆情的传播常常被划分为萌发期、潜伏期、突发期、蔓延期以及结束期等多个发展时期。
网络传播预警机制主要根据网络舆情传播阶段的不同而产生变化,不同的舆情传播发展阶段,其预警对策也不尽相同。在网络舆情尚未大面积爆发的阶段,网络舆情预警的主要任务是根据当前舆情的发展特点合理预测网络舆情的高潮阶段、峰值等信息,在此基础上制定相应的预警机制和预警对策;在
网络舆情大面积扩散的阶段,各种正负面信息相互交织重叠,这时候容易出现大量网络舆论信息,这需要网络监管部门加大对网络负面信息的提取力度;在网络舆情的结束时期,根据各种信息的关联程度、信息泛滥程度以及形成的衍生舆情,建立相应的舆情预警机制和舆情风险应对机制,从而及时监测舆情的后续进展情况。
四、基于大数据网络舆情的信息主题提取路径
红外线烤箱一是选取具有舆情代表性的有限数据集合。社会舆情主要是对社会基本事件的描述和分析,搜索量可以直接反应民众对某个事件的关注力度。百度作为我国首屈一指的搜索引擎,它的大数据库中储存了成千上亿的搜索信息,无论是信息的数据还是信息的对象多极为庞大。大数据作用于网络舆情的一个重要逻辑是对价值含量较低的舆情信息进行整理和凝练,在此基础上对数据进行进一步的简化处理。从统计学的原理分析,搜索热词可以反映民意的集合性和新闻事件的关注程度,同时也在一定程度上大致刻画网络舆情地图,选取较为热点的词语可以使数据量得到极大节省,同时也使“民意”更加清晰。
二是对网络舆情进行语义分析和数据的标准化转换。传统的舆情指标数据提取方法是从词语概念的定义出发从而确定指标,比如对“压力”、“幸福感”这些词语的确定就是如此。但从社会民意的角度出发,民众对“压力”一词和“幸福”一词的感受要比纯粹从字面意思理解更能反映舆情的基本状态。利用社会语
义分析法分析网络热词,可以帮助我们准确定义网络民众头脑中的核心感受,将网络搜索量位居前几位的热词进行加权处理,就能计算出每一词语的核心舆情指数。在对数据进行处理分析的基础上,对网络热词按照统一尺度进行标准化的转换,按照年份高低对网络热词进行适当校正,这样便可使得舆情指数在横向和纵向方面有可比性。
剖分轴承参考文献
智慧交通管理
倍速链组装线[1]喻国明.构建社会舆情总体判断的大数据方法——以百度海量搜索数据的处理为例[J].新闻与写作,2013(07):67-69.
[2]马梅,刘东苏,李慧.基于大数据的网络舆情分析系统模型研究[J].情报科学,2016(03):25-33.
[3]曾润喜,徐晓琳.网络舆情的传播规律与网民行为:一个实证[J].中国行政管理,2010(11):16-20.5d动感座椅
基金项目:福州市中国特社会主义理论体系研究中心2019年度一般项目“基于大数据的网络体信息认知研究”(编号:2019B11);商务大数据协同创新中心(建设项目)(编号:闽教办科〔2019〕23号)(作者单位:吴春琼、鄢冰文、郁榕睿,阳光学院、大数据商务智能福建省高校工程研究中心;陈娜,大数据商务智能福建省高校工程研究中心、兰州工业学院)
眼模
140

本文发布于:2024-09-22 04:19:21,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/4/113043.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:网络   舆情   信息   数据
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议