一种基于区块链的谣言智能检测及精准辟谣方法及系统

1.本发明属于信息技术领域，更具体地，涉及一种基于区块链的谣言智能检测及精准辟谣的方法及系统。

背景技术：

2.随着移动互联网与社交工具的广泛应用，网络空间逐渐成为谣言的聚散地，且变相地为谣言提供了便利的传播渠道。网络谣言呈现出迷惑性、潜伏性与危害性等特征，不仅会使个人利益受损，更会干扰社会秩序，甚至影响国家形象和安全，亟待构筑追责机制并搭建辟谣平台以治理谣言滋生和传播。
3.当前网络谣言追责的难点在于网络信息错综复杂，消息来源难以追溯，且现实中的辟谣平台辟谣效率低，仍无法突破人工审核的时效局限，加之过程的不透明因素从而削弱了辟谣系统的可信度。此外，网络谣言不易溯源也导致了精准辟谣难以实现。

技术实现要素：

4.为此，需要提供一种基于区块链的谣言智能检测及精准辟谣的方法及系统，对社交平台上发表的言论消息进行监测、发现、辟谣、处置全流程监管。为实现上述目的，本发明提供一种基于区块链的谣言智能检测及精准辟谣方法，应用于基于区块链的谣言智能检测及精准辟谣系统。
5.本发明抑制谣言增量，清理谣言存量，防止其反复传播；解决谣言溯源问题，提高所调取证据的可信度；解决人工审核谣言的时效局限问题；解决信息茧房问题，避免体极化现象；缓解辟谣过程中的信息差问题；解决缺乏健全的治理网络谣言工作机制的问题。
6.为实现上述目的，本发明提供了如下技术方案：
7.一种基于区块链的谣言智能检测及精准辟谣方法，包括以下步骤：
8.s1、社交平台将言论消息加密上传至ipfs，从对应ipfs节点上读取数据；
9.s2、使用谣言判别模型对读取的数据进行初步识别检测和分类；
10.s3、将步骤s2识别言论消息使用加密算法加密后上传到区块链，并同步存储到图形数据库中；
11.s4、通过谣言检测模型在数据库中匹配相反语义消息对，进行谣言智能检测；
12.s5、将辟谣的内容、正确的消息推送给持有或浏览过错误观点和消息的用户。
13.本技术方案进一步的优化，还包括步骤s6、根据图形数据库和区块链中的信息，对谣言进行溯源及对相关用户进行依法追责。
14.本技术方案进一步的优化，所述步骤s4的智能检测包括，
15.s41，文本内容理解；
16.s42，反义分析；
17.s43，对相反语义言论对进行谣言检测。
18.本技术方案更进一步的优化，所述s41使用基于transformer的文本摘要模型对原
始文本进行摘要提取，以及利用textrank算法提取原始文本中的关键词。
19.一种基于区块链的谣言智能检测及精准辟谣系统，包括，
20.数据采集模块：用于采集社交平台上发布的言论消息及实体之间的点赞、转发、评论等相关信息；
21.消息识别模块：使用谣言判别模型对读取的数据进行初步识别检测和分类；
22.数据存储模块：数据采集模块采集的数据传输至数据存储模块进行存储；
23.谣言检测模块：通过谣言检测模型在数据库中匹配相反语义消息对，进行谣言智能检测；
24.辟谣推送模块：用于将辟谣的内容、正确的消息精准推送给用户。
25.本技术方案进一步的优化，还包括追责模块：根据数据库中的信息，对谣言进行溯源及对相关用户进行依法追责。
26.本技术方案进一步的优化，所述数据采集模块将采集到的信息加密上传至ipfs。
27.本技术方案进一步的优化，所述数据存储模块包括图形数据库和区块链。
28.本技术方案更进一步的优化，所述区块链使用以太坊区块链技术，搭建了一条以太坊联盟链，用于存储言论信息。
29.本技术方案进一步的优化，所述谣言检测模块采用深度学习技术实现智能检测。
30.区别于现有技术，上述技术方案具有如下优点：
31.1.提供了对社交平台上的言论消息进行监测、发现、辟谣、处置的全流程监管平台。
32.2.谣言及相关责任人信息不易篡改与伪造。
33.3.将言论消息按照语义内容主题进行分类，更有针对性地对言论消息进行处理。
34.4.借助深度学习技术实现谣言智能检测，以便突破人工审核的时效局限。
35.5.精准辟谣时所采用的技术手段，有利于打破信息茧房，避免体极化现象。
附图说明
36.图1为系统基本框架图；
37.图2为系统体系层次图；
38.图3为数据与以太坊交互示意图；
39.图4为匹配相反语义消息对及谣言识别的流程图。
具体实施方式
40.为详细说明技术方案的技术内容、构造特征、所实现目的及效果，以下结合具体实施例并配合附图详予说明。
41.一种基于区块链的谣言智能检测及精准辟谣方法，所述方法实现了通过ipfs上传与读取数据、言论消息的初步识别与分类、言论消息的上链与数据库存储、基于匹配相反语义对的谣言检测、辟谣信息的精准推送以及谣言的追责，该方法如下：
42.s1、通过ipfs上传与读取数据：本方案中，言论消息数据来源于社交平台，社交平台通过在系统的一个前端页面上提交数据文件，文件会被直接上传至ipfs中，并返回一个文件的哈希值。在系统需要对数据进行后续处理时，只需通过上传时获得的哈希值即可在
ipfs中搜索到数据文件并获取到本地，对数据文件中的言论消息进行解析以供系统后续的使用。
43.s2、言论消息的初步识别与分类：本方案中，基于lstm训练了一个谣言识别的二分类模型，模型训练的数据集来自网络上开源的微博谣言数据集，其中包含谣言1538条，非谣言1849条，经过训练，模型最终的识别准确度可以达到87.4％。针对获取到的言论消息，首先利用已经训练好的基于lstm的谣言识别二分类模型进行鉴别，如果模型认为言论消息属于谣言标签的概率高于90％，则直接将其判定为谣言，否则暂时认为其不是谣言，继续利用训练好的基于bert的内容分类模型对言论消息的内容进行分类。本方案中，言论消息可以被基于bert的内容分类模型分为三类，分别是时事新闻、科学常识、观点输出。训练基于bert的内容分类模型所使用的数据集是由我们自己收集制作的，其中时事新闻类数据主要来源于新浪微博中的新闻内容，科学常识类数据主要来源于百度问答中的问答数据，观点输出类数据主要来源于新浪微博中普通用户发表的带有情感的日常内容。
44.s3、言论消息的上链与数据库存储：对于通过初步识别的言论消息，将其消息内容、发布者、发布时间等内容打包加密并利用自己编写的智能合约上传至区块链上，为了提高区块链的效率，防止链过于庞大导致上链缓慢，区块链上只记录上述必要内容。同时，也将这些必要内容以及其他相关的非必要内容存储至neo4j图形数据库中，再将上链得到的返回信息、图形数据库中数据的id、言论消息的各项必要、非必要信息一同存储至mysql数据库中。
45.s4、基于匹配相反语义对的谣言检测：在社交平台中，如果针对某一件事存在一对相反语义的言论消息，那么这一对消息中的一条就很有可能是谣言。基于这种思想，本方案通过不断搜索数据库中描述同一件事的相反语义言论对，对这一对言论进行识别的方式检测谣言。
46.具体判断言论对语义相反以及谣言识别的流程参阅图4所示，包含以下步骤：
47.s41、内容理解模块：主要负责对原始言论消息内容的理解，包括利用基于transformer的文本摘要模型对原始文本进行摘要提取，以及利用textrank算法提取原始文本中的关键词。提取关键词的目的是为了确定两条言论描述同一件事，本方案中，利用textrank算法提取原始言论中权重最大的五个关键词，并认为其中三个以上关键词意思相近即可证明的言论描述的是同一件事。文本的摘要提取是为了提高后续判断语义相反的准确性，本方案中，将摘要的语义视为原始文本的语义，提高判断的正确率。
48.s42、反义分析模块：主要负责对文本摘要的语义进行分析，给出是否语义相反的判断。具体的判断方式为：首先计算两条摘要基于句法的文本相似度，从而保证两条文本描述同一件事的同一个方面，本方案中，认为相似度大于0.6表示两条文本描述同一件事的同一个方面；接着计算两条摘要基于语义的文本相似度，只有在相似度很低的情况下两条文本的语义才有可能是相反的，本方案中，认为相似度小于0.2表示两条文本的语义可能相反。最后对两条摘要进行语义角标注，标注出两条摘要各自的主语、谓语、宾语等角，这些角只有在满足本方案中设定的规则(如主语或者宾语必须相似)时，两条文本才可以被认为是相反语义的。
49.s43、对相反语义言论对的谣言检测：根据s1中对言论内容分类的不同，在这里有不同的谣言检测方式，对于时事新闻，因为时事新闻往往具有突发性，仅通过深度学习模型
可能不能得到很好的判别结果，因此本方案中将两条文本提交给权威机构，让权威机构进行人工的审核；对于科学常识，方案中将两条文本分别输入到s1中提到的基于lstm的谣言识别二分类模型进行鉴别，获得各自是谣言的概率，将概率更高的那一条言论识别为谣言，并将另一条言论作为辟谣的理由，为模型辟谣提供可解释性；对于观点输出，方案中不进行谣言检测，在这里只是进行语义相反的记录。
50.s5、精准推送辟谣信息：为了尽可能抑制谣言产生的后果，本方案设计了辟谣信息精准推送的功能，记录所有用户在社交平台上的阅读历史，并为所有曾经阅读过某谣言信息的用户精准推送辟谣的信息。对于观点输出类消息，由于没有进行谣言检测，所以仅对曾经阅读过某言论的用户精准推送相反语义的言论消息，起到破除“信息茧房”的作用。
51.s6、谣言追责：在识别出谣言后，利用neo4j图形数据库对谣言进行追责，图形数据库中记录了一条言论的发布、转发、评论、点赞的全过程，基于这些数据可以构造出一张追责图，本方案中基于以下算法出图中的关键节点：为图中每个没有入度的节点赋值一个初始影响力，其它节点初始影响力为0，将这些节点的影响力转移到它们指向的节点上，随后删除这些节点。循环寻没有入度的节点执行上述删除与转移影响力的操作直至图中只剩最后一个节点，即可完成所有节点的影响力计算。设置一个影响力阈值为1000，本方案中，影响力高于这个阈值的节点为关键节点，让这些关键节点的责任人承担传播谣言的责任，同时提供区块链中存储的相应言论数据与其对应的token作为追责的证据，因为区块链具有不可篡改性，所以它可以作为图形数据库中数据真实可靠的依据。
52.参阅图1所示，为系统基本框架图，一种基于区块链的谣言智能检测及精准辟谣系统，包括：
53.数据采集模块：利用ipfs、加密算法的技术手段，针对增量消息、存量消息以及用户举报消息三种不同来源的消息，系统进行不同的处理审核，保证消息的安全性。
54.消息识别模块：对于通过审核的消息，使用消息分类模型，将它们按照语义内容主题，分为时事新闻、科学常识、观点输出三类。
55.数据存储模块：将社交平台的消息原文及发布人、发布时间等必要信息存到区块链之中，其余数据如点赞、浏览等存储到图形数据库中。
56.谣言检测模块：通过训练好的模型在各类的数据库中分别寻相反语义的消息对，将其与被举报或官方辟谣的消息相结合，智能地识别判定相反语义中真假。
57.辟谣推送模块：对于时事新闻和科学常识类谣言，自动将正确的信息发表过相关观点和浏览过谣言的用户；对于观点输出类谣言，将对立方言论互推。
58.追责模块：根据图形数据库所构建出的谱系，进行依法追责。
59.数据采集模块中，对于增量消息，使用谣言判别模型对其进行初步识别检测，考虑到模型识别的准确性有待提高，故设置规定阈值，若模型返回的数值大于规定的阈值，则认为该言论是谣言，拒绝发布，并反馈相关信息给平台。
60.在辟谣推送模块中，对于时事新闻以及科学常识类谣言，系统自动将正确的信息发表过相关观点和浏览过谣言的用户；对于观点输出类谣言，将对立方言论互推，有助于打破信息茧房。
61.参阅图2所示，为系统体系层次图。包括：
62.数据采集层：有关言论信息的数据加密上传至分布式文件ipfs系统中，监管平台
通过调用智能合约从ipfs中获取数据。
63.数据存储层：采用图形数据库和区块链相结合的方式进行存储。利用区块链防篡改的优点，将消息原文及发布人、发布时间等必要信息存到区块链之中。其他数据存储到图形数据库中，利用图形数据库以点、边为基础存储单元的特点，更直观地显示各实体之间的关系，确保其不可篡改性。
64.功能模块层：包括管理员的注册登录模块、存量和新增消息录入模块、谣言检测模块、主题分类模块，消息配对模块、谣言溯源追责模块，以及定向推送辟谣模块。
65.本发明的创新点如下：
66.1.信息公开透明：信息不可篡改不可伪造、可靠性高，系统去中心化运行、集体维护；
67.2.代码公开不可篡改：智能合约是反映契约的代码合同，源码公开、可信度高、可审计；
68.3.溯源平台高效安全：基于区块链的优势，谣言的所有相关信息，以及参与传播的所有人员数据都会被记录在链上，无法篡改。
69.4.打破信息茧房：针对不同类型、不同危害程度的言论信息，采取了不同的定向推送方法，帮助用户摆脱观点桎梏，改进目前平台推荐机制，打破信息茧房。
70.5.创新谣言检测方式：在社交网络中，如果针对同一事件存在两条语义相反的言论消息，那么这两条言论消息的其中一条就很有可能是谣言。因此，本方案在传统的谣言检测之前添加了匹配相反语义言论对的模块，仅对语义相反的言论对进行谣言检测，减少了谣言检测系统的工作量，并为谣言检测模型提供了可解释性。
71.需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下，由语句“包括
……”
或“包含
……”
限定的要素，并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的要素。此外，在本文中，“大于”、“小于”、“超过”等理解为不包括本数；“以上”、“以下”、“以内”等理解为包括本数。
72.尽管已经对上述各实施例进行了描述，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例做出另外的变更和修改，所以以上所述仅为本发明的实施例，并非因此限制本发明的专利保护范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围之内。

技术特征：

1.一种基于区块链的谣言智能检测及精准辟谣方法，其特征在于，包括以下步骤：s1、社交平台将言论消息加密上传至ipfs，从对应ipfs节点上读取数据；s2、使用谣言判别模型对读取的数据进行初步识别检测和分类；s3、将步骤s2识别言论消息使用加密算法加密后上传到区块链，并同步存储到图形数据库中；s4、通过谣言检测模型在数据库中匹配相反语义消息对，进行谣言智能检测；s5、将辟谣的内容、正确的消息推送给持有或浏览过错误观点和消息的用户。2.如权利要求1所述的基于区块链的谣言智能检测及精准辟谣方法，其特征在于，还包括步骤s6、根据图形数据库和区块链中的信息，对谣言进行溯源及对相关用户进行依法追责。3.如权利要求1所述的基于区块链的谣言智能检测及精准辟谣方法，其特征在于，所述步骤s4的智能检测包括，s41，文本内容理解；s42，反义分析；s43，对相反语义言论对进行谣言检测。4.如权利要求3所述的基于区块链的谣言智能检测及精准辟谣方法，其特征在于，所述s41使用基于transformer的文本摘要模型对原始文本进行摘要提取，以及利用textrank算法提取原始文本中的关键词。5.一种基于区块链的谣言智能检测及精准辟谣系统，其特征在于，包括，数据采集模块：用于采集社交平台上发布的言论消息及实体之间的点赞、转发、评论等相关信息；消息识别模块：使用谣言判别模型对读取的数据进行初步识别检测和分类；数据存储模块：数据采集模块采集的数据传输至数据存储模块进行存储；谣言检测模块：通过谣言检测模型在数据库中匹配相反语义消息对，进行谣言智能检测；辟谣推送模块：用于将辟谣的内容、正确的消息精准推送给用户。6.如权利要求5所述的基于区块链的谣言智能检测及精准辟谣方法，其特征在于，还包括追责模块：根据数据库中的信息，对谣言进行溯源及对相关用户进行依法追责。7.如权利要求5所述的基于区块链的谣言智能检测及精准辟谣方法，其特征在于，所述数据采集模块将采集到的信息加密上传至ipfs。8.如权利要求5所述的基于区块链的谣言智能检测及精准辟谣方法，其特征在于，所述数据存储模块包括图形数据库和区块链。9.如权利要求8所述的基于区块链的谣言智能检测及精准辟谣方法，其特征在于，所述区块链使用以太坊区块链技术，搭建了一条以太坊联盟链，用于存储言论信息。10.如权利要求5所述的基于区块链的谣言智能检测及精准辟谣方法，其特征在于，所述谣言检测模块采用深度学习技术实现智能检测。

技术总结

本发明属于信息技术领域，更具体地，涉及一种基于区块链的谣言智能检测及精准辟谣的方法及系统。该方法包括以下步骤：S1、社交平台将言论消息加密上传至IPFS，从对应IPFS节点上读取数据；S2、使用谣言判别模型对读取的数据进行初步识别检测和分类；S3、将步骤S2识别言论消息使用加密算法加密后上传到区块链，并同步存储到图形数据库中；S4、通过谣言检测模型在数据库中匹配相反语义消息对，进行谣言智能检测；S5、将辟谣的内容、正确的消息推送给持有或浏览过错误观点和消息的用户。或浏览过错误观点和消息的用户。或浏览过错误观点和消息的用户。