一种基于迁移学习的跨领域谣言传播预测方法



1.本发明属于社交网络建模和信息传播领域,具体涉及一种基于迁移学习的跨领域谣言传播预测方法。


背景技术:



2.近年来,社交网络飞速发展,极大地改变了人们的生活方式,人们可以在社交网络上发表自己的看法,记录自己的生活,获取信息与知识的渠道也更加多样化。但与此同时,由于这些信息的传播并没有经过传统媒体的检验,使得谣言的存在更为广泛。谣言是指那些引起传播的、内容未经证实的且造成了一定社会舆论影响的言论或阐述。这些言论或阐述一般通过凭空捏造、主观杜撰、移花接木、虚无历史等方式捏造虚假信息。相比日常社会中的谣言,社交网络中的谣言具有传播速度快、影响范围大、不可控因素多等特点,其大规模的传播不仅会影响人们的社交网络使用体验,也会造成民众的误解或引发民众的负面情绪,甚至提高网络违法犯罪活动发生的可能性,影响社会稳定,因此如何通过技术对社交网络中的谣言传播进行预测和干扰,对于能否引导正确的舆论导向、及时发现和化解社会问题并营造健康向上的舆论环境至关重要,具有非常重要的应用价值和社会意义。
3.目前众多学者对话题传播预测模型进行了大量的研究并取得了相当不错的成果,但仍存在一些问题:
4.1.谣言话题早期有效数据稀疏。谣言话题早期爆发时,数据量虽然庞大但是大部分都是对传播的无效数据,这导致真正对模型有帮助的数据太少,给模型数据输入造成较大影响。
5.2.谣言话题特征空间复杂性、多样性。谣言话题的特征空间需考虑到用户以往行为、用户网络拓扑结构、谣言自身特点等多方面影响因素,为特征压缩和有效表达带来了困难。
6.3.谣言与辟谣消息共生与竞争。谣言话题传播过程中,用户的行为受到二者博弈结果的影响,如何量化二者对谣言话题的影响力是提高模型预测能力的一个重要的方面。


技术实现要素:



7.针对现有技术存在的不足,本发明提出了一种基于迁移学习的跨领域谣言传播预测方法,该方法包括:
8.s1:获取话题数据并根据话题数据构建用户话题网络,话题数据包括话题传播信息、用户基本信息和话题文本信息;
9.s2:根据话题数据提取相关属性,相关属性包括用户自身属性、用户的历史转发率和用户交互度;
10.s3:根据相关属性定义随机游走策略;
11.s4:根据随机游走策略,采用node2vec算法将用户话题网络表示为低秩稠密的特征向量矩阵;
12.s5:采用bert模型对话题文本信息进行表示,得到话题的文本特征向量;
13.s6:采用演化博弈论度量谣言信息和辟谣信息的传播影响力;
14.s7:根据特征向量矩阵、文本特征向量、谣言信息传播影响力、辟谣信息传播影响力对基于g-gcn的谣言-辟谣信息传播体行为预测模型进行训练,并采用新模型损失函数对模型参数进行调整,得到训练好的基于g-gcn的谣言-辟谣信息传播体行为预测模型;
15.s8:使用迁移学习对训练好的基于g-gcn的谣言-辟谣信息传播体行为预测模型进行修正,得到最终的基于g-gcn的谣言-辟谣信息传播体行为预测模型并采用该模型进行用户传播谣言话题预测。
16.优选的,提取用户的历史转发率的公式为:
[0017][0018]
其中,rate(ui)表示用户ui的历史转发率,browser(ui)表示用户ui的浏览微博数量,forward(ui)表示用户ui的转发微博数量。
[0019]
优选的,提取用户交互度的公式为:
[0020][0021]
其中,intract(ui,uj)表示用户ui对用户uj的交互度,i
i,j
表示用户ui是否关注用户uj,k表示用户ui发布的微博总数,b表示行为类别,t表示当前热点话题的时间,tk表示用户ui发布第k条微博的时间,weibo
kb
表示用户ui是否对用户uj产生行为。
[0022]
优选的,定义随机游走策略的过程包括:根据用户自身属性计算用户话题网络中当前节点与下一个节点的相似度;根据用户交互度计算用户话题网络中当前节点与下一个节点的的边权值;根据相似度和边权值定义随机游走策略。
[0023]
进一步的,随机游走策略表示为:
[0024][0025]
其中,p=(ci=x|c
i-1
=w)表示节点w游走到下个节点x的概率,α
p,q
(w,x)表示节点w和节点x之间的权重调整参数,β(w,x)表示节点w和节点x的相似度,表示节点w和节点x之间的边权值,z表示归一化常数。
[0026]
优选的,度量谣言信息和辟谣信息的传播影响力的过程包括:根据用户自身属性和用户的历史转发率计算用户内部影响因素;根据用户交互度和话题的文本语料计算用户外部影响因素;根据用户内部影响因素和用户外部影响因素构建谣言信息和辟谣信息的影响力函数;根据谣言信息和辟谣信息的影响力函数,采用演化博弈论定义谣言信息和辟谣信息的收益函数;根据谣言信息和辟谣信息的收益函数计算谣言信息和辟谣信息的传播影响力。
[0027]
进一步的,计算谣言信息和辟谣信息的传播影响力的公式为:
[0028][0029][0030]
其中,mutualinf
rumor
(ui)表示谣言信息对用户ui的传播影响力,mutualin
fanti-rumo
(ui)表示辟谣信息对用户ui的传播影响力,ben
rumor
(ui)表示用户ui对谣言信息的收益,ben
anti-rumor
(ui)表示用户ui对辟谣信息的收益。
[0031]
优选的,基于g-gcn的谣言-辟谣信息传播体行为预测模型表示为:
[0032][0033]
其中,z表示节点不同分类的概率值,x表示话题网络特征输入矩阵,a表示用户交互行为补全后的邻接矩阵,表示中间参数,relu()表示激活函数,wi为图卷积网络中对应第i层网络的权重矩阵。
[0034]
优选的,新模型损失函数的公式为:
[0035]
l=-θdy log p(y=0|x)-θry log p(y=1|x)-θay log p(y=-1|x)
[0036][0037][0038][0039]
其中,θd表示第一权重,y表示指示变量,y表示输出类别,x表示话题网络特征输入矩阵,θr表示第二权重,p(y=i|x)表示输出类别y属于标签i的预测概率,θ4表示第三权重,d表示训练集中不转发消息的用户个数,r表示训练集中转发谣言消息的用户个数,a表示训练集中转发辟谣消息的用户个数。
[0040]
本发明的有益效果为:
[0041]
1:本发明针对谣言有效数据稀疏问题,利用迁移学习,从数据量更丰富的源领域选择有限数据用来补偿模型输入。同时,考虑源领域和目标领域数据特征空间存在差异,利用迁移学习,完成领域适配;基于迁移学习解决了谣言话题有效数据稀疏和跨领域适配问题。。
[0042]
2:针对谣言话题特征空间高维性、复杂性,利用bert模型的强大编码能力,对谣言文本数据进行表示,同时考虑到社交网络拓扑结构复杂性,利用node2vec算法对用户网络拓扑进行提取;提出bert-node2vec方法对谣言话题特征空间进行表示,表示结果更加完整、精确且向量维度低。
[0043]
3:考虑到谣言、辟谣消息对谣言话题传播的影响,引入演化博弈理论,量化二者影响力。并结合社交网络拓扑结构的特点,提出一种基于g-gcn的谣言-辟谣信息传播体行为预测模型,预测结果准确性高。
附图说明
[0044]
图1为本发明中基于迁移学习的跨领域谣言传播预测方法结构示意图;
[0045]
图2为本发明中采用node2vec算法和bert模型表示隐藏信息示意图;
[0046]
图3为模型领域适配示意图。
具体实施方式
[0047]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0048]
本发明提出了一种基于迁移学习的跨领域谣言传播预测方法,如图1所示,所述方法包括以下内容:
[0049]
s1:获取话题数据并根据话题数据构建用户话题网络,话题数据包括话题传播信息、用户行为信息和话题文本信息。
[0050]
在线获取话题数据(用户行为数据)。获取数据的方式可以是从公开的数据网站,或者是利用成熟的社交网络公共api进行获取。这里需要获取的是谣言-辟言话题在其生命周期内的所有参与者和话题本身的信息。话题数据包括话题传播信息、用户基本信息和话题文本信息;其中,话题传播信息需要得到的是话题被用户转发、评论、浏览、点赞的时间以及话题发布时间,用户基本信息为用户之间的关系信息(包括关注和被关注信息)和用户的属性信息(用户昵称、注册信息,粉丝数量、好友数量等);话题文本信息包括话题内容,用户对话题的转发、评论内容等信息。
[0051]
根据话题数据定义话题用户体和用户有向边网络,构建用户话题网络,可表示为:
[0052][0053]
其中,表示话题用户关系网,u
t
表示t时间段内参与热点话题的用户,eu表示话题用户之间的关系边,u表示话题用户之间的关系边集合,关系边表示用户之间存在关注与被关注关系。
[0054]
s2:根据话题数据提取相关属性(谣言话题特征),相关属性包括用户自身属性、用户的历史转发率和用户交互度。
[0055]
用户自身属性包括用户注册的个人信息。例如用户昵称、注册信息(包括用户的性别、位置信息)、粉丝数量、好友数量等。这些个人信息与用户是否参与此谣言传播话题有密切关系。因此定义用户自身属性为:
[0056]
user(ui)=[information(ui),fans(ui),follow(ui)]
[0057]
其中,user(ui)表示用户ui的自身属性,information(ui)表示用户基本资料信息(用户昵称、注册信息等),fans(ui)表示用户ui的粉丝数量,follow(ui)表示用户的好友数量(相互关注的用户的数量)
[0058]
用户的历史转发率可以一定程度上反映用户参与话题的活跃度,对预测用户行为有较大的帮助。本发明将历史转发率定为:
[0059][0060]
其中,rate(ui)表示用户ui的历史转发率,browser(ui)表示用户ui的浏览微博数量,forward(ui)表示用户ui的转发微博数量。
[0061]
用户是否会转发该谣言话题会受到其自身的活跃度以及用户之间的交互度影响。用户的历史转发率可表示用户自身的活跃度,用户之间的交互度表示为:
[0062][0063]
其中,intract(ui,uj)表示用户ui对用户uj的交互度;i
i,j
表示用户ui是否关注用户uj,若关注,则i
i,j
=1,否则,i
i,j
=0;k表示用户ui发布的微博总数,b表示行为类别(b=1表示转发,b=2表示评论,b=3表示点赞),t表示当前热点话题的时间,tk表示用户ui发布第k条微博的时间;weibo
kb
表示用户x基于行为b(转发、评论、点赞)用户wi的第k条微博,其取值根据不同的行为对于传播谣言的重要性进行人工设置,例如,转发取6、评论取4、点赞取2。
[0064]
s3:根据相关属性定义随机游走策略。
[0065]
话题传播空间中,节点自身属性和节点间的关系都会影响体的行为。现有的网络表示大多仅考虑结构性和同质性,往往忽略了节点属性之间的关联性。因此,本发明基于node2vec(随机游走)算法在网络拓扑表示方面的优势,同时结合节点的属性信息定义了话题结构特征表示方法。
[0066]
算法的目的是学习热点话题下网络节点的特特征向量,算法的输入为加权后的网络拓扑,输出是节点的向量表示。算法的目标函数定义为:
[0067][0068][0069]
其中,ns(w)表示节点w通过采样策略s得到的邻居,pr(ns(w)|f(w))表示节点向量f(w)出现领域节点的概率,nj表示节点w邻居中的一个节点j,pr(nj|f(w))表示根据节点j的特征表示来观察节点w的领域的对数概率。
[0070]
为达到上述目标,考虑到节点属性影响因素,本发明重新定义了节点游走策略;具体的,起始节点定义为c0,随机游走的第i个节点定义为c1,定义随机游走策略的过程包括:
[0071]
根据用户自身属性计算用户话题网络中当前节点与下一个节点的相似度,节点之间的相似度β(w,x)表示表示当前节点w与下一节点x间属性的相似度,本发明选取用户自身属性中的部分信息,如用户的性别、位置信息、粉丝数量等属性信息,将其映射到特征向量空间,利用向量间的欧式距离来表示相似度。
[0072]
由于潜在用户与热点用户的交互强度会影响其参与热点话题的倾向性,因子,根据用户交互度对话题网络分配边权值,根据用户交互度计算用户话题网络中当前节点与下一个节点的的边权值的公式为:
[0073][0074][0075]
其中,p表示第一超参数,q表示第二超参数,d
w,x
表示节点w和节点x之间的距离,intract(wi,x)表示第i个节点wi对节点x的交互度,v表示节点之间的边,u表示用户节点。
[0076]
根据相似度和边权值定义随机游走策略,节点的转移概率表示为:
[0077][0078]
其中,p=(ci=x|c
i-1
=w)表示节点w游走到下个节点x的概率,α
p,q
(w,x)表示节点w和节点x之间的权重调整参数,β(w,x)表示节点w和节点x的相似度,表示节点w和节点x之间的边权值,z表示归一化常数。
[0079]
采用node2vec算法和bert模型对话题的隐藏信息进行提取,如图2所示,包括以下内容:
[0080]
s4:根据随机游走策略,采用node2vec算法将用户话题网络表示为低秩稠密的特征向量矩阵。
[0081]
根据随机游走策略,利用node2vec算法将话题拓扑表示为低秩稠密的特征向量矩阵es∈r
n*d

[0082]
s5:采用bert模型对话题文本信息进行表示,得到话题的文本特征向量。
[0083]
bert模型考虑到了双向预训练对话题表示的重要性,使用了掩码语言模型来实现预训练的深度双向表示,能够同时考虑到输入话题的上下文关系,并且对其进行分解,将上下文关系嵌入到每个词向量中。此外,bert模型在对句子进行分解的过程中,会引入每个词汇在句子中的相对位置作为基准点,以便于更完备的分析词汇间的相互关系,从而得到更符合语境以及逻辑的句向量。
[0084]
首先以uinfo(一段话或一句话)为基础,给出s={s1,s2,s3,...,s
|s|
}为原话题组。对谣言话题中的文本信息进行分词,并且去除停用词,减少停用词产生的噪声对于后续模型的影响。由于话题中的消息属于中等长度的文本,并且标点符号对于文本所表达的内容严重性、真实性都具有一定的影响。因此本发明保留常规标点符号作为文本的一部分特征;得到每个si∈s都是由字符序列组成的短文本l为si的长度;
[0085]
处理好的话题的文本语料可表示为iattribute(ii),ii表示第i个话题;将处理好的文本语料输入至bert模型中进行表征,从bert模型将输出当前话题信息的文本特征向量v
text
∈rd。
[0086]
s6:采用演化博弈论度量谣言信息和辟谣信息的传播影响力。
[0087]
根据用户自身属性和用户的历史转发率计算用户内部影响因素,计算公式为:
[0088]
infactors(ui)=user(ui)*rate(ui)
辟谣信息传播体行为预测模型。预测任务的目标是预测潜在用户节点对该谣言话题的参与情况,若用户参与则判断其不转发、转发谣言或转发辟谣消息,进而可以将其转化为一个三分类任务。
[0107]
根据特征向量矩阵、文本特征向量、谣言信息传播影响力、辟谣信息传播影响力对基于g-gcn的谣言-辟谣信息传播体行为预测模型进行训练的过程包括:
[0108]
根据用户交互度对用户话题网络中用户之间的边权值的进行补全即添加用户交互度边权值的维度,得到补全后的用户话题网络;根据补全后的用户话题网络得到邻接矩阵a。
[0109]
对文本特征向量v
text
、用户个人属性和用户转发率进行拼接,得到用户节点的输入特征维度f;根据特征向量矩阵es和输入特征维度得到话题网络特征输入矩阵:x=es*f。
[0110]
本发明使用一个加入中间dropout层的双层图卷积神经网络作为网络谣言转发预测模型。首先,随机初始化权重w和偏置b,将话题网络特征输入矩阵x与邻接矩阵a输入到预测模型中,将x与w相乘并添加偏差b以后再与相乘;添加经过相互博弈后的谣言信息和辟谣信息对用户ui的传播影响力作为影响维度。使用relu函数作为该层的激活函数,同时,在模型训练时进行dropout操作,最后,使用softmax激活函数将卷积输出表示成节点不同分类的概率值,得到用户传播谣言话题预测结果;基于g-gcn的谣言-辟谣信息传播体行为预测模型表示为:
[0111][0112]
其中,z表示节点不同分类的概率值,f(x,a)表示用户在当前话题下的行为,x表示话题网络特征输入矩阵,a表示用户交互行为补全后的邻接矩阵,表示中间参数,为根据邻接矩阵计算得到的矩阵向量,邻接矩阵计算得到的矩阵向量,d表示训练参数;relu()表示激活函数,wi为图卷积网络中对应第i层网络的权重矩阵。
[0113]
由于本发明讨论的是一个三分类预测问题,所以令模型输出为z=p(r,a,d|ui),具体定义如下所示:
[0114][0115]
其中,p(r|ui)表示用户ui转发谣言的概率,(p(r,a,d|ui))表示用户ui最终的行为(r表示转发谣言信息、d表示转发辟谣信息信息,a表示不转发谣言话题信息),p(d|ui)表示用户ui不参与谣言的概率,p(a|ui)表示用户ui辟谣的概率。y=1,则判断潜在用户ui将在下一时间段转发谣言信息;如果y=-1,则判断潜在用户ui将在下一时间段转发辟谣信息;否则,潜在用户ui将在下一时间段内不参与该谣言话题。
[0116]
通常在多类别分类中使用交叉熵损失函数(。我们发现这样很难学习到谣言话题下的积极实例(谣言、辟谣消息的转发)。这是因为一个谣言话题下的不同标签样本存在不平衡性。训练时损失函数会偏向样本多的一方,虽然训练时loss很小,但是模型很容易过拟合,对样本较小的类别识别精度不高。因此,本发明重新定义一个新的模型训练损失函数来缓解这个问题;新模型损失函数的公式为:
[0117]
l=-θdy log p(y=0|x)-θry log p(y=1|x)-θay log p(y=-1|x)
[0118][0119][0120][0121]
其中,y表示指示变量,如果该类别和样本的类别相同就是1,否则就是0;y表示输出类别,x表示话题网络特征输入矩阵,θd表示第一权重,θr表示第二权重,p(y=i|x)表示输出类别y属于标签i的预测概率,θa表示第三权重,d表示训练集中不转发消息的用户个数,r表示训练集中转发谣言消息的用户个数,|m|表示训练集中转发辟谣消息的用户个数。
[0122]
采用新模型损失函数对模型参数进行调整,得到训练好的基于g-gcn的谣言-辟谣信息传播体行为预测模型。
[0123]
s8:使用迁移学习对训练好的基于g-gcn的谣言-辟谣信息传播体行为预测模型进行修正,得到最终的基于g-gcn的谣言-辟谣信息传播体行为预测模型并采用该模型进行用户传播谣言话题预测。
[0124]
整个社交网络平台形形的谣言,而这些谣言可能侧重的方向都不大相同。很多对于不同的话题领域,例如政治类、食品安全类,核心的用词存在很大区别,这就意味着不同领域的谣言特征分布以及参与转发的用户也都不尽相同。而在深度学习模型完成其训练过程后,话题特征空间、分布以及内在几何信息会被固定到模型中。基于以上事实,当需要预测的谣言话题训练数据不足时,直接使用之前提出的基础模型难免会丢失预测精度,本发明提出了一种基于图结构以及参数迁移的模型领域适配方案,如图3所示。
[0125]
尝试通过迁移学习来克服训练和测试数据应该来自相同的特征空间和分布的普遍理论,不同谣言话题领域之间的迁移学习可以减轻新话题训练模型的负担。鉴于话题结构特征在图分析中的重要性,核心是将基础模型学习到的结构特征从源域转移到目标域,并对各个层的参数进行基于话题本身特征的fine-tuning(参数调整)。
[0126]
迁移学习中的域由特征空间和概率分布组成,其中给定一个域可以用表示一个任务,它具有标签空间和从训练数据中学习的预测函数其中x∈x,一般迁移学习的目标是通过利用源域和源任务中的知识来改进目标域中的预测任务接下来,转移学习到的源话题领域图中的内在几何信息、和中的知识。
[0127]
由此,可以跳过在中为生成的步骤以及提取结构特征的步骤。在种具有结构相似性的情况下,可以复制中训练过的特征的卷积层和池化层,并借此训练中的fine-tuning参数以及权重的模型。这种迁移学习的方式提供了学习的效率,也有助于最大限度地减少因新任务缺乏数据和结构信息不完善而导致的问题。
[0128]
使用迁移学习对训练好的基于g-gcn的谣言-辟谣信息传播体行为预测模型进行修正后,得到最终的基于g-gcn的谣言-辟谣信息传播体行为预测模型。
[0129]
获取待预测话题的话题数据,执行上述步骤s1~s6的数据处理过程;根据处理结
果,采用得到的最终的基于g-gcn的谣言-辟谣信息传播体行为预测模型进行谣言传播预测,得到用户传播谣言话题的预测结果;根据用户传播谣言话题的预测结果,可对相关用户进行监测并采取有效措施,达到抑制谣言传播的目的。
[0130]
以上所举实施例,对本发明的目的、技术方案和优点进行了进一步的详细说明,所应理解的是,以上所举实施例仅为本发明的优选实施方式而已,并不用以限制本发明,凡在本发明的精神和原则之内对本发明所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

技术特征:


1.一种基于迁移学习的跨领域谣言传播预测方法,其特征在于,包括:s1:获取话题数据并根据话题数据构建用户话题网络,话题数据包括话题传播信息、用户基本信息和话题文本信息;s2:根据话题数据提取相关属性,相关属性包括用户自身属性、用户的历史转发率和用户交互度;s3:根据相关属性定义随机游走策略;s4:根据随机游走策略,采用node2vec算法将用户话题网络表示为低秩稠密的特征向量矩阵;s5:采用bert模型对话题文本信息进行表示,得到话题的文本特征向量;s6:采用演化博弈论度量谣言信息和辟谣信息的传播影响力;s7:根据特征向量矩阵、文本特征向量、谣言信息传播影响力、辟谣信息传播影响力对基于g-gcn的谣言-辟谣信息传播体行为预测模型进行训练,并采用新模型损失函数对模型参数进行调整,得到训练好的基于g-gcn的谣言-辟谣信息传播体行为预测模型;s8:使用迁移学习对训练好的基于g-gcn的谣言-辟谣信息传播体行为预测模型进行修正,得到最终的基于g-gcn的谣言-辟谣信息传播体行为预测模型并采用该模型进行用户传播谣言话题预测。2.根据权利要求1所述的一种基于迁移学习的跨领域谣言传播预测方法,其特征在于,提取用户的历史转发率的公式为:其中,rate(u
i
)表示用户u
i
的历史转发率,browser(u
i
)表示用户u
i
的浏览微博数量,forward(u
i
)表示用户u
i
的转发微博数量。3.根据权利要求1所述的一种基于迁移学习的跨领域谣言传播预测方法,其特征在于,提取用户交互度的公式为:其中,intract(u
i
,u
j
)表示用户u
i
对用户u
j
的交互度,i
i,j
表示用户u
i
是否关注用户u
j
,k表示用户u
i
发布的微博总数,b表示行为类别,t表示当前热点话题的时间,t
k
表示用户u
i
发布第k条微博的时间,weibo
kb
表示用户u
i
是否对用户u
j
产生行为。4.根据权利要求1所述的一种基于迁移学习的跨领域谣言传播预测方法,其特征在于,定义随机游走策略的过程包括:根据用户自身属性计算用户话题网络中当前节点与下一个节点的相似度;根据用户交互度计算用户话题网络中当前节点与下一个节点的的边权值;根据相似度和边权值定义随机游走策略。5.根据权利要求4所述的一种基于迁移学习的跨领域谣言传播预测方法,其特征在于,随机游走策略表示为:
其中,p=(c
i
=x|c
i-1
=w)表示节点w游走到下个节点x的概率,α
p,q
(w,x)表示节点w和节点x之间的权重调整参数,β(w,x)表示节点w和节点x的相似度,表示节点w和节点x之间的边权值,z表示归一化常数。6.根据权利要求1所述的一种基于迁移学习的跨领域谣言传播预测方法,其特征在于,度量谣言信息和辟谣信息的传播影响力的过程包括:根据用户自身属性和用户的历史转发率计算用户内部影响因素;根据用户交互度和话题的文本语料计算用户外部影响因素;根据用户内部影响因素和用户外部影响因素构建谣言信息和辟谣信息的影响力函数;根据谣言信息和辟谣信息的影响力函数,采用演化博弈论定义谣言信息和辟谣信息的收益函数;根据谣言信息和辟谣信息的收益函数计算谣言信息和辟谣信息的传播影响力。7.根据权利要求6所述的一种基于迁移学习的跨领域谣言传播预测方法,其特征在于,计算谣言信息和辟谣信息的传播影响力的公式为:计算谣言信息和辟谣信息的传播影响力的公式为:其中,mutualinf
rumor
(u
i
)表示谣言信息对用户u
i
的传播影响力,mutualinf
anti-rumor
(u
i
)表示辟谣信息对用户u
i
的传播影响力,ben
rumor
(u
i
)表示用户u
i
对谣言信息的收益,ben
anti-rumor
(u
i
)表示用户u
i
对辟谣信息的收益。8.根据权利要求1所述的一种基于迁移学习的跨领域谣言传播预测方法,其特征在于,基于g-gcn的谣言-辟谣信息传播体行为预测模型表示为:其中,z表示节点不同分类的概率值,x表示话题网络特征输入矩阵,a表示用户交互行为补全后的邻接矩阵,表示中间参数,relu()表示激活函数,w
i
为图卷积网络中对应第i层网络的权重矩阵。9.根据权利要求1所述的一种基于迁移学习的跨领域谣言传播预测方法,其特征在于,新模型损失函数的公式为:l=-θ
d
ylogp(y=0|x)-θ
r
ylogp(y=1|x)-θ
a
ylogp(y=-1|x)1|x)1|x)
其中,θ
d
表示第一权重,y表示指示变量,y表示输出类别,x表示话题网络特征输入矩阵,θ
r
表示第二权重,p(y=i|x)表示输出类别y属于标签i的预测概率,θ
a
表示第三权重,d表示训练集中不转发消息的用户个数,r表示训练集中转发谣言消息的用户个数,a表示训练集中转发辟谣消息的用户个数。

技术总结


本发明属于社交网络建模和信息传播领域,具体涉及一种基于迁移学习的跨领域谣言传播预测方法;该方法包括:获取话题数据并构建用户话题网络;定义随机游走策略,采用Node2Vec算法将用户话题网络表示为特征向量矩阵;采用BERT模型对话题文本信息进行表示,得到话题的文本特征向量;采用演化博弈论度量谣言信息和辟谣信息的传播影响力;根据特征向量矩阵、文本特征向量、谣言信息传播影响力、辟谣信息传播影响力对预测模型进行训练并采用新模型损失函数对模型参数进行调整;使用迁移学习对预测模型进行修正,采用修正后的模型进行用户传播谣言话题预测;本发明预测精度高,有利于抑制谣言信息或传播辟谣信息,实用性高。实用性高。实用性高。


技术研发人员:

肖云鹏 谢宇锋 王蓉 李茜 庞育才 李暾 胡波建 曾聪 龚佳明 李文辉

受保护的技术使用者:

重庆邮电大学

技术研发日:

2022.09.27

技术公布日:

2022/12/23

本文发布于:2024-09-20 10:41:04,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/1/45714.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:用户   谣言   话题   节点
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议