一种联名人推荐方法及推荐系统与流程



1.本发明属于智能推荐技术领域,尤其涉及一种联名人推荐方法及推荐系统。


背景技术:



2.参会人员在提交提案或者建议时会有联名人联名提交的需求,目前联名人的选择都是提案或建议提交人员自己人为从同届参会人员中查,这样一来对于参会人员选择联名人来说主观意识强并且选择查比较繁琐。
3.因此,有必要提供一种新的基于参会人员画像的联名人推荐方法及推荐系统解决上述技术问题。


技术实现要素:



4.本发明的目的就在于为了解决上述问题而提供一种联名人推荐方法及推荐系统。
5.本发明通过以下技术方案来实现上述目的:一种联名人推荐的方法,包括以下步骤:获取并存储所有参与人员的画像数据,所述画像数据包括参与人员提案类别画像向量数据、参与人员提案内容画像向量数据和参与人员历史联名人画像统计数据;将待提交提案的内容进行文本向量化处理得到当前提案内容画像向量数据,基于所述当前提案内容画像向量数据及同届次的所有参与人员的所述画像数据计算出相似度数据;基于所述相似度数据计算出联名人推荐重要度数据,根据所述联名人推荐重要度数据的大小将对应的参与人员进行排名,输出前k个参与人员作为最终的推荐联名人。
6.优选地,通过对所有参与人员的提案进行提取处理获取到所有参与人员的画像数据;通过参与人员画像字典对所述画像数据进行存储和更新,参与人员画像字典的关键值key为参与人员id,属性值value为参与人员的画像数据。
7.优选地,获取所述参与人员提案类别画像向量数据包括:构建n维的全0数组,其中n为提案类别的总数,当参与人员的提案属于第a个类别时,对应的在这个数组的第a维度加1。
8.优选地,获取所述参与人员提案内容画像向量数据包括:将参与人员所有提案的内容进行文档向量化得到对应的提案内容画像向量数据;基于提案内容画像向量数据计算参与人员的平均提案内容向量数据,同时记录统计参与人员提案总数目,每个参与人员每次遍历或新增了一条提案,总数目加1,计算参与人员的平均提案内容向量数据的公式如下:;其中,memberprovec表示平均提案内容向量数据,memberprovec
new
表示更新后的平均提案内容向量数据,memberprovec
old
表示更新前的平均提案内容向量数据,count
old

示更新前的当前参与人员提案总数目,count
new
表示更新后的当前参与人员提案总数目,tempprovec表示当前提案的文档向量。
9.优选地,获取所述参与人员历史联名人画像统计数据的包括:统计每个参与人员历史提案中的联名人及联名次数,每次遍历或者新增提案时,当参与人员的联名人中存在当前提案的联名人则将联名次数加1;不存在当前提案的联名人则新增联名人,并且设置联名次数为1,最终得到所述参与人员历史联名人画像统计数据。
10.优选地,所述相似度数据包括当前提案内容与其他参与人员提案内容画像相似度数据、当前参与人员提案内容画像与其他参与人员提案内容画像相似度数据、当前参与人员历史联名人提案内容画像与其他参与人员提案内容画像相似度数据和当前参与人员提案类别画像与其他参与人员提案类别画像相似度数据。
11.优选地,计算得到所述当前提案内容与其他参与人员提案内容画像相似度数据包括:对当前提案内容进行文本向量化得到当前提案内容画像向量数据;遍历当前届次的所有其他参与人员,获取其他参与人员的提案内容画像向量数据,计算当前提案内容向量数据与其他参与人员的提案内容画像向量数据的相似度,相似度采用余弦相似度,计算公式如下:;其中,pro_otherpro_sim表示当前提案内容与其他参与人员提案内容画像相似度数据,provec表示当前提案内容画像向量数据,otherprovec表示其他参与人员的提案内容画像向量数据。
12.优选地,计算得到所述当前参与人员提案内容画像与其他参与人员提案内容画像相似度数据包括:获取当前参与人员的参与人员提案内容画像向量数据,遍历当前届次的所有其他参与人员,获取其他参与人员的参与人员提案内容画像向量数据,计算当前参与人员提案内容画像与其他参与人员提案内容画像相似度数据,计算公式如下:;其中,ownpro_otherpro_sim表示当前参与人员提案内容画像与其他参与人员提案内容画像相似度数据,ownprovec表示当前参与人员的参与人员提案内容画像向量数据,otherprovec表示其他参与人员的参与人员提案内容画像向量数据。
13.优选地,计算得到所述当前参与人员历史联名人提案内容画像与其他参与人员提案内容画像相似度数据包括:获取当前参与人员的参与人员历史联名人画像统计数据,根据所述参与人员历史联名人画像统计数据中得到当前参与人员联名过的联名人,再获取这些联名人的参与人员提案内容画像向量数据,并求其均值作为当前参与人员的历史联名人提案内容画像向量数据;遍历当前届次的所有其他参与人员,获取其他参与人员的参与人员提案内容画像向量数据,计算当前参与人员历史联名人提案内容画像与其他参与人员提案内容画像相似
度数据,计算公式如下:;其中,linkpro_otherpro_sim表示当前参与人员历史联名人提案内容画像与其他参与人员提案内容画像相似度数据,linkprovec表示当前参与人员的历史联名人提案内容画像向量数据,otherprovec表示其他参与人员的参与人员提案内容画像向量数据。
14.优选地,计算得到所述当前参与人员提案类别画像与其他参与人员提案类别画像相似度数据包括:获取当前参与人员的参与人员提案类别画像向量数据,遍历当前届次的所有其他参与人员获取其他参与人员的参与人员提案类别画像向量数据,对当前参与人员的参与人员提案类别画像向量数据和其他参与人员的参与人员提案类别画像向量数据进行归一化计算得到当前参与人员的归一化后的参与人员提案类别画像向量数据和其他参与人员的归一化后的参与人员提案类别画像向量数据,再计算当前参与人员的归一化后的参与人员提案类别画像向量数据和其他参与人员的归一化后的参与人员提案类别画像向量数据的相似度,计算公式如下:;其中,ownfield_otherfield_sim表示当前参与人员提案类别画像与其他参与人员提案类别画像相似度数据;scaleownfieldvec、scaleotherfieldvec分别表示当前参与人员的归一化后的参与人员提案类别画像向量数据和其他参与人员的归一化后的参与人员提案类别画像向量数据;scalefieldvec表示参与人员提案类别画像向量数据的归一化方式;fieldvec表示参与人员提案类别画像向量数据。
15.优选地,基于所述相似度数据计算出联名人推荐重要度数据,根据所述联名人推荐重要度数据的大小将对应的参与人员进行排名,输出前k个参与人员作为最终的推荐联名人包括:联名人推荐重要度数据的计算公式为:;其中,othermemberscore表示联名人推荐重要度数据;linknum表示当前参与人员与其他参与人员之间联名过的次数,如果未曾发生过联名,linknum为0;θ1、θ2、θ3、θ4分别为各个相似度的权重且各个相似度的权重之和为1,即θ1、θ2、θ3、θ4之和为1;pro_otherpro_sim表示当前提案内容与其他参与人员提案内容画像相似度数据,ownpro_otherpro_sim表示当前参与人员提案内容画像与其他参与人员提案内容画像相似度数据,linkpro_otherpro_sim表示当前参与人员历史联名人提案内容画像与其他参与人员提案内容画像相似度数据,ownfield_otherfield_sim表示当前参与人员提案类别画像与其他参与人员提案类别画像相似度数据;遍历当前届次的其他参与人员,获取与其他参与人员的联名人推荐重要度数据,
按照得分从大到小排序,取出得分最高的k个其他参与人员作为最终推荐的联名人。
16.本发明还提供一种联名人推荐系统,包括参与人员画像模型和联名人推荐模块;所述参与人员画像模型包括参与人员画像提取器和参与人员画像储存器;所述参与人员画像提取器和参与人员画像储存器,分别用于获取和存储所有参与人员的画像数据,所述画像数据包括参与人员提案类别画像向量数据、参与人员提案内容画像向量数据和参与人员历史联名人画像统计数据;所述联名人推荐模块,用于将待提交提案的内容进行文本向量化处理得到当前提案内容画像向量数据,基于所述当前提案内容画像向量数据及当前届次的所有参与人员的所述画像数据计算出相似度数据;所述联名人推荐模块,还用于基于所述相似度数据计算出联名人推荐重要度数据,根据所述联名人推荐重要度数据的大小将对应的参与人员进行排名,输出前k个参与人员作为最终的推荐联名人。
17.本发明的有益效果在于:本发明基于参与人员画像,在参与人员完成一篇提案或者建议时,智能化推荐出一些候选参与人员并同时展示出候选参与人员相关信息及参与人员画像,供提交参与人员选择,提高联名人的相关性,同时减低参与人员自身选择查的时间,大大提高了工作效率。
附图说明
18.图1是本发明的方法流程框图;图2是本发明的系统结构框图;图3是本发明的参与人员画像模型的结构框图;图4是本发明的联名人推荐模块的结构框图。
具体实施方式
19.下面结合附图对本技术作进一步详细描述,有必要在此指出的是,以下具体实施方式只用于对本技术进行进一步的说明,不能理解为对本技术保护范围的限制,该领域的技术人员可以根据上述申请内容对本技术作出一些非本质的改进和调整。
20.如图1所示,本发明提出一种联名人推荐的方法,包括以下步骤:获取并存储所有参与人员的画像数据,所述画像数据包括参与人员提案类别画像向量数据、参与人员提案内容画像向量数据和参与人员历史联名人画像统计数据;其中,参与人员指参加会议的人员。
21.将待提交提案的内容进行文本向量化处理得到当前提案内容画像向量数据,基于所述当前提案内容画像向量数据及同届次的所有参与人员的所述画像数据计算出相似度数据;基于所述相似度数据计算出联名人推荐重要度数据,根据所述联名人推荐重要度数据的大小将对应的参与人员进行排名,输出前k个参与人员作为最终的推荐联名人。
22.通过对所有参与人员的提案进行提取处理获取到所有参与人员的画像数据;通过参与人员画像字典对所述画像数据进行存储和更新,参与人员画像字典的key值为参与人员id,value值为该参与人员的所述画像数据。
23.如图2所示,提取得到所述参与人员提案类别画像向量数据的过程如下:构建n维的全0数组,其中n为提案类别的总数,当参与人员的提案属于第a个类别时,对应的在这个数组的第a维度加1。
24.提取得到所述参与人员提案内容画像向量数据的过程如下:将该参与人员所有提案的内容进行文档向量化得到对应的提案内容画像向量数据;基于提案内容画像向量数据计算该参与人员的平均提案内容向量数据,同时记录统计参与人员提案总数目,每个参与人员每次遍历或新增了一条提案,总数目加1,计算参与人员的平均提案内容向量数据的公式如下:;其中,memberprovec表示平均提案内容向量数据,即所述参与人员提案内容画像向量数据,memberprovec
new
表示更新后的平均提案内容向量数据,memberprovec
old
表示更新前的平均提案内容向量数据,count
old
表示更新前的当前参与人员提案总数目,count
new
表示更新后的当前参与人员提案总数目,tempprovec表示当前提案的文档向量。
25.提取得到所述参与人员历史联名人画像统计数据的过程如下:统计每个参与人员历史提案中的联名人及联名次数,每次遍历或者新增提案时,当该参与人员的联名人中存在当前提案的联名人则将联名次数加1;不存在当前提案的联名人则新增联名人,并且设置联名次数为1,最终得到所述参与人员历史联名人画像统计数据。
26.所述相似度数据包括当前提案内容与其他参与人员提案内容画像相似度数据、当前参与人员提案内容画像与其他参与人员提案内容画像相似度数据、当前参与人员历史联名人提案内容画像与其他参与人员提案内容画像相似度数据和当前参与人员提案类别画像与其他参与人员提案类别画像相似度数据。
27.计算得到所述当前提案内容与其他参与人员提案内容画像相似度数据的过程如下:对当前提案内容进行文本向量化得到当前提案内容画像向量数据;遍历当前届次的所有其他参与人员,获取其他参与人员的提案内容画像向量数据,计算当前提案内容向量数据与其他参与人员的提案内容画像向量数据的相似度,相似度采用余弦相似度,具体计算公式如下:;其中,pro_otherpro_sim表示当前提案内容与其他参与人员提案内容画像相似度数据,provec表示当前提案内容画像向量数据,otherprovec表示其他参与人员的提案内容画像向量数据。
28.计算得到所述当前参与人员提案内容画像与其他参与人员提案内容画像相似度数据的过程如下:获取当前参与人员的参与人员提案内容画像向量数据,遍历当前届次的所有其他参与人员,获取其他参与人员的参与人员提案内容画像向量数据,计算当前参与人员提案
内容画像与其他参与人员提案内容画像相似度数据,计算公式如下:;其中,ownpro_otherpro_sim表示当前参与人员提案内容画像与其他参与人员提案内容画像相似度数据,ownprovec表示当前参与人员的参与人员提案内容画像向量数据,otherprovec表示其他参与人员的参与人员提案内容画像向量数据。
29.计算得到所述当前参与人员历史联名人提案内容画像与其他参与人员提案内容画像相似度数据的过程如下:获取当前参与人员的参与人员历史联名人画像统计数据,根据所述参与人员历史联名人画像统计数据中得到当前参与人员联名过的联名人,再获取这些联名人的参与人员提案内容画像向量数据,并求其均值作为当前参与人员的历史联名人提案内容画像向量数据;遍历当前届次的所有其他参与人员,获取其他参与人员的参与人员提案内容画像向量数据,计算当前参与人员历史联名人提案内容画像与其他参与人员提案内容画像相似度数据,计算公式如下:;其中,linkpro_otherpro_sim表示当前参与人员历史联名人提案内容画像与其他参与人员提案内容画像相似度数据,linkprovec表示当前参与人员的历史联名人提案内容画像向量数据,otherprovec表示其他参与人员的参与人员提案内容画像向量数据。
30.计算得到所述当前参与人员提案类别画像与其他参与人员提案类别画像相似度数据的过程如下:获取当前参与人员的参与人员提案类别画像向量数据,遍历当前届次的所有其他参与人员获取其他参与人员的参与人员提案类别画像向量数据,对当前参与人员的参与人员提案类别画像向量数据和其他参与人员的参与人员提案类别画像向量数据进行归一化计算得到当前参与人员的归一化后的参与人员提案类别画像向量数据和其他参与人员的归一化后的参与人员提案类别画像向量数据,再计算当前参与人员的归一化后的参与人员提案类别画像向量数据和其他参与人员的归一化后的参与人员提案类别画像向量数据的相似度,具体计算公式如下:其中,ownfield_otherfield_sim表示当前参与人员提案类别画像与其他参与人员提案类别画像相似度数据;scaleownfieldvec、scaleotherfieldvec分别表示当前参与人员的归一化后的参与人员提案类别画像向量数据和其他参与人员的归一化后的参与人员提案类别画像向量数据;scalefieldvec表示参与人员提案类别画像向量数据的归一化方式;fieldvec表示参与人员提案类别画像向量数据。
31.基于所述相似度数据计算出联名人推荐重要度数据,根据所述联名人推荐重要度数据的大小将对应的参与人员进行排名,输出前k个参与人员作为最终的推荐联名人的具体过程如下:联名人推荐重要度数据的计算公式如下:
;其中,othermemberscore表示联名人推荐重要度数据;linknum表示当前参与人员与其他参与人员之间联名过的次数,如果未曾发生过联名,linknum为0;θ1、θ2、θ3、θ4分别为各个相似度的权重且各个相似度的权重之和为1,即θ1、θ2、θ3、θ4和为1;pro_otherpro_sim表示当前提案内容与其他参与人员提案内容画像相似度数据,ownpro_otherpro_sim表示当前参与人员提案内容画像与其他参与人员提案内容画像相似度数据,linkpro_otherpro_sim表示当前参与人员历史联名人提案内容画像与其他参与人员提案内容画像相似度数据;ownfield_otherfield_sim表示当前参与人员提案类别画像与其他参与人员提案类别画像相似度数据;遍历当前届次的其他参与人员,获取与其他参与人员的联名人推荐重要度数据,按照得分从大到小排序,取出得分最高的k个其他参与人员作为最终推荐的联名人。
32.如图3-图4所示,本发明还提供一种联名人推荐系统,包括参与人员画像模型和联名人推荐模块。
33.所述参与人员画像模型有两个部分,一个是基于历史提案数据进行遍历生成参与人员画像,二是当有新的提案立案时需要据此更新参与人员画像,这两个部分在处理时使用同一种参与人员画像提取规则,具体提取规则如下:使用一个members_portrait_dict字典用来存储和更新每一个参与人员的画像,其中members_portrait_dict的key值为参与人员id(member_id),value值为该参与人员的画像。每个参与人员的画像包括三个部分:参与人员提案类别向量、参与人员提案内容向量、参与人员历史联名人统计,具体步骤如下:参与人员提案类别向量提取:使用类似词袋法的模式,将所有提案类别当做一个词,然后对每个参与人员对应的提案类别数目进行统计,当该参与人员的提案出现某个类别,对应的数目增加1。
34.例如:假设一共有10个类别,初始化的时候我们构建一个10维的全0数组,当该参与人员的提案属于第n个类别时,对应的在这个数组的第n维度加1;同样的,当该参与人员新增了提案,对应类别维度上的数目加1。
35.参与人员提案内容画像提取:参与人员提案内容画像根据提案内容进行文档向量化,可以使用lda、lsi等主题模型,也可以使用其他文档向量化方式,比如word2vec求均值、doc2vec等方式;lda(latent dirichlet allocation)模型的本质是包含词(word)、话题(topic)和语料库(有时候也称文档集)(corpus)三层结构的生成式贝叶斯概率模型;lsi(latent semantic indexing)模型是自然语言处理模型,通过海量文献出词汇之间的关系。
36.为了在遍历过程或者新增提案时方便计算该参与人员的平均提案内容向量,我们在处理提案内容向量时,同时记录统计参与人员提案总数目,每个参与人员每次遍历或新增了一条提案,总数目加1。具体的计算参与人员平均提案内容向量的方式如下:当该参与人员第一次出现在members_portrait_dict时,直接保存当前提案内容
向量作为参与人员提案内容向量,同时记录参与人员提案总数目(count)为1;其他时候更新参与人员提案内容向量,并对参与人员提案总数目(count)加1,更新公式如下:;其中,memberprovec表示平均提案内容向量数据,memberprovec
new
表示更新后的平均提案内容向量数据,memberprovec
old
表示更新前的平均提案内容向量数据,count
old
表示更新前的当前参与人员提案总数目,count
new
表示更新后的当前参与人员提案总数目,tempprovec表示当前提案的文档向量。
37.参与人员联名人画像提取:参与人员联名人画像即统计每个参与人员历史提案中进行过的联名人及联名次数,每次遍历或者新增提案时,当该参与人员的联名人画像中存在当前提案的联名人就将联名次数加1;不存在的话就新增联名人,并且联名次数为1。
38.届次与参与人员映射字典:由于不同届次,参与人员会有变动更新,所以在处理过程中需要存储每个届次对应的所有参与人员,便于在进行联名人推荐的时候仅选择当前届次的参与人员进行推荐。
39.联名人推荐模块是指基于已经构建好的参与人员画像,当参与人员提出新的提案时,根据当前提案内容为参与人员推荐出可供选择的联名人。其主要步骤如下:当前提案内容与其他参与人员提案内容画像相似度:对当前提案内容进行文本向量化,遍历当前届次的所有其他参与人员,从参与人员画像字典members_portrait_dict获取其他参与人员的提案内容画像的向量,计算当前提案内容向量与其他参与人员提案内容画像的向量的相似度,这里相似度采用余弦相似度,具体计算公式如下:;其中,provec表示当前提案的内容向量,otherprovec表示其他参与人员的提案内容画像向量,pro_otherpro_sim表示前提案内容向量与其他参与人员提案内容画像的向量的相似度。
40.当前参与人员提案内容画像与其他参与人员提案内容画像相似度:从参与人员画像字典members_portrait_dict获取当前参与人员的提案内容画像,遍历当前届次的所有其他参与人员,从参与人员画像字典members_portrait_dict获取其他参与人员的提案内容画像的向量,计算当前参与人员提案内容画像与其他参与人员提案内容画像相似度,计算公式如下:;其中,ownprovec表示当前参与人员的提案内容画像向量,otherprovec表示其他参与人员的提案内容画像向量,ownpro_otherpro_sim表示当前参与人员提案内容画像与其他参与人员提案内容画像相似度。
41.当前参与人员历史联名人提案内容画像与其他参与人员提案内容画像相似度:从参与人员画像字典members_portrait_dict获取当前参与人员的历史联名人画
像,根据联名过的联名人从参与人员画像字典members_portrait_dict中获取历史联名人提案内容画像,并求其均值作为当前参与人员历史联名人提案内容画像向量;遍历当前届次的所有其他参与人员,从参与人员画像字典members_portrait_dict获取其他参与人员的提案内容画像的向量,计算当前参与人员历史联名人提案内容画像向量与其他参与人员的提案内容画像的向量的相似度,计算公式如下:;其中,linkprovec表示当前参与人员历史联名人提案内容画像向量,otherprovec表示其他参与人员的提案内容画像向量,linkpro_otherpro_sim表示当前参与人员历史联名人提案内容画像向量与其他参与人员的提案内容画像的向量的相似度。
42.当前参与人员提案类别画像与其他参与人员提案类别画像相似度:从参与人员画像字典members_portrait_dict获取当前参与人员的提案类别画像向量,遍历当前届次的所有其他参与人员,从参与人员画像字典members_portrait_dict获取其他参与人员的提案类别容画像的向量,对提案类别向量进行归一化,在计算归一化后的当前参与人员提案类别画像向量和其他参与人员的提案类别画像向量的相似度,具体计算公式如下:;其中,scaleownfieldvec、scaleotherfieldvec分别表示当前参与人员提案类别画像归一化向量和其他参与人员的提案类别画像归一化向量,ownfield_otherfield_sim表示当前参与人员提案类别画像与其他参与人员提案类别画像相似度;scalefieldvec表示提案类别向量归一化方式,fieldvec表示参与人员提案类别画像向量数据。
43.联名人推荐重要度计算:经过上述步骤可以得到当前提案及提案参与人员与其他参与人员的一些相似度,基于此相似度,对当前参与人员提案进行联名人推荐,先计算其重要度,然后根据重要度排名,推荐前k个作为最终的推荐联名人。其中重要度的计算公式如下:;其中,othermemberscore表示联名人推荐重要度数据;pro_otherpro_sim表示当前提案内容与其他参与人员提案内容画像相似度数据,ownpro_otherpro_sim表示当前参与人员提案内容画像与其他参与人员提案内容画像相似度数据,linkpro_otherpro_sim表示当前参与人员历史联名人提案内容画像与其他参与人员提案内容画像相似度数据,ownfield_otherfield_sim表示当前参与人员提案类别画像与其他参与人员提案类别画像相似度数据;linknum表示当前参与人员与其他参与人员之间联名过的次数,可以直接从参与人员画像字典中获取,如果未曾发生过联名,linknum为0;θ1、θ2、θ3、θ4分别为各种相似度的权重且他们的权重和为1,一般使用等权重,当然可以基于需求调整,比如注重当前提案内容则将θ1权重增大,
基于上述五个部分,可以根据遍历当前届次的其他参与人员,获取与其他参与人员的othermemberscore,按照得分从大到小排序,取出得分最高的k个其他参与人员作为最终推荐的联名人。
44.以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。

技术特征:


1.一种联名人推荐的方法,其特征在于,包括以下步骤:获取并存储所有参与人员的画像数据,所述画像数据包括参与人员提案类别画像向量数据、参与人员提案内容画像向量数据和参与人员历史联名人画像统计数据;其中,获取所述参与人员提案类别画像向量数据包括:构建n维的全0数组,其中n为提案类别的总数,当参与人员的提案属于第a个类别时,对应的在这个数组的第a维度加1;获取所述参与人员提案内容画像向量数据包括:将参与人员所有提案的内容进行文档向量化得到对应的提案内容画像向量数据;基于提案内容画像向量数据计算参与人员的平均提案内容向量数据,同时记录统计参与人员提案总数目,每个参与人员每次遍历或新增了一条提案,总数目加1,计算参与人员的平均提案内容向量数据的公式如下:;其中,memberprovec表示平均提案内容向量数据,memberprovec
new
表示更新后的平均提案内容向量数据,memberprovec
old
表示更新前的平均提案内容向量数据,count
old
表示更新前的当前参与人员提案总数目,count
new
表示更新后的当前参与人员提案总数目,tempprovec表示当前提案的文档向量;获取所述参与人员历史联名人画像统计数据的包括:统计每个参与人员历史提案中的联名人及联名次数,每次遍历或者新增提案时,当参与人员的联名人中存在当前提案的联名人则将联名次数加1;不存在当前提案的联名人则新增联名人,并且设置联名次数为1,最终得到所述参与人员历史联名人画像统计数据;将待提交提案的内容进行文本向量化处理得到当前提案内容画像向量数据,基于所述当前提案内容画像向量数据及同届次的所有参与人员的所述画像数据计算出相似度数据;基于所述相似度数据计算出联名人推荐重要度数据,根据所述联名人推荐重要度数据的大小将对应的参与人员进行排名,输出前k个参与人员作为最终的推荐联名人。2.根据权利要求1所述的一种联名人推荐的方法,其特征在于,通过对所有参与人员的提案进行提取处理获取到所有参与人员的画像数据;通过参与人员画像字典对所述画像数据进行存储和更新,参与人员画像字典的关键值key为参与人员id,属性值value为参与人员的画像数据。3.根据权利要求1所述的一种联名人推荐的方法,其特征在于:所述相似度数据包括当前提案内容与其他参与人员提案内容画像相似度数据、当前参与人员提案内容画像与其他参与人员提案内容画像相似度数据、当前参与人员历史联名人提案内容画像与其他参与人员提案内容画像相似度数据和当前参与人员提案类别画像与其他参与人员提案类别画像相似度数据。4.根据权利要求3所述的一种联名人推荐的方法,其特征在于:计算得到所述当前提案内容与其他参与人员提案内容画像相似度数据包括:对当前提案内容进行文本向量化得到当前提案内容画像向量数据;遍历当前届次的所有其他参与人员,获取其他参与人员的提案内容画像向量数据,计
算当前提案内容向量数据与其他参与人员的提案内容画像向量数据的相似度,相似度采用余弦相似度,计算公式如下:;其中,pro_otherpro_sim表示当前提案内容与其他参与人员提案内容画像相似度数据,provec表示当前提案内容画像向量数据,otherprovec表示其他参与人员的提案内容画像向量数据。5.根据权利要求4所述的一种联名人推荐的方法,其特征在于:计算得到所述当前参与人员提案内容画像与其他参与人员提案内容画像相似度数据包括:获取当前参与人员的参与人员提案内容画像向量数据,遍历当前届次的所有其他参与人员,获取其他参与人员的参与人员提案内容画像向量数据,计算当前参与人员提案内容画像与其他参与人员提案内容画像相似度数据,计算公式如下:;其中,ownpro_otherpro_sim表示当前参与人员提案内容画像与其他参与人员提案内容画像相似度数据,ownprovec表示当前参与人员的参与人员提案内容画像向量数据,otherprovec表示其他参与人员的参与人员提案内容画像向量数据。6.根据权利要求5所述的一种联名人推荐的方法,其特征在于:计算得到所述当前参与人员历史联名人提案内容画像与其他参与人员提案内容画像相似度数据包括:获取当前参与人员的参与人员历史联名人画像统计数据,根据所述参与人员历史联名人画像统计数据中得到当前参与人员联名过的联名人,再获取这些联名人的参与人员提案内容画像向量数据,并求其均值作为当前参与人员的历史联名人提案内容画像向量数据;遍历当前届次的所有其他参与人员,获取其他参与人员的参与人员提案内容画像向量数据,计算当前参与人员历史联名人提案内容画像与其他参与人员提案内容画像相似度数据,计算公式如下:;其中,linkpro_otherpro_sim表示当前参与人员历史联名人提案内容画像与其他参与人员提案内容画像相似度数据,linkprovec表示当前参与人员的历史联名人提案内容画像向量数据,otherprovec表示其他参与人员的参与人员提案内容画像向量数据。7.根据权利要求6所述的一种联名人推荐的方法,其特征在于:计算得到所述当前参与人员提案类别画像与其他参与人员提案类别画像相似度数据包括:获取当前参与人员的参与人员提案类别画像向量数据,遍历当前届次的所有其他参与人员获取其他参与人员的参与人员提案类别画像向量数据,对当前参与人员的参与人员提案类别画像向量数据和其他参与人员的参与人员提案类别画像向量数据进行归一化计算,得到当前参与人员的归一化后的参与人员提案类别画像向量数据和其他参与人员的归一化后的参与人员提案类别画像向量数据,再计算当前参与人员的归一化后的参与人员提案类别画像向量数据和其他参与人员的归一化后的参与人员提案类别画像向量数据的相似度,当前参与人员提案类别画像与其他参与人员提案类别画像相似度数据的计算公式如下:
;其中,ownfield_otherfield_sim表示当前参与人员提案类别画像与其他参与人员提案类别画像相似度数据;scaleownfieldvec、scaleotherfieldvec分别表示当前参与人员的归一化后的参与人员提案类别画像向量数据和其他参与人员的归一化后的参与人员提案类别画像向量数据;scalefieldvec表示参与人员提案类别画像向量数据的归一化方式;fieldvec表示参与人员提案类别画像向量数据。8.根据权利要求7所述的一种联名人推荐的方法,其特征在于,基于所述相似度数据计算出联名人推荐重要度数据,根据所述联名人推荐重要度数据的大小将对应的参与人员进行排名,输出前k个参与人员作为最终的推荐联名人包括:联名人推荐重要度数据的计算公式为:;其中,othermemberscore表示联名人推荐重要度数据;linknum表示当前参与人员与其他参与人员之间联名过的次数,如果未曾发生过联名,linknum为0;θ1、θ2、θ3、θ4分别为各个相似度的权重且各个相似度的权重之和为1,即θ1、θ2、θ3、θ4之和为1;pro_otherpro_sim表示当前提案内容与其他参与人员提案内容画像相似度数据,ownpro_otherpro_sim表示当前参与人员提案内容画像与其他参与人员提案内容画像相似度数据,linkpro_otherpro_sim表示当前参与人员历史联名人提案内容画像与其他参与人员提案内容画像相似度数据,ownfield_otherfield_sim表示当前参与人员提案类别画像与其他参与人员提案类别画像相似度数据;遍历当前届次的其他参与人员,获取与其他参与人员的联名人推荐重要度数据,按照得分从大到小排序,取出得分最高的k个其他参与人员作为最终推荐的联名人。9.一种联名人推荐系统,其特征在于,包括参与人员画像模型和联名人推荐模块;所述参与人员画像模型包括参与人员画像提取器和参与人员画像储存器;所述参与人员画像提取器和参与人员画像储存器,分别用于获取和存储所有参与人员的画像数据,所述画像数据包括参与人员提案类别画像向量数据、参与人员提案内容画像向量数据和参与人员历史联名人画像统计数据;所述联名人推荐模块,用于将待提交提案的内容进行文本向量化处理得到当前提案内容画像向量数据,基于所述当前提案内容画像向量数据及当前届次的所有参与人员的所述画像数据计算出相似度数据;所述联名人推荐模块,还用于基于所述相似度数据计算出联名人推荐重要度数据,根据所述联名人推荐重要度数据的大小将对应的参与人员进行排名,输出前k个参与人员作为最终的推荐联名人。

技术总结


本发明涉及一种联名人推荐方法及推荐系统,所述方法包括:获取并存储所有参与人员的画像数据,所述画像数据包括参与人员提案类别画像向量数据、参与人员提案内容画像向量数据和参与人员历史联名人画像统计数据;将待提交提案的内容进行文本向量化处理得到当前提案内容画像向量数据,基于所述当前提案内容画像向量数据及同届次的所有参与人员的所述画像数据计算出相似度数据;基于所述相似度数据计算出联名人推荐重要度数据,根据所述联名人推荐重要度数据的大小将对应的参与人员进行排名,输出前K个参与人员作为最终的推荐联名人。本发明在参与人员完成一篇提案或者建议时,智能化推荐出一些候选参与人员供提交参与人员选择。选择。选择。


技术研发人员:

许建兵 费维进 瞿平飞 李强

受保护的技术使用者:

安徽商信政通信息技术股份有限公司

技术研发日:

2022.11.03

技术公布日:

2022/12/12

本文发布于:2024-09-20 14:49:00,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/2/33059.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:提案   人员   画像   向量
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议