一种关键词提取方法及计算设备[发明专利]

专利名称:一种关键词提取方法及计算设备专利类型:发明专利
发明人:李拓航,迟令,李宏图,孙成宇,李帅,胡亮申请号:CN202010941205.5
申请日:20200909
公开号:CN111985217A
公开日:
20201124
专利内容由知识产权出版社提供
摘要:本发明公开了一种关键词提取方法,在计算设备中执行,包括以下步骤:获取待提取关键词的文本,该文本中包括多个候选词;对于每一个候选词:分别确定该候选词与其他候选词的相似度,将该候选词与其他候选词的相似度的和作为该候选词的覆盖率;根据该候选词在文本中的位置来确定该候选词的位置特征值:确定该候选词的主题概率分布,将概率的最大值作为该候选词的语义多样性;根据覆盖率、位置特征值、语义多样性来确定该候选词的综合特征值;将综合特征值最大的预设数量个候选词作为文本的关键词。本发明一并公开了相应的计算设备。
申请人:吉林大学
地址:130012 吉林省长春市前进大街2699号
国籍:CN
代理机构:北京思睿峰知识产权代理有限公司

本文发布于:2024-09-23 01:17:46,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/2/415502.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:特征值   计算   关键词   提取   设备
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议