【CN110083607A】一种简历快速搜索方法、系统和存储介质【专利】

(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 (43)申请公布日 (21)申请号 201910342733.6
(22)申请日 2019.04.26
(71)申请人 毕昀
地址 100025 北京市朝阳区慈云寺桥远洋
国际E座25层
(72)发明人 毕昀 
(74)专利代理机构 北京一品慧诚专利代理事务
所(普通合伙) 11762
代理人 黄岳巍
(51)Int.Cl.
G06F  16/22(2019.01)
G06F  16/2455(2019.01)
(54)发明名称
一种简历快速搜索方法
系统和存储介质(57)摘要
本发明提供一种简历快速搜索方法、系统和
存储介质。所述简历快速搜索方法包括:简历获
取和存储步骤,其获取简历数据并将简历数据存
储到简历库中;索引生成和存储步骤,其基于所
述简历数据生成索引并以分布式方式存储所述
索引;搜索步骤,其基于接收到的检索关键词在
所述索引中进行搜索,并返回搜索结果。该简历
快速搜索方法能够实现简历快速搜索,在保证搜
索准确性的前提下,
提高简历搜索速度。权利要求书1页  说明书6页  附图3页CN 110083607 A 2019.08.02
C N  110083607
A
权 利 要 求 书1/1页CN 110083607 A
1.一种简历快速搜索方法,其特征在于,该方法包括:
简历获取和存储步骤,其获取简历数据并将简历数据存储到简历库中;
索引生成和存储步骤,其基于所述简历数据生成索引并以分布式方式存储所述索引;
搜索步骤,其基于接收到的检索关键词在所述索引中进行搜索,并返回搜索结果。
2.根据权利要求1所述的简历快速搜索方法,其特征在于,基于所述简历数据生成索引并以分布式方式存储所述索引包括:
创建索引,所述索引包括多个索引分片,所述多个索引分片被分配至集的N个节点进行存储,其中N为大于1的正整数;
基于每条简历数据生成该条简历数据的索引文档,并将所述索引文档存入相应的索引分片;
在全部索引文档存储完毕后,为每个索引分片复制至少一个分片副本,并将分片副本存储到集的相应节点上,使得每个索引分片与其分片副本存储在不同节点。
3.根据权利要求2所述的简历快速搜索方法,其特征在于,基于每条简历数据生成该条简历数据的索引文档包括:
对该条简历数据进行中文分词;
基于分词结果提取分别与简历的各个维度对应的简历关键词;
将所提取的简历关键词写入该条简历数据的索引文档的相应字段。
4.根据权利要求3所述的简历快速搜索方法,其特征在于,中文分词通过IK分词技术实现。
5.根据权利要求2所述的简历快速搜索方法,其特征在于,在所述搜索步骤中,基于所述检索关键词在集的各个节点上进行并行搜索。
6.根据权利要求2所述的简历快速搜索方法,其特征在于,所述N个节点中包括一主节点和N-1个从节点,所述主节点通过选举产生,当所述主节点出现故障时,通过选举在从节点中产生新的主节点。
7.根据权利要求6所述的简历快速搜索方法,其特征在于,在搜索步骤中,由各从节点将其搜索结果发送至主节点,并由主节点汇总并返回搜索结果。
8.根据权利要求1所述的简历快速搜索方法,其特征在于,所述简历快速搜索方法进一步包括展示所述搜索结果,其中,所述检索关键词在所述搜索结果中高亮显示。
9.一种简历快速搜索系统,其特征在于,所述简历快速搜索系统包括:
简历获取和存储装置,其获取简历数据并将简历数据存储到简历库中;
索引生成和存储装置,其基于所述简历数据生成索引并以分布式方式存储所述索引;
搜索装置,其基于接收到的检索关键词在所述索引中进行搜索,并返回搜索结果。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序能够被一个或者多个处理器执行,以实现权利要求1至8中任一项所述的简历快速搜索方法。
2

本文发布于:2024-09-21 15:35:59,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/2/404107.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:简历   搜索   方法   数据   节点   分片   特征
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议