专利名称:简历信息抽取方法及系统专利类型:发明专利 发明人:张剑,苏彦源,章志
申请号:CN201911114587.8
申请日:20191114
公开号:CN110888927A
公开日:
20200317
专利内容由知识产权出版社提供
摘要:本发明涉及一种简历信息抽取方法及系统,该方法包括A.获取简历数据;B.利用BERT中文预训练模型和数据增广技术对简历数据转换成简历文本后根据其句子特征进行分类;C.将分类好的简历文本句子利用BERT+BiGRU+CNN+CRF模型进行命名实体识别,进而提取出需要的信息元;D.将提取出来的信息元存储在数据库中,结构化输出对应的信息。而该系统主要由简历获取模块、输入模块、分类模块、信息元抽取模块、存储模块和输出模块六个模块组成。本发明使用了增量学习方法,在分类模型的数据预处理中使用了分句方式,使语言模型能够在继承过去参数的基础上,通过增量式地输入新训练数据来调整参数,具有更好的连续性和泛化能力。 申请人:东莞理工学院,深圳市慧点思创科技有限责任公司
地址:523808 广东省东莞市松山湖区大学路1号
国籍:CN
代理机构:东莞恒成知识产权代理事务所(普通合伙)
代理人:邓燕