专利类型:发明专利
发明人:李曙光,宋万军,倪良胜,李峰,陈白雪,高永伟,姜广栋,杨万刚,郭晓杰,王黎黎
申请号:CN201911217802.7
申请日:20191203
公开号:CN110990570A
公开日:
20200410
专利内容由知识产权出版社提供
摘要:本发明公开了一种基于深度学习的邮件落款提取方法,包括:收集样本,提取所收集的正文,对正文进行标记,标签为是否有邮件落款;使用机器学习的方法,训练一个文本分类模型,利用所述文本分类模型判断中是否含有落款;筛选出含有落款的邮件正文,使用深度学习的方法,进行序列标注,并训练命名实体识别模型,提取其中的姓名、公司和地址信息;使用模式识别的方法,先提取邮件正文中结构化的手机、电话的模式,然后使用模式识别提取其中的手机、电话信息;对提取的信息进行校验,得到最终的落款。本发明将邮件正文中的落款信息进行结构化,对处理时可以通过信息抽取,识别并得到发件人的落款信息。 申请人:南京烽火星空通信发展有限公司
地址:210019 江苏省南京市建邺区云龙山路88号烽火科技大厦A栋26F
国籍:CN
代理机构:南京经纬专利商标代理有限公司
代理人:曹佩佩