一种面向中文专利文本的实体抽取方法和系统
CN201810694442.9,一种面向中文专利文本的实体抽取方法和系统,本发明提供了一种面向中文专利文本的实体抽取方法和系统,包括预处理模块、基于词性模板的候选实体抽取模块、和基于原文匹配的候选实体抽取模块。其中,预处理模块主要是把非结构化的文本转换为半结构化文本以便降低抽取难道,并把切割好的半结构化文本及其相应的词性序列输入到下一模块;基于原文匹配的候选实体抽取模块主要是对基于词性模板的候选实体抽取模块的后处理,主要是针对基于词性模板的候选实体抽取模块输出的非实体词,追溯这些词出现的原文,进行上下文
时间:2023-03-13 热度:17℃