文本识别结果处理方法、装置及计算机可读存储介质[发明专利]

专利名称:文本识别结果处理方法、装置及计算机可读存储介质
专利类型:发明专利
发明人:杨建国,詹镇江
申请号:CN202011487618.7
申请日:20201216
公开号:CN114637816A
公开日:
20220617
专利内容由知识产权出版社提供
摘要:本公开提供了一种文本识别结果处理方法、装置及计算机可读存储介质。该方法包括:获取文本识别模型的文本识别结果,并检测词库中是否存在与文本识别结果匹配的文本;当不存在匹配的文本的情况下,对文本识别结果进行切词得到词语集合;根据词语集合中每个词语在词库的倒排索引中的倒排索引信息,获取与文本识别结果匹配的文本集合;从文本集合中选择一个文本作为最终的文本识别结果。通过本公开,解决了相关技术中文本识别结果的准确率低的问题。
申请人:第四范式(北京)技术有限公司
地址:100085 北京市海淀区清河中街66号院1号楼九层LO901-1号
国籍:CN
代理机构:北京铭硕知识产权代理有限公司

本文发布于:2024-09-22 15:26:41,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/758848.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:文本   识别   结果   集合
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议