一种端到端文本检测和识别方法[发明专利]

专利名称:一种端到端文本检测和识别方法专利类型:发明专利
发明人:姜华,王晴晴,杜沁益,李蔡元
申请号:CN202110344324.7
申请日:20210331
公开号:CN112733822A
公开日:
20210430
专利内容由知识产权出版社提供
摘要:本发明属于视觉识别的技术领域,公开了一种端到端文本检测和识别方法,利用对输入文本图像的语义分割结果过滤掉背景像素,生成预置文本框集,再对其中的预置文本框边缘上的多个基准点进行分类和回归预测,检测出目标文本框,然后利用尺度变换和空间变换对输入文本图像进行特征提取,并使用特征相似性约束策略对识别器进行训练,最后利用训练好的识别器对目标文本框中的字符序列进行识别。本发明对自然场景图像中的文本进行端到端的检测和识别,在考虑到模型效率的同时,提升了模型对弯曲文本和低分辨率文本的鲁棒性,具有创新和实际应用价值。
申请人:上海旻浦科技有限公司
地址:200120 上海市浦东新区张衡路200号2幢3层
国籍:CN
代理机构:上海恒慧知识产权代理事务所(特殊普通合伙)
代理人:张宁展

本文发布于:2024-09-20 22:34:46,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/760279.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:文本   进行   文本框   图像
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议