专利名称:一种端到端文本检测和识别方法专利类型:发明专利 发明人:姜华,王晴晴,杜沁益,李蔡元
申请号:CN202110344324.7
申请日:20210331
公开号:CN112733822A
公开日:
20210430
专利内容由知识产权出版社提供
摘要:本发明属于视觉识别的技术领域,公开了一种端到端文本检测和识别方法,利用对输入文本图像的语义分割结果过滤掉背景像素,生成预置文本框集,再对其中的预置文本框边缘上的多个基准点进行分类和回归预测,检测出目标文本框,然后利用尺度变换和空间变换对输入文本图像进行特征提取,并使用特征相似性约束策略对识别器进行训练,最后利用训练好的识别器对目标文本框中的字符序列进行识别。本发明对自然场景图像中的文本进行端到端的检测和识别,在考虑到模型效率的同时,提升了模型对弯曲文本和低分辨率文本的鲁棒性,具有创新和实际应用价值。 申请人:上海旻浦科技有限公司
地址:200120 上海市浦东新区张衡路200号2幢3层
国籍:CN
代理机构:上海恒慧知识产权代理事务所(特殊普通合伙)
代理人:张宁展