训练数据生成方法及系统[发明专利]

专利名称:训练数据生成方法及系统专利类型:发明专利
发明人:豆浩斌,陈博,朱风云
申请号:CN202011378838.6
申请日:20201201
公开号:CN112200158A
公开日:
20210108
专利内容由知识产权出版社提供
摘要:本发明公开了一种训练数据生成系统,包括文本生成器、版式生成器、文本渲染器、图表渲染器、噪声添加器、形变添加器、标注生成器、文档图像样本库;文本渲染器选取文本行并将其渲染至文本行位置区域;图表渲染器将图表元素渲染至图表元素的位置区域;标注生成器生成版式分析标注信息、文本定位及识别标注信息。此外,本发明还公开了一种训练数据生成方法。本发明考虑了文档图像产生过程中的各种因素,并将因素模块化、参数化、可配置化,能够自动生成应用于文档图像分析与识别系统的训练样本,合成得到的文档图像形式丰富、效果逼真,且整体灵活可调、扩展性强,还可以自动完成文档图像各级信息的标注,提供完整标注的训练数据。
申请人:北京灵伴即时智能科技有限公司
地址:100083 北京市海淀区王庄路1号院2号楼9层10-A1-3
国籍:CN

本文发布于:2024-09-21 18:38:27,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/753109.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:标注   生成   图像   文本   文档   信息   图表   渲染器
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议