专利类型:发明专利
发明人:刘晋,张鑫,李云辉
申请号:CN201910403196.1
申请日:20190515
公开号:CN110390251A
公开日:
20191029
专利内容由知识产权出版社提供
摘要:本发明提供了一种基于多神经网络模型融合处理的图像文字语义分割方法,包括多个/多种语义分割模型训练方法和多模型融合处理方法两部分。本发明利用多尺度全卷积神经网络模型MSFCN、U型全卷积神经网络模型U‑net、基于区域的全卷积神经网络模型R‑FCN、更快的基于区域卷积神经网络模型Faster R‑CNN等多个语义分割网络模型对图像中文字区域进行语义定位,但不限于上述的4种语义分割网络模型,可调整与替换为其他基于全局或者局部区域的多个/多种的语义分割神经网络模型。本发明利用深度神经网络技术可以在有效地排除复杂非文字区域干扰的同时,对包含各种文字大小、文字颜、文字字体、文字语种的文字区域进行语义分割,适用范围广、鲁棒性强。
申请人:上海海事大学
地址:201306 上海市浦东新区临港新城海港大道1550号
国籍:CN
代理机构:上海互顺专利代理事务所(普通合伙)
代理人:成秋丽