自然场景中文本检测技术研究综述作者:戴津压缩空气过滤
来源:《计算机光盘软件与应用》半导体激光器结构2013年第18期 abs-210 连通区域
摘 要:图片中含有丰富的文字信息,这有利于正确理解图像内容,并对构建基于图片内容进行检索的系统具有重要意义。本文将基于自然场景中的文字特征的文本检测技术,进行了分类分析,并对国内外的研究现状进行了阐述。 关键词:自然场景;文字检测
中图分类号:TP391.41抽风式笔记本散热器
1 图像中文字检测的相关知识
文字检测的目的是从场景中检测出文字区域。我们可以从以下角度对图像中的文字信息进行分析:
1.1 文字的颜特征
典型的文档图像一般为二值化图像,即黑为前景文字,背景为白。这便于文字的检测识别。但是对于自然场景图片,则大多为彩。使得单从像素上区分文字和背景变得困难,但是同一文字块当中往往具有相同的颜。且在文字区域,会产生强烈的亮度变化。
1.2 文字的结构特征
典型文档图像的布局都是经过精心设计,相对固定以便于读者阅读。这就降低了文本区域的分割的难度。但是对于自然场景当中的文本,它可能出现在图像的任意位置,并且往往字符稀疏,字符对齐方式没有严格要求。但是对于同一文本块内,文字的字体和字号往往保持一致,汉字在同一字体和字号下,其高度和宽度以及粗细一致,线条平直。
tvline 1.3 文字的空间特征
自然场景图片中的文字通常以文字区域块的形式出现。在文字区域块内,字符的间距保持不变,并且一般成水平排列,汉字有时会呈现垂直排列,但一般位于文字区域块内。对自然场景中的文字进行识别,就是利用这写这些特征进行文字检测、定位和分割的过程。
2 图像中的文字检测
图像中的文字检测,是以文字块为对象,出其在图像中的位置。主要的判断依据为文字的颜特征、结构特征、空间特征等。对图像中文字的检测方法主要有:基于边缘,基于连通域,基于纹理特征。