多层次特定类型图像过滤方法

多层次特定类型图像过滤方法
段立娟 高文崔国勤张洪明
(中国科学院计算技术研究所 100080)
摘要 随着网络技术和多媒体技术的发展,对互联网上信息的监督和控制越来越重要。尤其目前互联网情图像、情录像的传播问题越来越严重,为有效杜绝此现象,本文提出一种基于计算机视觉和模式识别的裸体图像过滤方法¾ ¾ 多层次特定类型图像过滤法,该方法通过研究人眼视觉对图像的分析机理,提出综合肤模型检验、支持向量机(SVM)分类和最近邻方法校验的多层次图像处理框架,实验结果表明,该方法能够达到85%以上的准确率。
A Hierarchical Method for Nude Image Filtering
Lijuan Duan, Wen Gao, Guoqin Cui and Hongming Zhang
Institute of Computing Technology, Chinese Academy of Sciences,
Beijing 100080
Abstract Internet is a double-edged technology, it pushes the development of multimedia, in other hand, and many pornographic images and videos might make problem to young generation. Techniques are needed to keep these images away from children. We developed a hierarchical nude image detection system. In the processing, images were filtered firstly by skin color model. Then, images were classified by support vector machine. Finally, images were verified by nearest neighbor. Experiments show that 85% images contain nude could be filtered accurately.
关键词图像过滤,肤模型,SVM,最近邻
1 引言
互联网正在改变着人们的生活方式,促进着全球化经济的形成。然而互联网也给一些犯罪分子带来了有机可乘的机会,例如传播情图片、非法政治活动、制造病毒、散布谣言或进行匿名恐吓的行为。必须对互联网进行有效的管理和监控,针对这些问题,有关部门已经采取了相应的措施,例如身份验证、加密与数字化水印技术、采用防火墙技术和设立网上警察等,这些措施对有效打击上述犯罪现象起到重要作用。但是,目前蔓延比较严重、难以人工加以控制的就是情小说、情图像与情录像的传播问题。据美国有关机构的调查,全球现有的站多达50万个,一个人在因特网上随便点击,平均每七次,就有一次可能会点击到情站点。
网络空间的情传播已在全球引起了关注,一些预防网络情的软件相继被推出。例如,美籍华人施颖裕推出的网络情防范系统软件“网络情锁”(X -STOP)和美国太阳微系统软件公司开发的"电子巡逻者",另外我国的清华大学推出了防黄软件"五行卫士",前两种软件主要采用网址库的形式来封锁址,而“五行卫士”软件采用人工智能技术,对进入计算机的中、英文信息进行分析甄别,只要计算机屏幕上显示任何有关情文字信息,无论其来自因特网还是光驱、软盘,都会马上关闭程序,并留下相关记录。上述软件在打击黄毒蔓延中起到了一定作用,但是为避开这些“黄毒卫士”的搜查,犯罪分子的作案手段也越来越狡猾,他们以篡改其他网站主页的方式或使用隐蔽代名词的方式来传播情图像,前一段时间某政府部门的网页居然被换成情画面,另外在法国曾出现过几起报案,在某些站点上以“茉莉花”为检索点,而查出的却是情图像。由此可见,仅仅采用封锁网址和过滤情文字信息的手段来进行网络扫黄是不够的,必须引入计算机视觉技术和语音识别技术,对嵌入在主页中的图像与相应的音频信息进行分析,才能有效打击情传播问题。早在1996年Forsyth[1]就利用计算机视觉和图像理解技术对裸体图片识别进行了研究,通过对图片肤分割和人体姿态的几何特征检测来判别图片是否含有裸体。本文提出了一种多层次的裸体类图片过滤方法,该方法综合肤模型、支持向量机(SVM)和最近邻方法多个处理算法的处理结果,依靠计算机视觉、模式识别等技术对嵌入在主页中的图像进行扫描,把含有裸体的图像过滤出来,以杜绝和减少情图像在网络上传播的机会,保护青少年的身心健康。
本文第二节主要介绍多层次特定类型图像处理框架、基于和颜空间的肤模型和支持向量机方法。第三节分析了多层次特定类型图像过滤算法的性能。第四节对该方法进行了总结。
2 多层次特定类型图像过滤
在本文中,裸体图像过滤问题被看作一个图像理解与识别问题,但是它与一般的人脸识别和指纹识别有所不同,主要是由于图像的背景条件比较复杂、光照条件不一致、人体的表现形式具有多姿态性,因此很难用一个统一的模型把所
有的特征表征出来。通过研究人眼视觉对图像的分析机理,我们提出了一种多层次特定类型图像处理框架,如下图所示。
图2-1 多层次特定类型图像处理框架
多层次特定类型图像处理框架融合了肤模型、支持向量机(SVM)和最近邻方法多个处理算法的处理结果。根据视觉对图像的分析机理和情图像本身的特点——有裸露肌肤,我们首先采用肤模型来检验待过滤图像,该模型可以有效地识别出图像上的肤区域。但是,有一定肤区域的图像并不一定是裸体图像,例如一张正常的人脸照片。为了进一步确定图像是否含有裸体,我们应用了模式识
别中的分类方法。图像分类是一个比较复杂的问题,本文采用在解决小样本、非线性及高维模式识别具有一定优势的支持向量机(Support Vector Machine, 简写为SVM)方法把图像分成两类,一类是非裸体图像,另一类是裸体图像。由于SVM本身的特性——对于测试样本分类错误率的期望的上界是训练样本中平均的支持向量占总训练样本数的比例,所以在训练样本是线性不可分的情况下,尽管可以用广义最优分类面把它们分开,但支持向量的个数会稍微多一些,分类器的错误率也就相对大一些,为避免错误的发生,我们采用了在图像检索中经常使用的最近邻方法。下面将详细叙述多层过滤算法的各个步骤。
2.1 肤模型检验
关于肤模型的理论,在人脸识别中早已被广泛使用[2][3][4]。H. Martin[2]设计了肤模型表征人脸,利用一个感光模型对输入图像修正和补偿,并建立人脸颜分类器,其输出作为神经网络的输入进行检测。Tony[3]等采用高斯混合模型表示人脸肤R、G、B各分量的统计分布,通过阈值比较判断像素是否为人脸像素。Forsyth[1]通过把R、G、B各分量转换成对数值,并进一步得到肤的
度和饱和度以进行肤分割。本文则对肤调在和颜空间中的分布做了线性化处理,具体过程如下。
空间到空间的转换用矩阵表示如下:
(2-1)
和是平面上的两个相互正交的矢量,度信号(即与之和)是一个二维矢量,称之为度信号矢量。每一种颜对应一个度信号矢量,它的饱和度由模值表示,调由相位角表示。
(2-2)
(2-3)
图2-2 彩空间中的度信号矢量 图2-3 空间上的肤调分布
图2-2是彩空间中的度信号矢量图。白和黑都由原点(0,0)表示,模值等于0,为任意相位角。在空间的平面上,肤的调介于
红与黄之间。根据对大量图像的彩分析,可以确定人的肤调的变化范围,如图2-3所示。把彩图像的象素由空间变换到空间,如果满
足条件:,则是肤点。上述肤模型能够有效提取肤区域,例如图2-5中的白区域表示从图2-4中提取的肤区域。但是该模型也会把一些与人的肤比较接近的其他区域当作肤区域,例如图2-7、2-9、2-11表示用该模型对图2-6、2-8、2-10过滤后结果,可以看出该肤模型难以
把肤与棕头发或灰背景分开,为此本文利用空间来过滤掉肤以外
的其他成分。
图2-4 图2-5 图2-6 图2-7
图2-8 图2-9 图2-10 图2-11
彩空间的表示法与表示法的原理基本一样,也使用分量表示颜
的亮度信息,和两个相互正交的分量表示彩信息。所不同的是度信号
的两个正交分量不是和分量,而是和分量。表示法的定义是基于
这样一个原则:对颜编码所得信号的冗余信息最少。或者说,人眼看不见的就无须传送和重现。其中度分量选在相角为123o的红和3030的青蓝调位置,度分量选在分解力弱的紫红和绿黄调位置上,充分利用
了人眼的分辨力。 将空间的平面逆时钟方向旋转330,就得到了空间的平面。从空间到空间的矩阵转换表示为[5]:
(2-4)
空间中,分量代表了从桔黄到蓝绿的调,值越小,包含的黄越多,蓝绿越小。所以肤在空间内的值在一个范围里变化,通过试验和统
计分析可确定其范围。
图2-12 空间内肤对应的值分布
实验结果表明,根据上述空间的分量分布可以确定肤区域,图2-13、2-14、2-15就是根据上述模型对图2-6、2-8、2-10进行肤分割的结果,显然它能区分灰背景、棕头发与肤区域。但是,该模型难以区分肤与黄绿,如图2-17是用上述模型对图2-16处理的结果。
图2-13 图2-14 图2-15 图2-16 图 2-17
实验结果表明,空间的相位角和空间的分量对肤有一定的表征能力,但是空间的相位角易于区分肤与黄绿,而空间的分量难以区分肤与黄绿,为此采用空间的相位角和空间的分量联合的方法来确定肤在度信息上的分布范围。即把彩图像的象素由
空间变换到空间和空间,如果满足条件:且
,则是肤点。上述肤模型能够有效提取亚洲人种和欧美人种肤区域,例如图2-18、2-19、2-20中的白区域分别表示从图2-6、2-
8、2-10中提取的肤区域,显然结果优于单独采用或。图2-21是对
图2-16过滤后的结果,结果表明和的结合对过滤黄绿等肤干扰是有益的。

本文发布于:2024-09-20 14:31:21,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/4/87393.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:肤色   图像   空间   色情   模型   方法
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议