舌体图像分割技术的实验分析与改进

舌体图像分割技术的实验分析与改进
史淼晶1,李国正1*,李福凤2,王忆勤2
1同济大学控制科学与工程系,上海,201804
邢质斌广告2上海中医药大学中医四诊信息化实验室,上海,201203
*通讯作者Email:gzli@tongji.edu
摘要: 数字舌像图片的正确分割是中医舌诊自动化技术的关键。因为舌体特征的多样性,经典成熟的分割算法并不适用。首先对近五年来该领域已有工作,尤其是Snake算法的研究进展,分类用临床图片测评总结,讨论各类代表性算法的优缺点。最后在已有三个主流算法基础上通过改进提出了三个新算法,不同程度上提高了已有主流算法舌体分割的效果。
关键词舌诊;舌体分割;Snake算法;实验测评;算法改进
中图分类号:TP391.41
An empirical study on tongue image detection
SHI Miaojing1, LI Guo-Zheng1*, LI Fufeng2, WANG Yiqin2
1Department of Control Science and Engineering, Tongji University, Shanghai, 201804
2Laboratory of Traditional Medical Syndromes,
Shanghai University of Traditional Chinese Medicine, Shanghai, 201203
*Email: gzli@tongji.edu
浙江海洋学院学报Abstract:The extraction of tongue area from digital image is essential to an automatic tongue diagnostic system in Traditional Chinese Medicine. Classic image segmentation methods couldn’t be effective due to its feature diversity. first try to categorize existing research in this field for recent 5 years, especially for Snake mold ,practical test will be given at the same time so as to summarizing advantages and disadvantages of representative methods. Three innovated approaches are proposed afterwards, which improve the performances at certain degree.
Key words: tongue diagnoses; tongue segmentation; Snake; practical test; innovated approach
0.引言
舌诊是传统中医“望诊”的主要内容之一,是最具有中医特的传统诊断方法。舌象也是反映人体生理功能和病理变化最敏感的指标,在中医诊疗过程中具有重要的应用价值。应用图像技术,建立舌诊信息的客观、量化识别方法,实现中医舌诊的客观化,对中医现代化具有重要意义[1]。舌诊专家系统中,病人的舌图经过数字采集仪器(数码相机,摄像头等)获得后,必须首先对目标区域进行智能化自动分割。因此,舌象分割成为连接图像采集和图像分析的重要一环,分割质量将直接影响到后续工作。湖水净化
图像分割技术是图像处理领域的一个经典问题,算法已超过1000种,但大多数算法都是根据具体问题提出的,并没有一种相对普适的算法。舌体图像分割中的挑战在于以下几点:
i.舌的颜与脸的颜特别是唇的颜容易混淆。
ii.特定拍摄环境下,不同光照、不同人、不同舌体形状以及拍摄位置都会影响图像质量。iii.舌作为一个软体本身没有固定的形状,相对于硬体的边缘提取更加困难。
iv.从医学病理学的角度来看,舌体本身并不平滑,舌苔舌质因人而异病理特征很不相同,这给舌体分割带来很大困难,舌体本身的裂纹、舌苔块也都会严重影响舌体的分割。
基金项目:国家自然科学基金(60873129, 30901897);上海市青年科技启明星计划(08QA140320
0). 资助作者简介:史淼晶,男,陕西人,本科生;李国正,男,博士,副研究员,研究方向为机器学习,中医信息学;李福凤,女,博士,副教授,王忆勤,女,博士,教授,研究方向为中医诊断学。
舌体分割具有一定的挑战性,研究者已经且正在提出一些新的算法,本文将系统调研用于舌体分割的经典算法和特定算法,系统分析之后提出三种改进的新算法。第二节将近五年来主要的舌体分割技术归类为以下四方面:(1)基于区域的分割技术,包括阈值分割,区域生长以及特征空间聚类等,并将颜空间也归入此类;(2)基于边缘的分割技术,包括边缘提取,边缘拟合以及边缘跟踪算法等;(3)结合特定理论工具的算法诸如神经网络,遗传算法,模糊集算法,支持向量机以及借助于数学形态学、统计模式识别等的方法;(4)Snake算法在舌体分割效果较好,单独一部分介绍应用于舌体分割的工作。第三节将从每一类中选取代表性算法进行重点分析讨论其优缺点,并对其进行了一定的改进,提高了舌体分割的效果。第四节对所做工作进行总结并做出展望。
本文将对所提及代表性技术通过实际图片进行测试,为了得到可比较的结果,统一采用图1所示三张图片,从左向右依次代表中医舌诊中三种舌体病理特征:齿痕,花剥,红,大小以像素为单位分别是400*324, 360*460, 316*354。文中将分别以性状名代表每张图片。
标准布朗运动
图  1. 舌体分割测试图片(a) 齿痕,400*324;(b) 花剥,360*460;(c) 红,316*354。
Fig1. Test images for tongue segmentation (a) indentation, 400*324; (b)exfoliative fur,360*460;
(c)red tongue,316*354.
1.舌象分割技术
1.1区域分割技术
区域分割是根据区域数值的相似性和空间的接近性,在特定的评判标准下把像素分配到某个区域,从而把这些像素与图像其它部分分开。可分为基于阈值的区域分割技术与基于种子点的区域自增长技术
以及特征空间聚类等方法。
①基于阈值的分割
统计图像的颜通道直方图,相同或相近的颜将会在直方图上显示出峰值特征,如牙齿,舌头,脸等,而它们之间则呈现谷值特征,取两峰之间谷值为阈值进行颜归类,可以相应的实现分割。算法应用到图1的测试图片可以得到图2。可以看出这种方法有很大的随机性,不同的拍摄条件与不同的舌体差异很大,许多时候并不能得到峰谷特征很明显的直方图。此外因为阈值选择的不确定性与全局唯一性,无法对具体某块区域进行最优阈值分割,因而无法保证精确性。对此文献[2]在提取舌根部分假设舌根与唇之间总是存在一块黑阴影区域,利用大津算法迭代搜索局部直方图最优阈值可以精确提取阴影边缘如图3。此外,文[2]中还提到整幅图片最暗处必然在此阴影区域内,因此若将图像亮度I(Intensity)值向侧面投影积分到积分最小的投影行,如图3中黑区域横贯的白线,以此线为基准在二值化图像中寻第一个0/1分界点必然是舌根边缘。这个特征虽然不是总存在的(某人拍照时可能嘴张得不大),但绝大多数情况是成立的,并且是十分有意义的。如果再能够自动确定左右边界,则就可以跟踪出舌根轮廓。
图  2.基于统计直方图的舌体分割。
Fig2. Tongue segmentation based on stati stical histogram.
图  3. 基于大津算法的舌体分割,图中直线代表整个图片的最暗行Fig3. Tongue segmentation using Otsu’s method, the white straight line represents the darkest row.
②区域生长与合并技术
该方法首先将图像分成若干大小不等的区域,到每个区域的中心点,依据一定的算法与阈值判断中心周围像素是否属于同一区域(在阈值范围内),当区域生长到一定阶段后不同区域之间再以一定方法(例如阈值法)合并,完成整幅图像的分割。该算法对阈值的依赖性较大,不同的区域生长、合并需要不同的阈值,目前普遍的方法是通过植入种子点控制,降低生长难度。也可以计算机自动完成。
这需要结合有关物体的特征与图像的特性,较为复杂。多数时候分割出的形状与实际舌形相差甚远。文献[3]提出拍摄时与闪光灯光线垂直处存在边缘阴影,基于此寻到局部阴影区后进行相应的扩张来弥补区域增长的不足,取得了一定的效果。但这样的扩张是在小范围内进行的,如果初始的增长的结果与实际结果相差甚远则无法达到效果。
目前许多研究都试图不引入人工干预下自动完成舌体分割,虽然取得了一定的结果,但是实用性远不如植入种子点好。因此着眼于如何使植入种子点自动化的方向研究也是很有意义的,文献[4]在唇的定位提取时就结合唇的特征自动获取若干种子点后再利用唇的对称性进行边缘提取,取得了不错的效果。
③基于聚类的算法
利用特征空间聚类的方法进行图像分割可以看作是对阈值分割概念的推广。它将像素按照特征值不同对应表示不同特征空间点,将这些点聚集成不同区域的类别以便分开,然后映射回原图像得到分割结果。在直方图阈值分割中,取像素灰度为特征,灰度直方图为特征空间,利用灰度阈值进行特征空间划分;灰度-梯度散射图的分割方法中,取像素灰度和梯度为特征,用散射图作为特征空间,对特征空间的划分利用灰度阈值和梯度阈值进行。与取阈值分割方法类似,聚类方法也是一种全局方法,比仅基于边缘检测的方法更抗噪声。但特特征空间的聚类有时候也会导致产生图像空间不连通区域,这也
是因为没有利用图像像素空间分布的信息。常用聚类方法有K-mean和Mean-shift [5]等。本文将在下面更新的模糊空间聚类算法中进行评测。
④颜空间
图像的默认RGB颜空间并不能很好的与人眼的观感结合,因此在图像处理时候更多是转化为适宜人眼的HSI空间。基于舌体颜的特殊性,文献[6]提到基于H通道特征的主动轮廓选择技术,文献[2]也研究了RGB空间中G通道和B通道差的绝对值应用到舌体的效果。目前来说颜空间的运用主要都是与其它算法结合使用的。本文实际测试时发现该技术对一些舌图起到较好的效果(尤其针对舌象本身较红的特性,颜越红效果越好),但是对另一些图片光照条件不好,或病人本身舌的颜与脸较接近,舌苔发生病变等要想准确提取出舌体轮廓,还是很困难。如图4列出了测试结果,其中H1为H改进模型,H2对应文献[6]中的H模型,实测时给出H1、H2测试中较好的结果。因为|G-B|空间[2]对这三张图片基本没有效果,故未列出。
图4. H空间图像
Fig4. H-channel color space image.
1.2边缘检测技术
①经典边缘检测算子
图像边缘通常与图像的亮度或亮度的一阶导数有关。像素梯度反映了一阶导数的阶跃特性,通过检索图像梯度的变化来确定边缘算法有robert、sobel、prewitt、canny等边缘检测算子[7]。因为舌舌苔颜的特殊性(有许多沟壑纹理、块噪声),这些经典算子不适用,往往误差较大。边缘算子的预处理是必不可少的,需要加入一个平滑滤波器,如线性的均值滤波器、高斯滤波器或者非线性的中值滤波等。针对舌象颜的高斯特性,本文采用高斯滤波加canny算子对图1测试图像进行测试,得到如图5所示结果。观察图5中的三幅图可以看出即使经过高斯滤波后噪声大为降低,但因为经典检测算子梯度阈值设置的全局性将舌体边缘以及其它符合阈值梯度阶跃边缘(舌裂纹、唇的边缘)都提取了,因此很难分割得到舌体。
图  5. 高斯滤波后canny算子边缘检测
Fig5. Edge image utilizing canny operator and Gaussian smoothing.
②边缘跟踪
跟踪技术分为区域跟踪与曲线跟踪。区域跟踪的本质实际是属于区域增长法的一部分。在边缘检测中主要用到的是曲线跟踪。用跟踪准则检查“当前点”的邻点,满足一定的条件的像点做为新的当前点并做上标记,这个过程称为跟踪。跟踪中可能会遇到某个像素点的多个邻域像素点都满足条件,这时候需要根据具体条件取舍,如果有必要应该将那些舍弃的点存储起来,以便当某条支路错误时候重新递归。跟踪算法对图像质量要求比较高,要尽量少的毛刺和分支,否则将出现死循环或者分叉,并不能达到期望的效果。本文结合舌体形状[8-9] 利用canny算子双尺度变
滨蛇床
换,基于这样的假设:在小尺度canny算子中从下向上搜索第一个白切点(下凸)就为舌体的最低点,以此在大尺度canny边缘图像中检索边缘可以自动得到图6,实测时根据舌形的特定弧形特征改进算法使得曲线跳过局部断点。对照图6依然存在的问题在于:a) 边缘断线;b) 双舌尖:不但对定位不利,同时唇与舌的轮廓分叉,边缘沿着唇的轮廓检索了;c) 因为没有及时设置停止导致边缘一致检索到断线超出了舌体范围。以上是自动边缘检索的局限性,在第四节中还将详细讨论加入控制点并且与其它算法结合后边缘检测所能达到的效果。
图  6. 边缘跟踪测试结果
Fig6. Results by using edge tracking.
③边缘拟合
另一类曲线跟踪算法则是在已知曲线形状的情况下进行的拟合跟踪,已知曲线形状的表达式通过设置控制函数使得曲线不断与已知函数逼近来实现拟合,无法给出闭合表达式的情况下则可以分段迭代的方法,或者通过Hough变换来搜索。文献[10]在人工植入边缘种子点的前提下,利用B-spline方法通过定义拟合函数,不断使方差最小得到舌体边缘。
1.3特定理论工具分割
①神经网络与遗传算法
领航中国文艺晚会
人工神经网络由一组互相连接的相同节点构成,20世纪80年代提出的多层感知机就是通过输出到输入的反馈反复训练各个节点的权值,最终使得整个系统输出与期望输出相当,动态平衡。遗传算法是一种基于生物自然选择与遗传机理的随机搜索与优化方法。遗传算法作为一种迭代的优化算法,用于分割时常帮助确定阈值。因为它具有全局搜索能力,可以与许多其它算法结合,可以取得很好的效果,例如将它与C-均值聚类法结合可以避免聚类陷入局部最小点,同时可以尽快达到最优;当与模糊聚集合论结合可以提高分割的鲁棒性。也可以与神经网络结合,例如Zhou et al.人在文献[11]在提取舌下腺时将舌的对称性引入遗传算法(GA)与人工神经网络(ANN), 前者实现了舌体区别于人脸和脖子的定位,而根据正常舌体具有大致的对称性,肿瘤部分的对称性很差的特点见,利用模糊集理论提取对称特征,在神经网络中学习实现了对舌下腺瘤的检测与提取。
②模糊集聚类
为用不精确的知识表达事件,人们提出模糊集合的概念。模糊集合能较好的描述人类视觉中的模糊性与随机性,在模式识别的各个层次都可以使用模糊集合理论。文献[12]就利用模糊集和粗糙集理论通过哈夫聚簇实现了舌体分割。模糊C均值聚类算法FCM通过对目标函数迭代优化实现集合划分,可以表示出各个像素属于不同类别的程度,相较于硬聚类算法将每个像素都直接分到某个类中去,FCM更适合人类视觉的观感。将FCM应用到图1,得到图7分割结果。图中将聚类后判别属于同一类包括舌头的图像保留,其余素置为黑。可以看到虽然与阈值分割相比模糊聚类算法因为采用了启发式学习
过程更为精确,但因为整个过程是无监督的,并且受限于聚类算法本身所能达到的精度,不可避免的会导致将与舌体相似区域(如嘴唇)归为同一类,甚至观

本文发布于:2024-09-22 18:18:33,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/307853.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:分割   算法   舌体
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议