图像分割传统方法整理

图像分割传统⽅法整理
图⽚分割根据灰度、颜⾊、纹理、和形状等特征将图像进⾏划分区域,让区域间显差异性,区域内呈相似性。主要分割⽅法有:
基于阈值的分割
基于边缘的分割
基于区域的分割
基于图论的分割
基于能量泛函的分割
基于阈值的分割⽅法
参考:
阈值法的基本思想是基于图像的灰度特征来计算⼀个或多个灰度阈值,并将图像中每个像素的灰度值与阈值相⽐较,最后将像素根据⽐较结果分到合适的类别中。因此,该类⽅法最为关键的⼀步就是按
照某个准则函数来求解最佳灰度阈值。
固定阈值分割:
固定某像素值为分割点。
直⽅图双峰法:
中央轴空病Prewitt 等⼈于六⼗年代中期提出的直⽅图双峰法(也称 mode 法) 是典型的全局单阈值分割⽅法。该⽅法的基本思想是:假设图像中有明显的⽬标和背景,则其灰度直⽅图呈双峰分布,当灰度级直⽅图具有双峰特性时,选取两峰之间的⾕对应的灰度级作为阈值。如果背景的灰度值在整个图像中可以合理地看作为恒定,⽽且所有物体与背景都具有⼏乎相同的对⽐度,那么,选择⼀个正确的、固定的全局阈值会有较好的效果.算法实现:到第⼀个峰值和第⼆个峰值,再到第⼀和第⼆个峰值之间的⾕值,⾕值就是那个阀值了。
迭代阈值图像分割:
1.统计图像灰度直⽅图,求出图象的最⼤灰度值和最⼩灰度值,分别记为ZMAX和ZMIN,令初始阈值T0=(ZMAX+ZMIN)/2;
2. 根据阈值TK将图象分割为前景和背景,计算⼩于TO所有灰度的均值ZO,和⼤于TO的所有灰度的均值ZB。
3. 求出新阈值TK+1=(ZO+ZB)/2;
4. 若TK==TK+1,则所得即为阈值;否则转2,迭代计算。
⾃适应阈值图像分割: 有时候物体和背景的对⽐度在图像中不是处处⼀样的,普通阈值分割难以起作⽤。这时候可以根据图像的局部特征分别采⽤不同的阈值进⾏分割。只要我们将图像分为⼏个区域,分别选择阈值,或动态地根据⼀定邻域范围选择每点处的阈值,从⽽进⾏图像分割。
⼤津法 OTSU (最⼤类间⽅差法):
⽇本学者⼤津在1979年提出的⾃适应阈值确定⽅法。 按照图像的灰度特性,将图像分为背景和⽬标两部分。背景和⽬标之间
的类间⽅差越⼤,说明构成图像的2部分的差别越⼤,当部分⽬标错分为背景或部分背景错分为⽬标都会导致2部分差别变⼩。因
此,使类间⽅差最⼤的分割意味着错分概率最⼩。
均值法:
把图像分成m*n块⼦图,求取每⼀块⼦图的灰度均值就是所有像素灰度值之和除以像素点的数量,这个均值就是阈值了。这种潘生丁
⽅法明显不⽐⼤津法好,因为均值法和⼤津法都是从图像整体来考虑阈值的,但是⼤津法了⼀个类间⽅差最⼤值来求出最佳
阈值的;这两种⽅法⼦图越多应该分割效果会好⼀点,但效率可能会变慢
最佳阈值:
阈值选择需要根据具体问题来确定,⼀般通过实验来确定。如对某类图⽚,可以分析其直⽅图等。
基于边缘的分割⽅法
参考:
图像中两个不同区域的边界线上连续的像素点的集合,是图像局部特征不连续性的反映,体现了灰度、颜⾊、纹理等图像特性的突变。
通常情况下,基于边缘的分割⽅法指的是基于灰度值的边缘检测,它是建⽴在边缘灰度值会呈现出阶跃型或屋顶型变化这⼀观测基础上的⽅法。阶跃型边缘两边像素点的灰度值存在着明显的差异,⽽屋顶型边缘则位于灰度值上升或下降的转折处。正是基于这⼀特性,可以使⽤微分算⼦进⾏边缘检测,即使⽤⼀阶导数的极值与⼆阶导数的过零点来确定边缘,具体实现时可以使⽤图像与模板进⾏卷积来完成。
边缘⾓点和兴趣点的检测器有:
Canny边缘检测器:
将图像P模糊化,然后与⼀堆正交微分滤波器(如Prewitt滤波器)做卷积⽣成分别包括⽔平和垂直⽅向上的导数的图像H和
V,对像素(i,j)计算其梯度⽅向和幅度。若幅度超过临界值就分配⼀条边缘(此处称为阈值法,但效果不佳)。canny使⽤⾮极⼤抑制的⽅法对那些不需要响应的进⾏删除。
Harris⾓点检测器:
对每个点周围的⽔平⽅向垂直⽅向的据ubu梯度进⾏考虑。⽬的在于到图像中亮度在两个⽅向上均发⽣变化的点,⽽⾮⼀个
⽅向(⼀条边缘)或者零个⽅向(平坦区域)。Harris⾓点检测器是基于对图像结构张量的决策。
SIFT检测器:
尺度不变特征转换,检测是⽤来识别兴趣点的第⼆中⽅法。不同与Harris⾓点检测器,SIFT将尺度和⽅向与结果中的兴趣点相关联。为了到兴趣点,,交替使⽤多种算⼦。
SURF检测器 *
SIFT的改进版。
基于区域的分割⽅法
参考:
按照图像的相似性准则划分为不同区域块。主要有种⼦区域⽣长法、区域分裂合并法、分⽔岭法等。
种⼦区域⽣长法
根据统⼀物体区域的像素相似性来聚集像素点达到区域⽣长的⽅法。其中由⼀组表⽰不同区域的种⼦像素开始,逐步合并种⼦周围相似的像素从⽽扩⼤区域。直到⽆法合并像素点或⼩领域为⽌。其中区
域内的相似性的度量可⽤平均灰度值、纹理、颜⾊等等信息。关键在于选择初始种⼦像素及⽣长准则。最早的区域⽣长图像分割⽅法是由Levine等⼈提出。
区域分裂合并法
区域分裂合并法(Gonzalez,2002),确定分裂合并的准则,然后将图像任意分成若⼲互不相交的区域,按准则对这些区域进⾏分裂合并。它可⽤于灰度图像分割及纹理图像分割。
分⽔岭法
分⽔岭法(Meyer,1990)是⼀种基于拓扑理论的数学形态学的分割⽅法,其基本思想是把图像看作是测地学上的拓扑地貌,图像中每⼀点像素的灰度值表⽰该点的海拔⾼度,每⼀个局部极⼩值及其影响区域称为集⽔盆,⽽集⽔盆的边界则形成分⽔岭。该算法的实现可以模拟成洪⽔淹没的过程,图像的最低点⾸先被淹没,然后⽔逐渐淹没整个⼭⾕。当⽔位到达⼀定⾼度的时候将会溢出,这时在⽔溢出的地⽅修建堤坝,重复这个过程直到整个图像上的点全部被淹没,这时所建⽴的⼀系列堤坝就成为分开各个盆地的分⽔岭。分⽔岭算法对微弱的边缘有着良好的响应,但图像中的噪声会使分⽔岭算法产⽣过分割的现象
基于图论的分割⽅法
参考:
三界演义
此类⽅法把图像分割问题与图的最⼩割(min cut)问题相关联。⾸先将图像映射为带权⽆向图G=,图中每个节点N∈V对应于图像中的每个像素,每条边∈E连接着⼀对相邻的像素,边的权值表⽰了相邻像素之间在灰度、颜⾊或纹理⽅⾯的⾮负相似度。⽽对图像的⼀个分割s就是对图的⼀个剪切,被分割的每个区域C∈S对应着图中的⼀个⼦图。⽽分割的最优原则就是使划分后的⼦图在内部保持相似度最⼤,⽽⼦图之间的相似度保持最⼩。基于图论的分割⽅法的本质就是移除特定的边,将图划分为若⼲⼦图从⽽实现分割。⽬前所了解到的基于图论的⽅法有GraphCut,GrabCut和Random Walk等。
GraphCut 图割
参考:
Boykov Y Y, Jolly M P. Interactive graph cuts for optimal boundary & region segmentation of objects in N-D
images[C]// IEEE International Conference on Computer Vision. IEEE Computer Society, 2001:105.
⾮常有⽤和流⾏的能量优化算法,在计算机视觉领域普遍应⽤于前背景分割(Image segmentation)、⽴体视觉(stereo
vision)、抠图(Image matting)等。
将⼀幅图像分为⽬标和背景两个不相交的部分,那就相当于完成了图像分割。
保师附小在线校园此类⽅法把图像分割问题与图的最⼩割(min cut)问题相关联。最⼩割把图的顶点划分为两个不相交的⼦集S和T。这两个⼦集就对应于图像的前景像素集和背景像素集。可以通过最⼩化图割来最⼩化能量函数得到。能量函数由区域项(regional term)和边界项(boundary term)构成。
整个流程的限制是:
算法基于灰度图;
需要⼈⼯标注⾄少⼀个前景点和⼀个背景点;
结果为硬分割结果,未考虑边缘介于0~1之间的透明度。
GrabCut 分割和抠图
参考:
Rother C, Kolmogorov V, Blake A. "GrabCut": interactive foreground extraction using iterated graph c
uts[J].
Acm Transactions on Graphics, 2004, 23(3):309-314.
是Graphcut图隔的改进版,是迭代的GraphCut。改进包括:
将基于灰度分布的模型替换为⾼斯混合模型(Gaussian Mixture Model,GMM)以⽀持彩⾊图⽚;
将能⼀次性得到结果的算法改成了『强⼤的』迭代流程;将⽤户的交互简化到只需要框选前景物体即可。
与Graph Cut不同处:
Graph Cut的⽬标和背景的模型是灰度直⽅图,Grab Cut取代为RGB三通道的混合⾼斯模型GMM;
Graph Cut的能量最⼩化(分割)是⼀次达到的,⽽Grab Cut取代为⼀个不断进⾏分割估计和模型参数学习的交互迭代过程;
Graph Cut需要⽤户指定⽬标和背景的⼀些种⼦点,但是Grab Cut只需要提供背景区域的像素集就可以了。也就是说你只需
要框选⽬标,那么在⽅框外的像素全部当成背景,这时候就可以对GMM进⾏建模和完成良好的分割了。即Grab Cut允许不完全的标注(incomplete labelling)。
彩⾊像素值的稀疏问题⽐灰度图要严重得多(256 vs 17M),所以,继续使⽤histogram是不现实的,需要信息压缩得更好⼀点的模型,作者在这⾥参考前⼈,对前景和背景各建了K=5的⾼斯混合模型。
GrabCut是按颜⾊分布和边缘对⽐度来分割图⽚的,对⼀些常见的与此原则相悖的图⽚,效果确实不好。⽐如前景⼈物的帽⼦、鞋、墨镜,通常颜⾊跟前景主体有较⼤区别;再如前景中的孔,有可能由于颜⾊区分和边缘的对⽐度不⾜,导致边缘的惩罚占上风,⽽没有扣出来背景。所以,GrabCut还是保留了⼈⼯修正的操作,定义了两种标记:绝对是背景和可能是前景。对分割错误⼈⼯修正后,分割还是可以⽐较准确的。对⾃然场景图⽚的分割,⽐Bayes matte等⽅法得到的边缘明显看起来舒服得多。
基于能量泛函的分割⽅法
参考:
该类⽅法主要指的是活动轮廓模型(active contour model)以及在其基础上发展出来的算法,其基本
思想是使⽤连续曲线来表达⽬标边缘,并定义⼀个能量泛函使得其⾃变量包括边缘曲线,因此分割过程就转变为求解能量泛函的最⼩值的过程,⼀般可通过求解函数对应的欧拉(Euler.Lagrange)⽅程来实现,能量达到最⼩时的曲线位置就是⽬标的轮廓所在。
活动轮廓模型逐渐形成了不同的分类⽅式,较常见的是根据曲线演化⽅式的不同,将活动轮廓模型分为基于边界、基于区域和混合型活动轮廓模型。按照模型中曲线表达形式的不同,活动轮廓模型可以分为两⼤类:参数活动轮廓模型(parametric active contour model)和⼏何活动轮廓模型(geometric active contour model)。
参数活动轮廓模型(parametric active contour model):
参数活动轮廓模型基于Lagrange框架,直接以曲线的参数化形式来表达曲线,最具代表性的是由Kasset a1(1987)所提出的
Snake模型。该类模型在早期的⽣物图像分割领域得到了成功的应⽤,但其存在着分割结果受初始轮廓的设置影响较⼤以及难以处理曲线拓扑结构变化等缺点,此外其能量泛函只依赖于曲线参数的选择,与物体的⼏何形状⽆关,这也限制了其进⼀步的应⽤。
Snake模型:
参考:
Michael Kass et al. Snakes: Active contour models. International Journal of Computer Vision, pages 321-
331, 1987.
在处理如边缘检测、⾓点识别、动态跟踪以及⽴体匹配等任务上⾮常成功。
SNAKE模型就是⼀条可变形的参数曲线及相应的能量函数,以最⼩化能量⽬标函数为⽬标,控制参数曲线变形,具有最⼩能
量的闭合曲线就是⽬标轮廓。模型的形变受到同时作⽤在模型上的许多不同的⼒所控制,每⼀种⼒所产⽣⼀部分能量,这部分
能量表⽰为活动轮廓模型的能量函数的⼀个独⽴的能量项。
基本Snakes模型的能量函数由三项组成,弹性能量和弯曲能量合称内部能量(内部⼒),⽤于控制轮廓线的弹性形变,起到
保持轮廓连续性和平滑性的作⽤。⽽第三项代表外部能量,也被称为图像能量,表⽰变形曲线与图像局部特征吻合的情况。内
部能量仅仅跟snake的形状有关,⽽跟图像数据⽆关。⽽外部能量仅仅跟图像数据有关。在某⼀点的α和β的值决定曲线可以
在这⼀点伸展和弯曲的程度。最终对图像的分割转化为求解能量函数Etotal(v)极⼩化(最⼩化轮廓的能量)。在能量函数极⼩化过程中,弹性能量迅速把轮廓线压缩成⼀个光滑的圆,弯曲能量驱使轮廓线成为光滑曲线或直线,⽽图像⼒则使轮廓线向图
像的⾼梯度位置靠拢。基本Snakes模型就是在这3个⼒的联合作⽤下⼯作的。
snake相对于经典的特征提取⽅法有以下优点:
通过正确设置和项前系数,可交互⽅式控制snake;
容易操控,因为图像⼒是以直观的⽅式表现;
在寻最⼩能量状态的时候它们是⾃主的和⾃适应的;
可以通过在图像能量函数中加⼊⾼斯平滑⽽对图像尺度敏感;
可以⽤于跟踪时间或者空间维度上的动态⽬标。
snake的缺点:
初始位置不同使得结果不同;
经常陷⼊局部最⼩状态,这也许可以通过使⽤模拟退⽕技术来克服,代价就是计算时间增加;
在最⼩化整个轮廓路径上的能量过程中经常忽略微⼩特征;
精度由能量最⼩化技术中使⽤的收敛标准控制;更⾼的精度要求更严格的收敛标准,因此需要更长的计算时间。
ASM(Active Shape Model)
参考:
Cootes T F, Taylor C J. Active Shape Models — ‘Smart Snakes’[M]// BMVC92. Springer London,
1992:266--275.
孙俪档案ASM(主动形状模型)是建⽴在PDM(点分布模型)的基础上,通过训练图像样本获取训练图像样本的特征点分布的统计信
息,并且获取特征点允许存在的变化⽅向,实现在⽬标图像上寻对应的特征点的位置。训练样本需要⼿动的标记所有的特征
点的位置,记录特征点的坐标,并且计算每⼀个特征点对应的局部灰度模型作为局部特征点调整⽤的特征向量。在将训练好的
模型放在⽬标图像上,寻每⼀个特征点的下⼀个位置的时候,采⽤局部灰度模型寻在当前特征点指定⽅向上局部灰度模型
马⽒距离最⼩的特征点作为当前特征点即将移动到的位置,称为suggested point, 到所有的suggested points就可以获得
⼀个搜索的suggested shape, 然后将当前的模型通过调整参数使得当前的模型最可能相似的调整到suggest shape,重复迭代直到实现收敛。
AAM(Active Appearance Models)
参考:
Cootes T F, Edwards G J, Taylor C J. Active Appearance Models[C]// European Conference on Computer
Vision. Springer Berlin Heidelberg, 1998:484-498.
ASM是基于统计形状模型的基础上进⾏的,⽽AAM则是在ASM的基础上,进⼀步对纹理(将⼈脸图像变形到平均形状⽽得到的形状⽆关图像)进⾏统计建模,并将形状和纹理两个统计模型进⼀步融合为表观模型。
AAM模型相对于ASM模型的改进为:
使⽤两个统计模型融合 取代 ASM的灰度模型。
主要对特征点的特征描述⼦进⾏了改进,增加了描述⼦的复杂度和鲁棒性
metropolis算法CLM(Constrained local model)有约束的局部模型
参考:
CLM是有约束的局部模型,ASM也属于CLM的⼀种。CLM通过初始化平均脸的位置,然后让每个平均脸上的特征点在其邻
域位置上进⾏搜索匹配来完成⼈脸点检测。整个过程分两个阶段:模型构建阶段和点拟合阶段。模型构建阶段⼜可以细分两个
不同模型的构建:
形状模型构建: 对⼈脸模型形状进⾏建模,说⽩了就是⼀个ASM的点分布函数(PDM),它描述了形状变化遵循的准则.
Patch模型构建: 对每个特征点周围邻域进⾏建模,也就说建⽴⼀个特征点匹配准则,怎么判断特征点是最佳匹配.
⼏何活动轮廓模型(geometric active contour model):
参考:
·S.Osher,J.A.Sethian,Fronts propagating with curvature dependent speed:algorithms basedon Hamilton-Jacobi
formulations.Journal of Computational Physics,1988,79:12—49
⼏何活动轮廓模型的曲线运动过程是基于曲线的⼏何度量参数⽽⾮曲线的表达参数,因此可以较好地处理拓扑结构的变化,并可以解决参数活动轮廓模型难以解决的问题。⽽⽔平集(Level Set)⽅法(Osher,1988)的引⼊,则极⼤地推动了⼏何活动轮廓模型的发展,因此⼏何活动轮廓模型⼀般也可被称为⽔平集⽅法。
⼏何活动轮廓模型(Geometric Active Contours Model)是以曲线演化理论和⽔平集⽅法为理论基础,继参数活动轮廓模型后形变模型的⼜⼀发展,是图像分割和边界提取的重要⼯具之⼀。相对于参数活动轮廓模型,⼏何活动轮廓模型具有很多优点,如可以处理曲线的拓扑变化、对初始位置不敏感、具有稳定的数值解等.
⼏何活动轮廓模型⼜可分为基于边界的活动轮廓模型、基于区域的活动轮廓模型。基于边界的活动轮廓模型主要依赖图像的边缘信息控制曲线的运动速度。在图像边缘强度较弱或是远离边缘的地⽅,轮廓曲线运动速度较⼤,⽽在图像边缘强度较强的地⽅,轮廓曲线运动速度较⼩甚⾄停⽌,使得最终的轮廓曲线运动到边缘位置.
传统⽅法的收集⼤致结束。
End ...

本文发布于:2024-09-21 20:23:02,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/75170.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:图像   模型   分割   能量
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议