k均值算法图像分割Word下载.doc
《k均值算法图像分割Word下载.doc》由会员分享,可在线阅读,更多相关《k均值算法图像分割Word下载.doc(27页珍藏版)》请在冰点文库上搜索。
3.K均值算法 12
3.1原始K均值算法 12
3.2K均值聚类分割算法 13
3.2.1聚类 13
3.2.2K-均值聚类算法的工作原理:
13
3.2.3K-means聚类算法的一般步骤:
14
3.2.4K-均值聚类法的缺点:
3.3.基于灰度空间的彩色图像像素聚类 14
3.4改进的k-均值聚类图像分割算法 15
3.5分割结果及分析 19
4.本文结论 19
4.1存在的问题以及对未来的展望 19
参考文献 20
致谢 22
附一:
K-均值聚类改进前的matlab源程序 23
基于特征的图像分割技术
万亚堃
南京信息工程大学电子与信息工程学院,江苏南京210044
摘要:
图像分割是指将一副图像分解为若干互不交叠的有意义且具有相同属性的区域。
图像分割是数字图像处理中的一项关键技术,其分割的准确性直接影响后续任务的有效性,因此具有十分重要的意义。
现有的分割算法在不同程度上取得了一定的成功,但是图像分割的很多问题还远远没有解决,该方面的研究仍然面临很多挑战。
本文采用改进的K均值算法进行图像分割,在颜色空间选取上也采用比较好的RBG颜色空间,对图像分别进行了颜色特征提取与纹理特征提取,最后进行了原始K均值算法与改进后的K均值算法分割图形的比较,实验结果表明本文提出的方法可以很好的从图像中分割出有意义的区域,更突出目标区域。
关键词:
图像分割,颜色空间,K均值聚类。
Basedonthecharacteristicsoftheimagesegmentationtechnology
Wanyakun
NUIST,Nanjing210044,China
Abstract:
Imagesegmentationisapairofimagesaredecomposedintoseveralmutuallyoverlappingareaofmeaningfulandwiththesameattribute.Imagesegmentationisakeytechnologyofdigitalimageprocessing,Thesegmentationaccuracydirectlyaffecttheeffectivenessofthesubsequenttask,Soitisofvitalsignificance.Existingsegmentationalgorithmindifferentdegree,hasachievedsomesuccess,butisfarfromsolvedmanyproblemsofimagesegmentation,theresearchstillfacesmanychallenges.
Imagesegmentationisoneofthemostbasicandimportantfieldinimageprocessing,istovisualimageanalysisandpatternrecognitionisthebasicpremise.ProposedinthispaperUSEStheimprovedk-meansalgorithmforimagesegmentation,ontheselectionofcolorspaceisbetterHUVbasedoncolorspace(bylinearRBGcolorspacetransformation).Imagefeatureandcolorfeatureextractionoftexturefeatureextractionrespectively,finallyhascarriedontheoriginalk-meansalgorithmandtheimprovedk-meansalgorithmsegmentationgraphicalcomparisonoftheexperimentalresultsshowthattheproposedapproachcanbeverygoodmeaningfulregionssegmentedfromtheimage.
Keywords:
Imagesegmentation,colorspace,k-meansclustering.
1.绪论
1.1 课题研究意义
图像分割是数字图像处理中的一项关键技术,它通常用于对图像进行分析、识别、编码等处理之前的预处理环节,其分割的准确性直接影响后续任务的有效性,因此具有十分重要的意义。
自上世纪70年代以来,已经出现了多种图像分割方法,而每一种图像分割方法都是为了解决一些特定的应用问题。
该技术成功地应用于许多领域,例如:
交通路口的电子警察、光学字符识别(OCR)、指纹识别、机动车牌号识别等等。
好的图像分割应具备的特性:
①分割出来的各区域对某种性质如灰度、纹理而言具有相似性,区域内部比较平整;
②相邻区域对分割所依据的性质有明显的差异;
③区域边界上是明确和规整的。
大多数图像分割方法只是部分满足上述特征。
如果强调分割区域的同性质约束,则分割区域很容易产生大量小孔和不规则边缘;
若强调不同区域间性质差异的显著性,则易造成不
同区域的合并。
具体处理时,不同的图像分割方法总是在各种约束条件之间寻找一种合理的平衡。
虽然图像分割方法已经有了很大的发展,但由于它的复杂性,仍有很多问题没有很好地得到解决。
因此,人们至今还一直在努力发展新的、更有潜力的分割算法,以期实现更通用、更完美的分割结果。
实践表明,对图像分割理论与技术的进一步研究仍然具有非常重要的意义。
本文首先对数字图像分割的一些经典分割方法作了概述,然后分析了现有项目开发中使用的图像分割方法所存在的问题,最后基于经典算法进行技术改进,实现了一种新的分割方
法,并将其应用到实验当中,取得了良好的效果。
1.2图像分割技术发展概况
利用计算机进行图像处理有两个目的:
一是产生出更适合人观察和识别的图像,二是希望能够由计算机自动识别和理解图像。
无论为了哪种目的,关键的一步就是能够对包含有大量、各式各样景物信息的图像进行分解,分解的最终结果是一些具有某种特征的最小成分即图像的基元。
图像的特征指图像中可用作标志的属性。
它可分为图像统计特征和图像的视觉特征两类。
图像的视觉特征是一些人为特征,需通过变换才能得到,如图像的直方图。
图像的视觉特征指人的视觉可直接感受到的自然特征,如区域的亮度、纹理或轮廓等等。
上述将图像分解成具有不同特殊单元的过程就是图像的分割,由此可以看出,图像分割是实现图像分析的重要步骤。
图像分割是图像分析的初始步骤之一,也是图像处理最原始的问题,几乎自数字图像处理问世不久,人们就开始了图像分割技术的研究,并取得了相当的进展和成功。
但由于它的复杂性,有许多问题没有很好地解决,因此人们至今还一直在努力发展新的、更有潜力的分
割算法,以期实现更通用、更完美的分割结果。
图像分割是计算机图像处理的一个基本问题,是许多后续图像分析任务的第一步处理,特别是对于图像识别、图像的可视化和基于目标的图像压缩都高度依赖于分割结果。
图像分割是由图像处理进到图像分析的关键步骤,也是一种基本的计算机视觉技术,这是因为图像的分割、目标的分离、特征的提取和参数的测量将原始的图像转化为更抽象、更紧凑的形式,使得更高层的分析和理解成为可能。
通常,分割问题包括将给定图像中相似的块分割成一个区,相邻的分割结果是不相似的。
从另一个角度
说,分割也可以被认为是像素的标记处理,属于同一区域的像素被标上相同的号。
一直以来,人们致力于分割方法的研究,提出了很多分割方法。
但是,图像分割仍然是图像处理中的一
个瓶颈。
实际上,图像分割就是把图像中的目标分成许多感兴趣的区域与图像中各种物体目标相对应。
目前可能的理解图像方法只限于信息中部分特征,如:
灰度差别、局部纹理差别、
彩色差别、局部统计特征或局部区域的频谱特征的差别等成熟技术表征的特征。
既然我们只能用图像信息中某些部分特征去分割区域,因此各种分割方法必然带有局限性。
迄今为止,还没有一种图像分割方法适用于所有的图像。
图像分割的实质是要正确地划分属性空间,使得具有相同属性的像素归属于同一区域,不同属性的像素归属不同的区域。
图像分割方法的研究始于上世纪50年代,研究己有几十年的历史,借助各种理论
至今已提出了上千种各种类型的分割算法,而且这方面的研究仍在积极进行中。
经典的
图像分割方法分为以下几种:
1、阈值分割技术
阈值分割技术是经典的、流行的图像分割方法之一,也是最简单的一种图像分割方法,这种方法的关键在于寻找适当的灰度阈值。
常用的方法有最大类间方差法、最小误差法、最大熵法等。
这些方法都是基于一维灰度直方图,而且对整幅图像使用一个固定全局阈值,如果图像中有阴影或光照不均等,分割效果会受到影响。
为此,提出了用二维直方图或者动态阈值等技术进行分割,但同时计算复杂度会增加。
阈值分割技术它仅适用于高反差的简单图像的分割,不能满足灰度渐变或以某种纹理而不是灰度来表征不同区域的那些复杂图像的分割。
2、区域技术
区域技术通过对目标像素的直接检测来实现分割。
区域生长法是一种常用的区域技术。
区域增长是:
先从每个需要分割的目标中找一个种子像素作为生长的起点,然后将其周围的像素按照某种相似性标准(如灰度相似性)与之对比,如果满足标准则合并到种子像素的集合内,将新合并的像素作为新的种子像素继续向外扩展,直到找不到满足条件的像素为止。
这种方法能够同时利用图像的多种性质进行分割,但是由于它采用串行机制,计算时间较长,实时性较差。
3、边缘检测技术
图像分割能够通过检测不同区域的边缘来获得。
在目标的边缘处常常有灰度的急剧变化,借助各种空域微分算子,如梯度算子,方向算子,拉普拉斯算子和马尔算子等,能够检测出图像中具有边缘特性的像素点。
在此基础上,采用边界闭合技术把边缘像素连接起来组成目标区域的封闭边界,从而达到分割的目的。
但边界检测是一项困难的工作,因为通常图像的边界都很难找到。
随着数学工具,成像设备和计算机技术的发展,图像分割方法呈现出新的特点和趋势:
(1)多种新兴数学工具的加入,使得新的方法不断涌现。
人工神经网络,小波理论和遗传算法是加世纪90年代兴起的新型理论工具,人们将其应用到图像分割中,起到了改善分割效果,扩展适用范围以及提高运算速度等作用。
(2)成像设备和技术的发展使得应用对象的范围大大扩展。
现在采集的图像种类与以往相比有了较大的变化和发展,不仅仅局限于常见的两维静止灰度图像,还有各种3维图像,彩色图像,运动图像等等。
这些发展对图像分割方法提出了更高的要求。
(3)多特征的利用和多方法的融合。
图像分割方法要取得更好的效果,不能局限于单一特征的分析,而要综合利用多种信息。
图像分割是一个复杂的过程,需要融合多种方法的优势进行。
1.3图像分割方法的现状
从上世纪五十年代开始,学者一直热衷于研究图像分割技术。
迄今为止,已提出上千种
图像分割算法,依这些算法对图像处理的特点,主要可分为以下几类方法。
(1)阈值分割法
阈值分割法作为一种常见的区域并行技术,它通过设置阀值,把像素点按灰度级分若干类,从而实现图像分割。
由于是直接利用图像的灰度特性,因此计算方便简明、实用性强。
显然,阈值分割方法的关键和难点是如何取得一个合适的阈值,而实际应用中阈值设定易受噪声和光亮度影响。
近年来关于阈值分割法主要有:
最大相关性原则选择阈值法、基于图像拓扑稳定状态法、灰度共生矩阵法、熵法、峰值和谷值分析法等。
其中,自适应阈值法、最大熵法、模糊阈值法、类间阈值法是对传统阈值法改进较成功的几种算法。
更多的情况下,阈值的选择会综合运用两种或两种以上的方法,这也是图像分割发展的一个趋势。
例如,将图像的灰度直方图看作是高斯分布的选择法与自适应定向正交投影高斯分解法的结合,较好地拟合了直方图的多峰特性,从而得到了更为准确的分割效果。
阈值法的缺陷主要在于它仅仅考虑了图像的灰度信息,而忽略了图像的空间信息。
对于非此即彼的简单图像处理(如一些二值图像的处理)是有效的,但是对于图像中不存在明显的灰度差异或各物体的灰度值范围有较大重叠的图像分割问题则难以得到准确的分割效果。
(2)基于边缘的图像分割法
边缘总是以强度突变的形式出现,可以定义为图像局部特征的不连续性,如灰度的突变、纹理结构的突变等。
边缘常常意味着一个区域的终结和另一个区域的开始,图像的边缘包含
了物体形状的重要信息,它不仅在分析图像时大幅度地减少了要处理的信息量,还保护了目标的边界结构。
对于边缘的检测常常借助空间微分算子进行,通过将其模板与图像卷积完成。
两个具有不同灰度值的相邻区域之间总存在灰度边缘,而这正是灰度值不连续的结果,这种不连续可以利用求一阶和二阶导数检测到。
当今的局部技术边缘检测方法中,主要有一次微分(Sobel算子、Roberts算子)、二次微分(拉普拉斯算子等)和模板操作(Prewitt算子、Kirsch算子和Robinson算子)等。
这些边缘检测器对边缘灰度值过渡比较尖锐且噪声较小等不太复杂的图像可以取得较好的效果,但对于边缘复杂(如边缘模糊、边缘丢失、边缘不连续等)的图像效果不太理想。
此外,噪声的存在使基于导数的边缘检测方法效果明显降低,在噪声较大的情况下所用的边缘检测算子通常都是先对图像进行适当的平滑,抑制噪声,然后求导数,或者对图像进行局部拟合,然后再用拟合光滑函数的导数来代替直接的数值导数,如Marr算子、Canny算子等。
有关学者曾给出了一种基于彩色边缘的图像分割方法,这是对传统边缘分割方法只适用于灰度图像状况的一个突破。
在未来的研究中,用于提取初始边缘点的自适应阈值选取、用于图像层次分割的更大区域的选取,以及如何确认重要边缘去除假边缘将变得非常重要。
(3)基于聚类的分割法
对灰度图像和彩色图像中相似灰度或色度合并的方法称之为聚类,通过聚类将图像表示为不同区域即所谓的聚类分割方法。
此方法的实质是将图像分割问题转化为模式识别的聚
类分析,如k均值、参数密度估计、非参数密度估计等方法都能用于图像分割。
常用的聚类分割有颜色聚类分、灰度聚类分割和像素空间聚类分割。
颜色聚类分割实际上是将相似的几种颜色合并为一色,描述颜色近似程度的指标是色差,在标准CIE匀色空间中,色差是用两个颜色的距离来表示的。
但是显示器采用的RGB空间是显示器的设备空间,与CIE系统的真实三原色不同,为简单起见,一般采用RGB色空间中的距离来表示。
灰度聚类分割就是只把图像分成目标和背景两类,而且仅考虑像素的灰度,这就是一个
在一维空间中把数据分成两类的问题。
通过在灰度空间完成聚类,得到两个聚类中心(用灰度值表征),聚类中心连线的中点便是阈值。
显然这个概念也可以轻松地延扩至多阈值和动
态阈值的情况。
像素空间聚类分割在某些特定的尺度上观察图像,比如说把图像信号通过一个带通滤波
器,滤波的结果将使图像的局部信息更好地被表达。
通过一个多尺度分解,轮廓信息可以在大尺度图像上保留下来,细节或者突变信息可以在中小尺度上体现,基于多尺度图像特征聚类的分割方法渐渐得到了人们的关注。
(3)函数优化法
基于函数优化的分割方法是图像分割中另一大类常用的方法,其基本思路是给出一个目标函数,通过该目标函数的极大化或极小化来分割图像,G.A.Hewer等人提出了一个具有广
泛意义的目标函数。
统计学分割法、结合区域与边缘信息法、最小描述长度(MDL)法、基于贝叶斯公式的分割法等是目前几种活跃的函数优化法。
统计学分割法就是把图像中各个像素点的灰度值看作是具有一定概率分布的随机变量,且观察到的实际物体是作了某种变换并加入噪声的结果。
统计学分割方法包括基于马尔科夫随机场法(MRF)、标号法(Labeling)和混合分布法(Mixture)等。
结合区域与边缘信息法是基于区域信息的图像分割的主要方法。
区域增长有两种方式:
一种是先将图像分割成很多一致性较强的小区域,再按一定的规则将小区域融合成大区域,
达到分割图像的目的;
另一种是事先给定图像中要分割目标的一个种子区域,再在种子区域基础上将周围的像素点以一定的规则加入其中,最终达到目标与背景分离的目的。
分裂合并法对图像的分割是按区域生长法沿相反方向进行的,无需设置种子点,其基本思想是给定相似测度和同质测度,从整幅图像开始,如果区域不满足同质测度,则分裂成任意大小的不重叠子区域;
如果两个邻域的子区域满足相似测度则合并。
最小长度描述法(MDL)的基本思路是用一种计算机语言来描述图像的区域和边界信息,得到一个描述长度函数,以此作为目标函数,根据图像极小化描述长度从而得到分割结果。
MDL准则主要应用于区域竞争中,即通过这种规则对比若干个种子区域,找出其中的
坏种子。
它常常与其他方法结合使用。
1.4论文内容
本文通过大量阅读图像分割技术方面的文献,认真研究K均值算法,并对其中的一些算法提出了改进优化了K均值算法。
算法流程为颜色空间选取--图像特征提取(颜色特征提取和纹理特征提取)--综合特征分割--分割结果及分析。
文章内容安排如下:
(1)第一章:
主要阐述课题研究意义,图像分割技术发展概况,图像分割方法的现状,论文的主要内容。
(2)第二章:
主要阐述技术基于综合特征的图像分割的流程颜色空间的选取(比较HSV颜色空间与RGB颜色空间,最后选择了RGB颜色空间--图像特征的提取(分别进行颜色特征提取和纹理特征提取)--综合特征分割(先用原始的K均值算法,然后再使用改进后的K均值算法,对两者进行比较,K均值算法的流程为初始聚类--K均值迭代--后处理)--分割结果及其分析(对原始K均值算法与改进后的K均值算法所分割出来的图像进行对比,发现区别得出结论)。
(3)第三章:
存在的问题以及对未来的展望。
2.基于综合特征的图像分割
2.1概述
目前彩色图像的分割方法大多仅用颜色特征或纹理特征,难以满足基于内容检索应用的
需要。
例如目前很有代表性的VisualSEEK系统仅仅采用颜色特征用于分割,很容易对高纹理区域产生过分割,而一些仅用纹理分割的算法又没有充分利用颜色所携带的丰富信息,可能产生欠分割,不管是只使用颜色特征进行的分割,还是只是用纹理特征进行的分割在对图像进行分割的时候都会产生不好的影响,因此有效地融合颜色和纹理信息是获得稳健的图像分割的重要途径。
目前,这方面的分割方法的研究相对较少。
针对这个问题,该文提出了一种利用图像的颜色和纹理综合特征进行分割的方法。
图像分割方法有很多种,其中,聚类法是一个较简单有效的综合特征分割方法,已被广泛应用到图像分割领域。
典型的聚类方法有K均值法、ISODATA法、模糊C均值法等。
ISODATA法有六个参数必须由用户提供,较难实现,且不能做到自动分割;
模糊C均值法是对特征集的模糊划分,这种方法主要用于三维图像和医疗图像的分割;
而K均值法通过改进可以做到一定程度的自动分割,而且适合于分割普通图像,在处理大量数据集方面也具有其它聚类算法无法比拟的优势,但是,K均值法的缺点在于需要具有聚类数目及聚类中心的先验知识,聚类结果往往与初始聚类个数和聚类中心的选定有关,聚类只考虑图像点的特征相近性,未考虑点的位置邻近性。
因此该文采用了改进的K均值算法来进行图像分割。
改进后的方法能克服以上缺陷,分割出有意义的区域。
2.2颜色空间选取
由于HSV颜色空间在视觉上比RGB颜色空间更均匀,即HSV的空间距离比RGB的空间距离更加符合人眼视觉特征,因此目前有许多图像分割算法采用了HSV空间。
但是,从RGB到HSV的转换是个非线性变换,H和S都有不可避免的奇异点,即在转换公式中出现分母为零的情况。
在奇异点附近即使R、G、B的值有很小变化也引起变换值有很大的跳动,这样会产生不稳定,因此不宜用于区域分割算法中。
从这点说,由R、G、B经线性变换法得到的彩色坐标系更为可取,替代非线性的色调和饱和度变换的方法是采用三滤波器值的线性变换。
文章采用了YUV空间,YUV空间是由RGB空间经过线性变换得到的。
RGB空间到YUV空间的转换公式为:
=
认知科学表明,YUV是一种独立于设备的彩色空间,它按照人类的感知程度以一致的尺度表示色彩差别,而且,该文经过实验发现,采用YUV空间产生的分割结果比HSV空间的分割结果更好。
2.3图像特征提取
2.3.1颜色特征提取
采用4*4的图像块为图像分割的最小单位,因此,特征提取的最小单位也是4*4的图像块。
对于小块的颜色特征,直接采用小块里的各个像素的Y、U、V的颜色均值。
设小块的16个点从上至下,从左至右标号为1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,该小块的颜色特征(Y、U、V)计算公式为:
Y=,U=,
2.3.2纹理特征提取
由于小波变换能提取图像的高频信息,因此,它非常适合于提取图像的纹理特征。
考虑到计算的简洁性和效率,该文选择了哈尔小波。
小波变换的对象是各个4*4的图像块。
一次小波变换后,一个4*4的块分解成四个频带,低频带LL及三个高频带HL、LH、HH,每个频带包含4个系数,见图1。
(a)原始图像
LL
HL
LH
HH
(b)小波变换
图1小波变换示意图
提取三个高频带的小波能量作为纹理特征。
以HL频带为例,假设其对应的小波系数为{}该频带对应的纹理特征量计算如下:
(3)
从HH和LH频带计算另两个纹理特征量,计算公式类似式(3),即求该频带的小波系数的二阶矩的均值。
2.4综合特征分割
将颜色特征的三维向量和纹理特征的三维向量组合成一个六维向量,利用这种综合特征向量来分割图像,以达到预期的图像分割效果。
3.K均值算法
3.1原始K均值算法
K均值聚类法可以用来进行综合特征的分割,下面是原始均值算法的伪代码。
原始K均值算法的伪代码如下: