工学仿射不变性的特征提取.docx

上传人:b****8 文档编号:12776338 上传时间:2023-06-08 格式:DOCX 页数:78 大小:1.48MB
下载 相关 举报
工学仿射不变性的特征提取.docx_第1页
第1页 / 共78页
工学仿射不变性的特征提取.docx_第2页
第2页 / 共78页
工学仿射不变性的特征提取.docx_第3页
第3页 / 共78页
工学仿射不变性的特征提取.docx_第4页
第4页 / 共78页
工学仿射不变性的特征提取.docx_第5页
第5页 / 共78页
工学仿射不变性的特征提取.docx_第6页
第6页 / 共78页
工学仿射不变性的特征提取.docx_第7页
第7页 / 共78页
工学仿射不变性的特征提取.docx_第8页
第8页 / 共78页
工学仿射不变性的特征提取.docx_第9页
第9页 / 共78页
工学仿射不变性的特征提取.docx_第10页
第10页 / 共78页
工学仿射不变性的特征提取.docx_第11页
第11页 / 共78页
工学仿射不变性的特征提取.docx_第12页
第12页 / 共78页
工学仿射不变性的特征提取.docx_第13页
第13页 / 共78页
工学仿射不变性的特征提取.docx_第14页
第14页 / 共78页
工学仿射不变性的特征提取.docx_第15页
第15页 / 共78页
工学仿射不变性的特征提取.docx_第16页
第16页 / 共78页
工学仿射不变性的特征提取.docx_第17页
第17页 / 共78页
工学仿射不变性的特征提取.docx_第18页
第18页 / 共78页
工学仿射不变性的特征提取.docx_第19页
第19页 / 共78页
工学仿射不变性的特征提取.docx_第20页
第20页 / 共78页
亲,该文档总共78页,到这儿已超出免费预览范围,如果喜欢就下载吧!
下载资源
资源描述

工学仿射不变性的特征提取.docx

《工学仿射不变性的特征提取.docx》由会员分享,可在线阅读,更多相关《工学仿射不变性的特征提取.docx(78页珍藏版)》请在冰点文库上搜索。

工学仿射不变性的特征提取.docx

工学仿射不变性的特征提取

目录

摘要I

ABSTRACTII

绪论1

1论文工作及章节安排2

1.1论文的主要工作2

1.2论文的组织结构2

2结构设计与方案选择3

2.1仿射不变性的特征提取系统结构3

2.2特征提取的方案选择4

2.2.1数据处理软件的选择5

2.2.1.1用MATLAB进行处理5

2.2.1.2用VC++进行处理6

2.2.2特征提取方案选择6

2.2.2.1利用仿射几何的仿射不变性提取方法6

2.2.2.2局域仿射不变性特征点提取8

3仿射理论基础9

3.1图像的预处理9

3.1.1滤波方法9

3.1.2二值化9

3.2图像分割技术10

3.2.1K-means算法介绍10

3.2.2K-means图像分割13

3.3Hu不变矩13

4算法的设计14

4.1传统仿射算法14

4.2精简算法的实现15

4.2.1八向识别法15

4.2.2链码识别16

4.2.3Hu矩识别16

5识别结果分析19

5.1几何变换识别19

5.2加噪及缺损识别20

6总结与展望22

致谢23

参考文献24

附录25

摘要

随着图像识别在社会各个领域的广泛应用,图像识别技术也逐渐成为计算机视觉和图像配准领域的主要研究方向之一。

该论文从不同的角度对图像进行识别,匹配。

主要研究了仿射不变性在图像识别技术领域的应用。

仿射变换是一类重要的线性几何变换,许多成像过程及其变化可以模型化为仿射变换,如图像在图像平面上的平移或旋转可以模型化为坐标系的平移或旋转,成像距离的变化可以模型化为不同坐标系之问的变换。

若一个图形具有某种性质或者某个量,在平行射影下,如果不变,称这个性质为仿射不变性质,这个量称为仿射不变量。

经过仿射对应它们也是不变的。

同素性、结合性都是仿射不变性质(也就是说,仿射对应把共点的线变成共点的线,把共线的点变成共线的点)。

平行四边形在仿射对应下的象还是平行四边形。

本文使用了K-means,以颜色分量(或几何性状)作为坐标参数,对景象图进行聚类。

然后分割之后。

通过聚类后的特征点提取,来进行匹配,从而达到仿射不变性的证明问题。

对于几何变换的路标图像分析较为准确,在提取和匹配时,用三种方法进行比较论证。

关键词:

K—means;仿射不变性;聚类;特征提取;仿射变换;几何变换

ABSTRACT

Withimagerecognitioninallareasofsocietywidelyused,imagerecognitiontechnologyalsohasbecomeacomputervisionandimageregistrationinthefieldofoneofthemainresearchdirection.Thepaperfromdifferentanglesonimagerecognition,matching.Themainresearchtheaffineinvariantimagerecognitiontechnologyinareasofapplication.

Affinetransformationisakindofimportantlineargeometrytransform,manyimagingprocessanditschangecanmodelintoaffinetransformation,suchasimageintheimageplaneoftranslationorrotatingcanmodeloftranslationintocoordinatesystemorrotating,imagingrangechangecanmodelofdifferentcoordinatesystemtoasktransformation.Ifagraphicshassomekindofnatureoracertainamount,inparallelprojective,ifthesame,saysthenatureofaffineinvariantproperties,thisvolumecalledaffineinvariant.Afteraffinecorrespondingtothemisconstant.Sex,combiningwiththeelementisaffineinvariantproperties(thatis,theaffinetotalpointscorrespondingtothelineintotheline,thetotalpointsofthedotintolinewiththelinepoints).Aparallelograminaffineunderthecorrespondinglikeoraparallelogram.

ThisthesisusedtheK-means,withcolorcomponent(orgeometriccharacters)ascoordinatesparameter,scenegraphclustering.Andthenaftersegmentation.Throughtheclusteringcharacteristicsaftertheextractionpoint,tomatch,soastoachievetheaffineinvariantproofoftheproblem.Forgeometrytransformroadsignsimageanalysisismoreaccurate,inextractingandmatching,withthreemethodaredemonstrated.

Keywords:

K-means:

Affineinvariant;Clustering;Featureextraction;Affinetransformation

绪论

在现实生活中,往往人的视觉系统辨别物体的能力会出现偏差,比如同一个物体,在从不同的角度,不同的光照亮度,不同的高度来观察时,所得到的效果以及结论可能就不同。

但是,在计算机信息技术高度发达的现在,用计算机进行识别物体已经越来越普及,如何准确高效的识别物体也逐渐引起了人们的关注,社会对于图像处理和识别的要求也越来越高。

在数字图像处理高度发展的今天可以看出,图像在人类感知中扮演最重要的角色。

据调查研究表明:

60%~80%的信息来自图像,并且成像及其可以覆盖几乎所有的电磁波谱。

而现在,计算机技术的发展和通信手段的发展为图形提供了客观的可能性,以FFT为代表的数字信号处理算法和现代信号处理方法的准确性、灵活性和通用性。

为数字图像技术的发展铺平了道路。

而对于形状的识别,检测和判断,一直是数字图形技术不可或缺的一部分。

仿射不变性的理论基础是仿射变换。

仿射变换是一类重要的线性几何变换,许多成像过程及其变化可以模型化为仿射变换,如图像在图像平面上的平移或旋转可以模型化为坐标系的平移或旋转,成像距离的变化可以模型化为不同坐标系之问的变换。

图像在仿射变换下保持不变的特征称为仿射不变特征。

仿射不变特征在遥感数据匹配、图像目标识别等方面都有广泛的应用。

仿射不变特征可分为全局和局部仿射不变特征。

利用整幅图像的信息提取的不变特征是全局不变特征。

Hu于1962年提出Hu矩特征J,此后矩特征被广泛应用,Yang利用仿射几何特性构造了一种交叉加权矩(Cross—WeightedMoment)并证明了其对仿射变换具有不变性,EsaRahtu将概率模型引入图像不变特征构造,提出了多尺度自卷积(Multi—ScaleAutoconvolution,MSA)变换方法,利用MSA提取的不变特征具有良好的抗噪声能力和仿射不变性。

现在我们常用的仿射不变性的特征提取方法是仿射不变性局部区域特征提取。

图像的局部不变特征在图像匹配、目标识别、全景拼接、图像检索等需要确定图像问匹配位置的领域有广泛的应用.局部不变特征包括两个基本的问题:

首先,在哪里提取特征,即需要在图像中首先确定提取特征的位置或局部区域;其次,提取什么特征,即在前面提取的位置或局部区域中计算某种局部不变特征描述。

论文主要是基于局部仿射不变性理论的基础上,提出了一直八个方向提取仿射不变特征点的算法,算法是基于聚类的理论基础得出的。

论文通过聚类的方法在局部不变的区域内,对路标图像分八个方向提取特征点,特别是对几何变换的路标图像,其识别能力较为明显。

1论文工作及章节安排

1.1论文的主要工作

论文主要的工作是实现对路标的识别,仿射不变性的证明,识别不同的路标以及相同路标的变换后的仿射不变性,围绕如何有效的提取路标图像的特征点并加以匹配。

1.2论文的组织结构

论文首先对现有形状分析方法进行了总结和分析,以确定全文的研究目标和出发点;然后根据不同的应用场合对形状仿射不变特征提取和形状匹配的需求,研究了形状的相似不变特征提取、仿射不变特征提取、完整形状的匹配和缺损形状的匹配,论文整体框架和章节安排。

第一章概述了论文研究的背景及意义,介绍了论文的主要工作和组织结构。

第二章对所有做的路标识别绘出一个大致的框架和步骤。

现有的理论基础进行对比分析,并选出适用于自己的理论基础,同时,选出最优方案。

在回顾以往方案的基础上,对比分析,分析其各个方案的优劣,突出所选用的方案优点,找出所需要的软件、知识、书籍等,为自己找出算法和理论做好先前工作。

主要分析了所选软件MATLAB和VC++的去吧和实用性,方便性。

最后选择MATLAB为编程工具。

同时对现有的仿射不变性的特征提取方法进行了简要的分析,得出想要的结论。

第三章主要讲的是论文所用的理论基础,顺序结构是从导入图像开始,一直到匹配识别图像结束的理论。

首先讲的是如何对图像进行预处理,在图形导入之后,首要要做的便是预处理,而随着数字图像技术的高速发展,滤波技术的方式和多样性也逐渐增多,同时,计算机所能识别的图像,只是简单的0、1数据,那么二值化是必不可少的,而最后经过预处理所得到的图像,针对其分析可以知道,要想有效的快速的提取出特征点,算法设计是必要的,但是理论基础更为重要。

在对图像进行分割时。

分割所用到的技术便是聚类,K-means聚类法可以有效的聚类,而且可以到处想要处理的图像部分,K-means理论基础较为复杂,所涉及到的数据比较多,计算难度较大。

仿射不变性的特征便是仿射不变,而仿射不变是基于几何变换的基础上得来的。

在现有的理论中,Hu不变矩对于几何变换的处理非常有效,论文介绍了Hu不变矩的由来以及生成形式等。

最后,本章节着重讲了仿射变换的由来,从物体到相机,以及成像的变换等都有所讲解,可以直观的理解何为仿射不变性,仿射不变性特征提取所要做的工作又是什么等一些知识。

第四章主要如何进行仿射不变性的特征提取。

首先,对于现有的技术进行总结归纳并进行实验验证,同时,得出现有的特征提取方法的局限性和有效性。

提出算法,来优化现有的特征提取算法。

论文利用三个特征匹配算法对路标图像进行识别,比较得出结论,准确性好,。

论文提出了一种新的算法,八向识别法,在基于很好的局部聚类之后得到的图像进行八个方向识别,这样就可以得到几何变换仿射不变的证明。

通过实验验证所得结论,可以发现,该算法实用性较强,准确性较高。

第五章主要研究了算法对于加噪之后以及形变后的图像的识别,通过变换之后的图像模糊,对于计算机的识别难度较大,而如何可以讲模糊的图像识别出来,是一大问题。

本章算法所用的三种识别方法,可以识别这类图像。

最后,通过实验统一分析了论文所提形状仿射不变特征有效性和适用性。

第六章为全文的总结与展望,对本文需要进一步研究的内容进行了阐述,并对可能的研究方向进行了展望。

2结构设计与方案选择

2.1仿射不变性的特征提取系统结构

仿射不变性的特征提取,其所针对的对象是图像,本文主要采样目标是路标的采样和识别,由于在路标识别的过程中,其背景比较复杂,并且各种干扰比较大,所以用传统的,或者新型的图像处理方法会不准确。

本文采用的主要是首先对采集到的图像进行滤波、去噪等预处理,从而可以得到其先对单一、容易让计算机识别的图像。

在处理图像时,首先要用K-means算法将所要处理的图像分割出来,然后再对其进行二值化出来,将分割出来的图像转换成计算机可以识别的二值化图像。

然后在对其进行膨胀腐蚀出来,可以得到相对统一,大小适中的黑色区域,对这些黑色的局部稳定区域,进行分析可以得到一些仿射不变的特征区域,对这些特征区域用论文中的算法提取出特征变量,证明其仿射不变性质。

运用进行匹配校正证明。

显示匹配结果。

其系统框图如图2-1所示:

图2-1放射不变系统框图

2.2特征提取的方案选择

随着现在数据处理工具、方法逐渐的完善,对特征提取的方案选择性也越来越强。

同时,各种数据处理的软件功能也越来越完善、简洁。

2.2.1数据处理软件的选择

对数据和图像进行处理,有两个比较好的软件,一个是matlab,一个是VC++。

两者各有优劣。

2.2.1.1用MATLAB进行处理

MATLAB是矩阵实验室(MatrixLaboratory)的简称,是美国MathWorks公司出品的商业数学软件,用于算法开发、数据可视化、数据分析以及数值计算的高级技术计算语言和交互式环境,主要包括MATLAB和Simulink两大部分。

本文主要用到的是MATLAB部分。

MATLAB是由美国mathworks公司发布的主要面对科学计算、可视化以及交互式程序设计的高科技计算环境。

它将数值分析、矩阵计算、科学数据可视化以及非线性动态系统的建模和仿真等诸多强大功能集成在一个易于使用的视窗环境中,为科学研究、工程设计以及必须进行有效数值计算的众多科学领域提供了一种全面的解决方案,并在很大程度上摆脱了传统非交互式程序设计语言(如C、Fortran)的编辑模式,代表了当今国际科学计算软件的先进水平。

  Matlab是一个高级的矩阵/阵列语言,具有简单易用的程序语言,它包含控制语句、函数、数据结构、输入和输出和面向对象编程特点。

用户可以在命令窗口中将输入语句与执行命令同步,也可以先编写好一个较大的复杂的应用程序(M文件)后再一起运行。

新版本的MATLAB语言是基于最为流行的C++语言基础上的,因此语法特征与C++语言极为相似,而且更加简单,更加符合科技人员对数学表达式的书写格式。

使之更利于非计算机专业的科技人员使用。

而且这种语言可移植性好、可拓展性极强,这也是MATLAB能够深入到科学研究及工程计算各个领域的重要原因。

MATLAB是一个包含大量计算算法的集合。

其拥有600多个工程中要用到的数学运算函数,可以方便的实现用户所需的各种计算功能。

函数中所使用的算法都是科研和工程计算中的最新研究成果,而前经过了各种优化和容错处理。

在通常情况下,可以用它来代替底层编程语言,如C和C++。

在计算要求相同的情况下,使用MATLAB的编程工作量会大大减少。

MATLAB的这些函数集包括从最简单最基本的函数到诸如矩阵,特征向量、快速傅立叶变换的复杂函数。

函数所能解决的问题其大致包括矩阵运算和线性方程组的求解、微分方程及偏微分方程的组的求解、符号运算、傅立叶变换和数据的统计分析、工程中的优化问题、稀疏矩阵运算、复数的各种运算、三角函数和其他初等数学运算、多维数组操作以及建模动态仿真等。

MATLAB出色的图形处理功能。

自产生之日起就具有方便的数据可视化功能,以将向量和矩阵用图形表现出来,并且可以对图形进行标注和打印。

高层次的作图包括二维和三维的可视化、图象处理、动画和表达式作图。

可用于科学计算和工程绘图。

新版本的MATLAB对整个图形处理功能作了很大的改进和完善,使它不仅在一般数据可视化软件都具有的功能(例如二维曲线和三维曲面的绘制和处理等)方面更加完善,而且对于一些其他软件所没有的功能(例如图形的光照处理、色度处理以及四维数据的表现等),MATLAB同样表现了出色的处理能力。

同时对一些特殊的可视化要求,例如图形对话等,MATLAB也有相应的功能函数,保证了用户不同层次的要求。

另外新版本的MATLAB还着重在图形用户界面(GUI)的制作上作了很大的改善,对这方面有特殊要求的用户也可以得到满足。

2.2.1.2用VC++进行处理

MicrosoftVisualC++,(简称VisualC++、MSVC、VC++或VC)微软公司的C++开发工具,具有集成开发环境,可提供编辑C语言,C++以及C++/CLI等编程语言。

VC++整合了便利的除错工具,特别是整合了微软视窗程式设计(WindowsAPI)、三维动画DirectXAPI,Microsoft.NET框架。

目前最新的版本是MicrosoftVisualC++2010。

MicrosoftVisualC++是Microsoft公司推出的开发Win32环境程序,面向对象的可视化集成编程系统。

它不但具有程序框架自动生成、灵活方便的类管理、代码编写和界面设计集成交互操作、可开发多种程序等优点,而且通过简单的设置就可使其生成的程序框架支持数据库接口、OLE2,WinSock网络、3D控制界面,它以拥有“语法高亮”,IntelliSense(自动编译功能)以及高级除错功能而著称。

比如,它允许用户进行远程调试,单步执行等。

还有允许用户在调试期间重新编译被修改的代码,而不必重新启动正在调试的程序。

其编译及建置系统以预编译头文件、最小重建功能及累加连结著称。

这些特征明显缩短程式编辑、编译及连结的时间花费,在大型软件计划上尤其显著。

但在图像处理应用中,其编程量相对复杂。

综上所述。

由于可以用较小的工作量来处理大量的图像数据,选择MATLAB作为应用软件。

2.2.2特征提取方案选择

2.2.2.1利用仿射几何的仿射不变性提取方法

仿射几何的仿射不变性提取方法是通过提取质心来作为特征点来构造仿射不变性模型的。

因为特征点的提取容易受噪声、灰度变化等的影响,所以质心成为理想的选择。

区域的质心可以通过下面的公式求解:

(2-1)

(2-2)

f(x,y)为像素点(x,y)处的灰度值。

不难证明,对应区域的质心也满足仿射变换关系。

为了形成区域,需要提取不少于3个的质心,为此我们引入扩展质心的概念,并对扩展质心给出了更一般性的定义。

首先,设fe(x,y)为图像灰度函数f(x,y)各次幂的组合,并称为扩展函数,如下式所示:

(2-3)

式中为扩展函数的系数,为扩展函数的幂数。

用代替式2-1、2-2中的就可以得到新的点

,我们称之为扩展质心(为了简便,有时也简称为质心):

(2-4)

(2-5)

不难证明,两图像中对应区域的扩展质心也满足仿射变换。

假设已经得到了区域的质心和扩展质心,那么整个区域被它们的连线分割成两部分,如图1所示。

然后再分别计算两部分的质心,并标记为和,同样,连接,整个区域分成两部分,分别计算两部分的质心,记为和,,连接得质心和,如此循环迭代,可以得到任意多个质心坐标。

但是需要注意的是,得到的质心有可能出现重叠,特别是当区域的结构和灰度值近似

成对称情况时。

图1质心连线对仿射区域的分割

提取出质心后,接下来利用它们构造合适的区域。

作为最简单的情况,3个点组成的三角形经常被使用到。

但是当组成三角形的3个顶点接近共线时,三角形的面积将会非常小,那么计算得到的特征值将会非常大甚至无穷。

由噪声等引起的顶点位置少许的变化将会导致特征值非常大的改变,即所谓的病态现象。

为了解决这个问题,用四边形作为基本的区域来构造特征值。

选择四边形的4个顶点中,有两个是把整个区域分割成两部分的质心,两个是两分割区域的质心,这样可以避免四边形的4个顶点共线或者接近共线情况,如图2所示。

图2由质心形成的四边形

假设质心的坐标为

,区域

的面积可以通过下面的公式计算得到:

(2-6)

假设已经得到了12个质心

,按照上述规则,可以得到5个四边形,即为

,他们的面积分别为

,那么可以得到如下仿射不变特征矢量:

(2-7)

式中

2.2.2.2局域仿射不变性特征点提取

局部仿射不变性的提取,是用图像中灰度极值点作为“关键点”,灰度极值不受仿射变换的影响,因而其“关键点”在仿射变换前后易检出。

但是图像中灰度极值点的数量不确定,也易受遮障和噪声等因素的影响。

为使“关键点”能够较好克服上述影响,论文将选择单一的灰度极值点扩展到根据图像信息选择某个灰度取值范围,通过阀值分割获得图像若干块状连通区域,将区域的几何中线点作为“关键点”。

经过比较和验证,如果以路标图像为验证对象,局部仿射不变性提取方法,会更加简单、实用,效果也更加明显。

所以。

选择用局域仿射不变性特征点提取的方法,来进行特征点的提取工作。

3仿射理论基础

本文主要做的是对路标图像的处理,对路标图像的处理分为图片预处理、图像分割等几大模块,每个部分所运用的理论基础有很多区别。

3.1图像的预处理

在MATLAB读取到图像之后,图像往往有缺损、雾化、噪化等现在,如果直接对读取的图像进行分割提取,得到的结果的准确度很低。

那么,也就意味着要对图像进行预处理。

图像的预处理包括去噪、二值化等子模块。

3.1.1滤波方法

论文采用均值滤波的方法。

均值滤波是典型的线性滤波算法,其采用的主要方法为邻域平均法。

即对待处理的当前像素点(x,y),选择一个模板,该模板由其近邻的M个像素组成,求模板中所有像素的均值,再把该均值赋予当前像素的算术平均值,作为邻域平均处理后的灰度。

该方法运算简单。

对高斯噪声具有良好的去噪能力。

均值滤波可归结为矩形窗加权的有限冲激响应线性滤波器,第一个“旁瓣”比主峰大约低13分贝。

因此,均值滤波相当于低通滤波器。

这种低通性能在平滑噪声的同时。

必定也会模糊信号的细节和边缘,即在消除噪声的同时也会对图像的高频细节成分造成破坏和损失,使图像模糊。

均值滤波对高斯噪声,乘性噪声的抑制是比较好的,但对椒盐噪声的抑制作用不好,椒盐噪声仍然存在,只不过被削弱了而已。

为了改善均值滤波细节对比度不好、区域边界模糊的缺陷,常用门限法来抑制椒盐噪声和保护细小纹理。

用加权法来改善图像的边界模糊,用选择平均的自适应技术来保持图像的边界。

3.1.2二值化

滤波之后,我们就要对图像进行二值化,因为我们读取的图像一般都是有很多色彩和色素,而计算机所能识别的像素只有黑白两种,所以,我们必须要多其进行二值化。

一幅图像包括目标物体、背景还有噪声,要想从多值的数字图像中直接提取出目标物体,最常用的方法就是设定一个阈值T,用T将图像的数据分成两部分:

大于T的像素群和小于T的像素群。

这是研究灰度变换的最特殊的方法,称为图像的二值化(BINARIZATION)。

图像的二值化,就是将图像上的像素点的灰度值设置为0或255,也就是将整个图像呈现出明显的只有黑和白的视觉效果。

我们在做二值化处理时,通常用到的方法有全局二值化和局部二值化两种。

全局二值化的定义是设定一个全局的阈值T,用T将图像的数据分成两部分:

大于T的像素群和小于T

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > IT计算机 > 电脑基础知识

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2