人脸识别中基于流形学习的特征提取方法研究Word文档格式.doc

资源描述

人脸识别中基于流形学习的特征提取方法研究Word文档格式.doc

《人脸识别中基于流形学习的特征提取方法研究Word文档格式.doc》由会员分享，可在线阅读，更多相关《人脸识别中基于流形学习的特征提取方法研究Word文档格式.doc（69页珍藏版）》请在冰点文库上搜索。

人脸识别中基于流形学习的特征提取方法研究Word文档格式.doc

专业名称：

计算机应用技术

论文提交日期：

2012年5月21日

论文答辩日期：

2012年5月23日

答辩委员会主席：

MethodsofFeatureExtractionBasedonManifoldLearninginFaceRecognition

BAIWanrong

B.E.（HexiUniversity）2009

Athesissubmittedinpartialsatisfactionofthe

Requirementsforthedegreeof

MasterofEngineering

ComputerApplicationTechnology

inthe

GraduateSchool

LanzhouUniversityofTechnology

Supervisor

AssociateProfessorWANGYan

May,2012

兰州理工大学学位论文原创性声明和使用授权说明

原创性声明

本人郑重声明：

所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。

除了文中特别加以标注引用的内容外，本论文不包含任何其他个人或集体已经发表或撰写的成果作品。

对本文的研究做出重要贡献的个人和集体，均已在文中以明确方式标明。

本人完全意识到本声明的法律后果由本人承担。

作者签名：

日期：

年月日

学位论文版权使用授权书

本学位论文作者完全了解学校有关保留、使用学位论文的规定，即：

学校有权保留并向国家有关部门或机构送交论文的复印件和电子版，允许论文被查阅和借阅。

本人授权兰州理工大学可以将本学位论文的全部或部分内容编入有关数据库进行检索，可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。

同时授权中国科学技术信息研究所将本学位论文收录到《中国学位论文全文数据库》，并通过网络向社会公众提供信息服务。

日期：

导师签名：

摘要 I

ABSTRACT II

插图索引 IV

附表索引 V

第1章　绪论 1

1.1人脸识别背景和意义 1

1.2人脸识别的研究现状 1

1.3人脸识别的研究内容 2

1.4人脸特征提取的主要方法 3

1.4.1线性子空间方法 3

1.4.2非线性子空间方法 5

1.5本文主要工作 7

1.6本文内容安排 8

第2章　流形学习 9

2.1引言 9

2.2等距映射 9

2.3局部线性嵌入 11

2.4拉普拉斯特征映射 12

2.5流形学习方法的比较 14

2.6小结 15

第3章　核正交邻域保持判别嵌入算法 16

3.1引言 16

3.2核方法 16

3.3核正交邻域保持判别嵌入 17

3.3.1邻域保持判别嵌入 18

3.3.2Schur正交邻域保持判别嵌入 19

3.3.3核正交邻域保持判别嵌入 20

3.3.4核正交邻域保持判别嵌入算法描述 21

3.4人脸识别实验 21

3.5小结 24

第4章　基于最大散度差的半监督判别分析 25

4.1引言 25

4.2相关算法 25

4.2.1边界Fisher分析 25

4.2.2无监督鉴别投影 26

4.3基于散度差的半监督判别分析 27

4.3.1半监督判别分析 27

4.3.2最大散度差半监督判别分析 28

4.3.3散度差与瑞利商之间的关系 29

4.3.4最大散度差的半监督判别分析算法描述 29

4.4人脸识别实验 30

4.4.1ORL人脸数据库的实验 30

4.4.2YALE人脸数据库的实验 31

4.4.3实验分析 32

4.5小结 32

第5章　自适应邻域选择的张量边界FISHER分析 33

5.1引言 33

5.2张量边界Fisher分析 33

5.3自适应邻域选择的TMFA 35

5.4人脸识别实验 38

5.4.1PIE人脸数据库的实验 38

5.4.2FERET人脸数据库的实验 39

5.4.3实验分析 40

5.5三种算法的比较 40

5.6小结 41

总结与展望 42

研究总结 42

未来工作展望 42

参考文献 44

致谢 48

附录A攻读学位期间所发表的学术论文 49

摘要

人脸识别以其自然、直接、非接触、安全等优点发展为最具潜力的生物特征识别技术，它利用人脸面部特征中的有效信息进行个人身份识别。

由于人脸识别在身份验证和识别场合具有巨大的应用价值，以及能促进模式识别等多门学科的发展。

因此，对人脸识别技术的研究具有重大的理论和实际意义。

提取有效的鉴别特征是人脸识别的一个关键因素，它要求在保持人脸数据集原有的本质结构特性不变的同时进行数据维数约减。

研究表明，人脸嵌入在高维空间的低维非线性子流形上，因此使得流形学习得到了广泛关注。

流形学习作为一种非线性的维数约减方法，能够有效地学习出高度非线性、属性强相关的高维流形数据的内在几何结构。

由于样本点外问题使得经典算法很难直接应用于人脸识别中，因此学者通过研究提出了众多改进算法，取得了较好的应用效果。

本文在对基于流形学习的特征提取方法进行深入研究的基础上，主要做了以下工作：

1.在邻域保持判别嵌入的基础上，将核映射的思想进行引入其中，并在特征值求解时以Schur正交方式找出最优投影向量，提出了核正交邻域保持判别嵌入算法，克服了邻域保持判别嵌入难以提取非线性特征的困难，很好地保持了人脸流形的几何结构和判别结构信息。

2.监督算法和无监督算法都不能充分利用有限的训练样本。

因此，本文将无监督判别分析和边界Fisher分析进行结合，改进为半监督算法。

其中，利用无监督判别分析来对大量无标签样本进行学习，而利用边界Fisher分析对少量有标签样本进行学习。

同时，采用最大散度差准则作为目标函数，避免了散度矩阵奇异值的产生，通过理论分析和实验验证了该方法的可行性和有效性。

3.张量边界Fisher分析直接采用图像进行维数约减，避免了传统的方法将图像展开为一维向量的形式，更有效地保持了人脸结构信息。

然而在构建最近邻图时，TMFA采用全局统一的k邻域法来选择近邻点的，对于非均匀流形的处理比较困难。

本文在研究以上算法的基础上，采用测地距离与欧氏距离的关系来动态的选择训练样本近邻点，使得更有效地选取适合每个样本的局部线性或近似线性区域。

关键词：

人脸识别；

特征提取；

流形学习；

核空间；

半监督；

张量

Abstract

Facerecognition,characterizingbyitsnaturalness,directness,non-contact,securit,etc.,hasdevelopedtobeamostpotentialbiometricidentificationtechnology.Theeffectiveinformationofthefacialfeaturesisutilizedforpersonalidentification.Facerecognitionhastremendoususingvalueinauthenticationandidentifyoccasions,andcanpromotethedevelopmentofpatternrecognitionandmanyothersubjects.Therefore,thestudyoffacerecognitiontechnologyisgreattheoreticalandpracticalsignificance.

Extracteffectivediscriminantfeaturesisakeyfactorinfacerecognition,whichrequiresreductionofthedatadimensionatandkeepthefacedatasetoftheoriginalnatureofstructuralcharacteristicsunchangingatthesametime.Resultssuggestthatfaceembeddedinlow-dimensionalnonlinearsubmanifoldofthehigherdimensionalspace,thencemakingthemanifoldlearninghasbeenwidespreadconcern.Asnon-lineardimensionreductionmethods,manifoldlearningcaneffectivelylearntheintrinsicgeometryofthehigh-dimensionalmanifolddatastructurecloselyrelatedtohighnonlinearityandproperties.Sincethesamplepointsmakeclassicalalgorithmsdifficulttobedirectlyappliedtofacerecognition,soseveralimprovedalgorithmhasbeenpropsosedandgoodapplicationeffecthasbeenachieved.Inthispaper,basedonthedeeplyinveatigationoffeatureextractionmethodbasedonmanifoldlearning,themaincontentsandinnovationsarelistedasfollows:

Firstly,onthebasisofNeighborhoodPreservingDiscriminantEmbedded（NPDE）,introducingtheideaofKernelmapping,findingtheoptimalprojectionvectorusingSchurorthogonalwaywhilesolvingtheeigenvalue,proposingtheKernelOrthogonalNeighborhoodPreservingDiscriminantEmbedding（KONPDE）,overcomingtheproblemthatNPDEishardtoextractnonlinearcharacteristics,wellmaintainingtheinformationofgeometryandthediscriminantofstructuralinformationofthefacemanifold.

Secondly,supervisionalgorithmandunsupervisedalgorithmcannotmakefulluseoflimitedtrainingsamples.Therefore,theUnsupervisedDiscriminationProjection（UDP）andMarginalFisherAnalysis（MFA）arecombinedtoimprovetobesemi-supervisedalgorithm.Thereamong,alargenumberoflabel-freesamplesarestudiedusingUDP,asmallnumberoflabelsamplesareinvestigatedusingtheMFA.Atthesametime,choosethemaximumscatterdifferencecriterionastheobjectivefunctiontoavoidthedivergencematrixsingularvalue,verifythefeasibilityandeffectivenessofthemethodthroughtheoreticalandexperimentalalanalysis.

Finally,theTensorMarginalFisherAnalysis（TMFA）useimagedimensionalityreductiontoavoidthatthetraditionalmethodexpandstheimageintheformofaone-dimensionalvector,whichiseffectivelykeepthefacestructureinformation.However,whenbuildinganearestneighbordiagram,TMFAemploytheglobalunifiedk-neighborhoodmethodtoselectacloseneighborofthepoint,whichismoredifficultfornon-uniformflowshapeprocessing.Onthebasisoftheabovealgorithmintheresearch,themethodthatadoptingtherelationshipbetweentheeuclideandistanceandthegeodesicdistancetoselecttrainingsamplesnearestneighborpointsdynamicallyisproposed,whichmakesitmoreeffectivetoselectlocallinearornearlylinearregionforeachsample.

Keywords:

FaceRecognition;

FeatureExtraction;

ManifoldLearning;

KernelMethods;

Semi-supervised;

Tensor

插图索引

图1.1人脸识别系统 2

图1.2子空间分析方法发展过程 3

图1.3PCA和LDA最佳投影方向比较 4

图1.4将非线性可分的数据映射到高维的线性可分的特征空间 6

图2.1ISOMAP映射示意图 10

图2.2LLE算法过程 11

图2.3Gaussian数据集在LLE上的低维嵌入 12

图2.4ToroidalHelix数据集在LE上的低维嵌入 14

图3.1ORL人脸库图像示例 22

图3.2YALE人脸库图像示例 22

图3.3ORL人脸库上3种方法的性能比较 22

图3.4NPDE和KONPDE散点图 23

图4.1MFA的固有图和惩罚图（） 25

图4.2ORL人脸库的5Train的识别 31

图4.3YALE人脸库的5Train的识别率 32

图5.1邻域大小与流形结构的关系 36

图5.2欧氏距离与测地距离比例同流形弯曲的关系 36

图5.3PIE人脸库样本图像 38

图5.4PIE人脸库的5Train的识别率 38

图5.5FERET人脸库样本图像 39

图5.6FERET人脸库的2Train的识别率 39

附表索引

表3.1ORL人脸库上的识别结果比较 23

表3.2YALE人脸库上的识别结果比较 23

表4.1ORL人脸库上的识别结果比较 30

表4.2YALE人脸库上的识别结果比较 31

表5.1PIE人脸库上的识别结果比较 39

表5.2FERET人脸库上的识别结果比较 40

表5.3提出算法的性能比较 41

第1章　绪论

1.1人脸识别背景和意义

随着信息化、网络化的极速推进，信息交换者彼此身份的认证与确认在信息交换前和处理过程中显得极为重要。

传统的身份鉴别方法主要依赖于两种途径：

①主体所拥有的身份标识物品，主要包括证件、钥匙、磁卡等；

②主体所知道的身份标识知识，主要包括用户名、密码、提示问题答案等。

前者容易丢失、被伪造，后者容易被盗用、被遗忘，因而给人们的工作和生活带来了诸多不便和潜在的安全隐患，如2011年CSDN网站公布用户名和密码被盗一事，相继许多网站也敦促用户修改密码。

而基于生物特征识别技术避免了传统的身份识别技术的诸多缺点，并具有自身的高可靠性、高稳定性，越来越受到研究者的重视。

人脸识别[1]作为生物特征识别的一种，与其他生物特征识别方法（如指纹、虹膜、掌纹等）相比，具有如下几个优点：

①识别操作具有很强的隐蔽性，不易被测试个体察觉，在解决重要安全问题、罪犯监控与网上抓捕逃犯等事件中特别适用，可有效防止安全监控过程中被伪装欺骗；

②非接触式操作，使用方便，使用者无需刻意配合，不会引起被检测者的反感，从而不会对使用者产生心理负担，易被大众接受；

③对硬件要求不高，同时数码相机、数码摄像头等硬件的普及，为人脸识别提供保障；

④通过人脸表情识别，能得到其它生物识别技术很难获取的情感信息。

因此，人脸识别技术在众多生物识别技术中占有重要地位，为身份识别提供了一个很好的解决方案。

由于以上优点，人脸识别技术具有十分广泛的应用前景。

在国家安全和公共安全方面，其应用有门禁系统、视频监控、出入境检查、公安布控等；

在经济和民事方面，各类银行卡、储蓄卡、信用卡、保险卡的持卡人的身份验证；

在计算机应用方面，自动系统登录，家庭娱乐等人机交互功能。

人脸识别技术是打击犯罪分子的重要工具，特别是在“9.11”事件以后，已成为目前安全防范和国际反恐最有力的手段之一。

另外，人脸识别是图像模式分析、理解和分类的一个典型，它涉及到图像处理、模式识别、计算机视觉、人工智能、人机交互、多媒体技术和神经网络等学科，具有重要的学科理论价值。

1.2人脸识别的研究现状

人脸识别的研究始于上世纪60至70年代，在过去的几十年里，人脸识别技术取得了长足的发展。

国际上有很多知名的专门研究人脸识别的研究组，如美国卡耐基梅隆大学（CMU）的机器人研究所、美国麻省理工学院（MIT）的由Pentland领导的研究小组、芬兰的欧陆大学机器视觉组、法国的人脸和姿态识别研究小组、美国的马里兰大学（UMD）的自动化研究中心等。

每年在学术会议和国际权威杂志中都有许多与人脸识别相关的研究成果发表。

学术会议方面，如计算机视觉与模式识别会议（CVPR）、国际计算机视觉会议（ICCV）、欧洲计算机视觉会议（ECCV）等都设有人脸识别专题。

国际权威杂志，如模式识别（PR）、模式分析与机器智能（PAMI）、计算机视觉（IJCV）等经常刊登人脸识别的文章。

这些会议和期刊可以及时准确地反映有关人脸识别的最新理论研究和应用成果。

美国商用人脸识别系统FaceIt是人脸识别实际应用系统的典型代表，并在连续举办的FRVT2000、FRVT2002和FRVT2006三届商业测评中取得了很好的成绩。

国内在人脸识别领域做了卓越贡献的研究组主要包括：

中科院自动化所李子青研究员领导的研究组，卢汉青和马颂德研究员领导的研究组；

中科院和哈工大高文教授领导的研究组；

清华大学丁晓青教授领导的研究组，苏光大教授领导的研究组；

西安交通大学郑南宁教授领导的研究组；

南京理工大学杨静宇教授领导的研究组；

浙江大学吴朝晖教授领导的研究组以及微软亚洲研究院张洪江博士领导的研究组等。

其中，由中科院自动化所的李子青研究员率领的团队研制的具有完全自主知识产权的人脸识别系统，成功地应用在2008年北京奥运会开闭幕式上，首次将人脸识别技术应用于奥运会，意味着我国的人脸识别技术已挤入国际领先技术的行列。

1.3人脸识别的研究内容

在实际应用中，人脸识别是从输入的人脸图像中，提取待识别的人脸中所蕴含的身份特征，并与已有人脸库中的人脸图像进行对比，从而判断待识别人的身份。

如图1.1所示，一个完整的人脸识别系统是由人脸图像预处理、特征提取和分类器的设计组成。

其中，人脸图像预处理包括人脸检测、人脸特征定位和规范化。

人脸图像受表情、姿态、光照及成像距离等因素的影响，一直是人脸识别的一种挑战，还有许多问题没有得到解决。

图1.1人脸识别系统

人脸检测是从图片或者视频中得到待识别人的面部区域，并在此区域内定位双眼的位置。

人眼定位是为了后续的规范化处理。

人脸图像规范化采用人眼作为标准的理由是双眼距离一般不会受表情和脸部细节变化的影响。

其规范化过程为，首先固定双眼位置，并旋转人脸图像使得两眼的连线保持水平，然后切割为固定大小的人脸图像，最后将图像的像素值进行归一化处理，可消除部分光照的影响。

人脸图像特征提取是人脸识别系统的关键环节。

在计算机中，人脸灰度图像是以二维灰度值矩阵的形式存储的，用什么样的知识来描述人脸是一个特别重要的问题。

由于人脸的非刚性，同时受到光照、姿态、表情、遮挡、眼镜、胡须等干扰因素的影响，使得同一个人在不同条件下的差异性甚至比不同人在相同条件下的差异性要大，所以给人脸

展开阅读全文