人脸模式识别系统Word文档格式.docx

上传人:b****1 文档编号:3147936 上传时间:2023-05-01 格式:DOCX 页数:21 大小:82.05KB
下载 相关 举报
人脸模式识别系统Word文档格式.docx_第1页
第1页 / 共21页
人脸模式识别系统Word文档格式.docx_第2页
第2页 / 共21页
人脸模式识别系统Word文档格式.docx_第3页
第3页 / 共21页
人脸模式识别系统Word文档格式.docx_第4页
第4页 / 共21页
人脸模式识别系统Word文档格式.docx_第5页
第5页 / 共21页
人脸模式识别系统Word文档格式.docx_第6页
第6页 / 共21页
人脸模式识别系统Word文档格式.docx_第7页
第7页 / 共21页
人脸模式识别系统Word文档格式.docx_第8页
第8页 / 共21页
人脸模式识别系统Word文档格式.docx_第9页
第9页 / 共21页
人脸模式识别系统Word文档格式.docx_第10页
第10页 / 共21页
人脸模式识别系统Word文档格式.docx_第11页
第11页 / 共21页
人脸模式识别系统Word文档格式.docx_第12页
第12页 / 共21页
人脸模式识别系统Word文档格式.docx_第13页
第13页 / 共21页
人脸模式识别系统Word文档格式.docx_第14页
第14页 / 共21页
人脸模式识别系统Word文档格式.docx_第15页
第15页 / 共21页
人脸模式识别系统Word文档格式.docx_第16页
第16页 / 共21页
人脸模式识别系统Word文档格式.docx_第17页
第17页 / 共21页
人脸模式识别系统Word文档格式.docx_第18页
第18页 / 共21页
人脸模式识别系统Word文档格式.docx_第19页
第19页 / 共21页
人脸模式识别系统Word文档格式.docx_第20页
第20页 / 共21页
亲,该文档总共21页,到这儿已超出免费预览范围,如果喜欢就下载吧!
下载资源
资源描述

人脸模式识别系统Word文档格式.docx

《人脸模式识别系统Word文档格式.docx》由会员分享,可在线阅读,更多相关《人脸模式识别系统Word文档格式.docx(21页珍藏版)》请在冰点文库上搜索。

人脸模式识别系统Word文档格式.docx

该模块主要包括图像光线补偿、图像变成灰色、高斯平滑、均衡直方图、实现图像对比度增强、二值化变换等。

人脸定位功能:

该模块主要是将处理后的人脸图片进行定位,将眼睛、鼻子、嘴巴标记出来,以便进行特征提取。

特征提取功能:

该模块是在定位后的人脸图片中将眼睛、鼻子、嘴巴的特征值提取出来。

识别功能:

该模块是将从图片中提取的特征值和后台数据库中的值进行比较来完成识别功能。

二开发环境需求分析

1、硬件环境

(1)硬件配置原则

具有可靠性,可用性和安全性,具有完善的技术支持。

能够满足个人学习和设计需要。

(2)运行本软件所需的硬件资源

800M及以上;

128M及以上

2、软件环境

(1)系统软件配置原则

能够满足该软件的可靠性,可用性和安全性的要求

(2)系统软件配置方案

①配置有持续工作能力、高稳定性、高度可集成的开放式标准的操作系统,如Windows2000,WindowsNT,UNIX,Linux等。

②配备符合ANSI/ISO标准的高级程序设计语言处理软件。

如:

VisualC++6.0。

③熟悉C++高级程序设计语言。

3、运行环境需求分析

(1)、硬件环境

(2)、软件环境

可以运行在微软公司近年来所出的各种操作系统。

如Windows98、WindowsMe、Windows2000、WindowsNT等。

第三节预处理方案选择

一设计方案原则的选择

本应用程序的设计方案原则如下:

1、采用较为先进的技术力量,保证应用程序在技术上具备一定的优势。

2、采用成熟的技术,保证应用程序的安全性和可靠性。

3、应用程序便于扩展和维护,易于技术的更新。

4、应用程序充分利用现有的资源,尽量减少不必要的再投资。

5、编写的代码必须严谨易读,代码的解释必须清楚明白,为应用程序的再开发提供应尽的责任。

二图像文件格式选择

在设计的过程中,为了定位和特征提取的方便,我们采用的是24位位图。

三开发工具选择

本次设计所用的开发工具是MicrosoftVisualC++6.0。

VisualC++6.0是Microsoft公司推出的一种可视化编程工具。

它支持多平台和交叉平台的开发,将各种编程工具如编辑器、连接器、调试器等巧妙的结合在一起,构成一个完美的可视化开发环境。

用户无需通过繁杂的编程操作,即可完成Windows下应用程序的编辑、编译、测试和细化等工作。

四算法选择分析

本文主要研究的对象是图像预处理模块,该模块分为光线补偿、图像灰度化、高斯平滑、图像对比度增强、均衡直方图,每个小模块的实现都有许多相应的算法。

下面将本系统采用的算法进行介绍:

·

光线补偿:

由于光线原因,所照的图像可能会存在光线不平衡的情况而造成色彩偏差,为了抵消这种整个图像中存在的色彩偏差,本系统采用的解决方法是:

将整个图像中的所有像素的亮度从高到低进行排列,取前5%的像素,然后线性放大,使这些像素的平均亮度达到255。

实际上就是调整图片像素的RGB值。

图像灰度化:

图像灰度化是将图像变成灰色,本系统中采用以下步骤来实现图像的灰度化:

彩色转换成灰度、灰度比例变换、灰度线性变换、灰度线性截断、灰度取反。

但是如果平滑不当,就会使图像本身的细节如边界轮廓、线条等变的模糊不清,为了既平滑掉噪声有尽量保持图像细节,本系统采用高斯平滑。

均衡直方图:

使用该模块的目的是通过点运算使输入转换为在每一灰度级上都有相同的像素点数的输出图像。

它的实现主要是利用灰度均衡的转换式

DB=f(DA)=

H(u)du。

(式1)

图像对比度增强:

为了将图像的特征一步一步显现出来,需要进行图像的对比度增强,它主要通过对图像的灰度值进行统计,对于小于Low则认为是有关的信息,则将它作为黑色处理,对于处于High以上的则认为是一些无关的信息,将它们去掉,而处于两者之间的,则进行对比度增强,将他们在总的灰度值里面的比例作为新的像素信息保存起来。

二、系统结构设计

第一部分系统的概要设计

本章主要介绍系统的结构设计的流程以及系统各模块的功能及相关原理。

(一)应用程序的总体结构设计流程图如图3-1所示:

图3-1总体结构设计流程图

用户

从“文件”菜单中选择“打开”选项

在弹出的“打开”对话框中选择要打开的位图,点击“确定”,应用程序显示所要打开的位图

 

识别

获取脸部区域

获取特征参数

人脸定位

图象预处理

显示识别结果

(二)图像预处理的层次图如图3-2所示:

图3-2预处理的层次图

第一节各模块功能概述

以上是该系统的总体结构设计图以及图像预处理模块的层次图。

下面介绍系统中的各模块的功能及算法:

图像获取模块

人脸区域获取

该系统中图像里人脸区域的获取,主要是根据肤色来进行获取,通过肤色非线形分段色彩变换来实现。

这一非线性分段色彩变换得到的肤色模型属于色彩空间中的聚类模型,这一类肤色模型的建立首先要选取一种合适的色彩空间。

图像预处理模块

图像预处理就是对获取得来的图像进行适当的处理,使它具有的特征能够在图像中明显的表现出来。

该模块中的子模块有如下5个,下面对它们进行概述:

·

光线补偿

因为系统得到的图片可能会存在光线不平衡的情况,这会影响我们对特征的提取,同时系统中要用到YcrCB色彩空间,所以有必要对图像进行光线补偿。

尽可能将它的特征在图像中表现出来。

YcrCB是一种色彩空间,它用于视频系统中,在该色彩空间中,Y分量表示像素的亮度,Cr表示红色分量,Cb表示蓝色分量,通常把Cr和Cb称为色度。

YcrCB色彩空间是以演播室质量标准为目标的CC601编码方案中采用的彩色表示模型。

灰度变化

图像灰度化的过程就是把彩色图像转换为黑白色图像的过程,它也是为了将图像的信息更加具体、简单的表现出来,但是,这样做也将会丢失图像信息。

因此,尽可能在转化的过程中用简单的方式表现图像复杂的信息。

高斯平滑处理

高斯平滑将对图像进行平滑处理,在图像采集过程中,由于各种因素的影响,图像往往会出现一些不规则的噪声,入图像在传输、存储等都有可能产生数据的丢失。

从而影响图像的质量。

处理噪声的过程称为平滑。

平滑可以降低图像的视觉噪声,同时出去图像中的高频部分后,那些本来不明显的低频成分更容易识别。

平滑可以通过卷积来实现。

经过卷积平滑后的水平投影后,二值化提供了较好的图像效果。

对比度增强

对比度增强,就是对图像的进一步处理,将对比度再一次拉开。

它针对原始图像的每一个像素直接对其灰度进行处理的,其处理过程主要是通过增强函数对像素的灰度级进行运算并将运算结果作为该像素的新灰度值来实现的。

通过改变选用的增强函数的解析表达式就可以得到不同的处理效果。

二值化

二值化的目的是将采集获得的多层次灰度图像处理成二值图像,以便于分析理解和识别并减少计算量。

二值化就是通过一些算法,通过一个阈值改变图像中的像素颜色,令整幅图像画面内仅有黑白二值,该图像一般由黑色区域和白色区域组成,可以用一个比特表示一个像素,“1”表示黑色,“0”表示白色,当然也可以倒过来表示,这种图像称之为二值图像。

这便有利于我们对特征的提取。

该设计中采用组内方差和组外方差来实现二值化。

直方图均衡

直方图均衡化的目的是使一输入图像转换为在每一灰度级上都有相同的象素点数,它的处理的中心思想是把原始图像的灰度直方图从比较集中的某个灰度区间变成在全部灰度范围内的均匀分布,它的研究思路是:

通过直方图变换式来进行直方图的均衡处理,直方图变换式是

但是直方图均衡化存在着两个缺点:

  1)变换后图像的灰度级减少,某些细节消失;

  2)某些图像,如直方图有高峰,经处理后对比度不自然的过分增强。

人脸定位模块

人脸定位是将典型的脸部特征(如眼睛,鼻尖,嘴唇等等)标记出来,在本系统中,定位的特征是眼睛,鼻尖和嘴巴三个。

由于眼睛具有对称性,因此可以很快就能标记出来,而鼻子是在眼睛下面,且嘴巴在鼻子下面,所以只要眼睛标记好,鼻子和嘴巴也能相应的标记出来。

特征提取模块

特征提取按以下4个步骤进行:

(1)、提取两只眼睛的距离

(2)、眼睛的倾角度

(3)、眼睛、嘴巴的重心

(4)、用一个矩形标出每一个特征

在特征提取完之后将会得到相应的特征值以便存入后台数据库。

识别模块

该模块通过与库存中的特征向量进行比较,找出与特征最相近的参数,再对该参数进一步分析。

如果分析在我们所确认的范围内,我们就认为该人就是我们所要找的。

然后从库存中提取出该人相关的信息,并显示出来。

如果库存中没有,则给出提示是否对存库作为样本。

第二部分系统的详细设计

本章主要对图像处理这一模块进行详细介绍,对其子模块所用到的算法及具体实现进行详细讲述。

第一节系统的运行流程图

图6-1系统的运行流程图

输入

第二节图像处理详细设计

一位图详细设计

1设备无关位图(DIB)

VC++没有提供使用十分方便的DIB绘制方法,只好自己去创建一个实用的DIB类了。

本系统中建立了一个专门的类DIB来处理设备无关位图,表4-1列出了对位图的操作函数。

函数

功能

ClearMemory()

释放内存

CopyHandle()

拷贝内存块

LoadDIB()

加载位图信息

ReadDIBFile()

读取位图文件信息

LightingCompensate()

进行光线补偿

PixelOffset()

修正像素值

PaintDIBTrue()

绘制DIB对象

GetColorNumber()

获取颜色总数

GetHeight()

获取DIB高度

GetWidth()

获取DIB宽度

GetSize()

获取图像数据缓冲区中的字节数

GetBitCount()

获取颜色位数

GetBiBitCount()

获取字节数

表6-1Dib类的部分功能

二图像点处理详细设计

图像点运算是一种既简单又重要的技术,它能让用户改变图像数据占据的灰度范围,一幅输入图像经过点运算后将产生一幅新的输出图像,由输入像素点的灰度值决定相应的输出像素点的灰度值,点运算与局部运算的差别在于:

后者每个输出像素的灰度值由对应输入像素的一个领域内几个像素的灰度值决定。

所以,点运算不可以改变图像内的空间关系。

点运算可以按照预定的方式改变一幅图的灰度直方图。

除了灰度级的改变是根据某种特定的灰度变换函数进行之外,点运算可以看作是“从像素到像素”的复制操作。

如果输入图像为A(x,y),输出图像为B(x,y),则点运算可表示为:

B(x,y)=f[A(x,y)](式2)

其中函数f(D)被称为灰度变换(GrayScaleTransformation,GST)函数,它描述了输入灰度值和输出灰度值之间的转换关系,一旦灰度变换函数确定,该点运算就完全被确定下来了。

点运算有时又称为对比度增强、对比度拉伸或灰度变换,它是图像数字化软件和图像显示软件的重要组成部分。

下面将对本设计解决各图像点处理模块运用进行到的理论和编程实现进行详细讲述。

1、光线补偿

(1)算法思想:

光线补偿的想法的提出主要是考虑到肤色等色彩信息经常受到光源颜色、图像采集设备的色彩偏差等因素的影响,而在整体上偏离本质色彩而向某一方向移动,即我们通常所说的色彩偏冷、偏暖、照片偏黄、便蓝等等。

这种现象在艺术照片中更为常见。

所以AnilK.Jain等提出,为了抵消这种整个图像中存在着的色彩偏差,我们将整个图像中所有像素亮度(是经过了非线形r-校正后的亮度)从高到低进行排列,取前5%的像素,如果这些像素的数目足够多(例如,大于100),我们就将它们的亮度作为“参考白”(ReferenceWhite),也即将它们的色彩的R、G、B分量值都调整为255。

整幅图像的其他像素点的色彩值也都按这一调整尺度进行交换。

(2)具体实现光线补偿功能:

明白了光线补偿这功能的算法及思想,就可以编码实现其功能了,实现过程如下:

①、编辑菜单IDR_MAINFRAM,先在其中添加一菜单项,将其命名为“预处理”,并在其属性栏中将其设为“弹出”菜单,点击预处理该菜单项将会弹出一个新的子菜单,此时把该子菜单命名为“光线补偿”,并把其ID设为ID_READY_LIGHTINGCONPENSATE,对应文件FaceDetectView.Cpp中的函数ReadyLightingconpensate()实现,并在voidCFaceDetectView:

:

OnReadyLightingconpensate()中添加如下代码:

hDIBTemp=gDib.CopyHandle(hDIB);

gDib.LightingCompensate(hDIB);

GlobalUnlock(hDIB);

Invalidate();

光线补偿功能实质上是用上段代码中的LightingCompensate()函数来进行实现。

函数LightingCompensate()是类DIB的一个成员函数。

其核心代码如下所述:

//下面的循环对图像进行光线补偿

for(i=0;

i<

height;

i++)

for(intj=0;

j<

width;

j++)

{

//获取像素偏移

lOffset=this->

PixelOffset(i,j,wBytesPerLine);

//得到蓝色分量

*(lpData+lOffset)=colorb;

//绿色分量

colorb=*(lpData+lOffset+1);

colorb*=co;

if(colorb>

255)

colorb=255;

*(lpData+lOffset+1)=colorb;

//红色分量

colorb=*(lpData+lOffset+2);

*(lpData+lOffset+2)=colorb;

}

2、图像灰度化

(1)算法思想

①彩色转换成灰度

将彩色图像转化为灰阶图像常采用如下的经验式:

gray=0.39×

R+0.50×

G+0.11×

B(式3)

其中,gray为灰度值,R、G、B分别为红色、绿色和蓝色分量值。

②灰度比例变换

灰度比例变换是把原像素的灰度乘以一个缩放因子,并最后截至[0,255]。

③灰度线性变换

当图像由于成像时曝光不足或曝光过度,会产生对比度不足的弊病,从而使图像中的细节分辨不清。

将图像灰度进行线性扩展,常能显著地改善图像的外观。

灰度线性变换的计算式为:

g=

(式4)

f,其他

式中,f是原像素的灰度,g为变换后的灰度。

该变换把属于[a,b]的灰度级变换至灰度区间[c,d],而没有在[a,b]区间的原像素灰度将保持不变。

这里a,b,c,d,f,g均为[0,255]之间的整数值。

可见,a被映射为c,b被映射为d。

④灰度线性截断

灰度线性截断的思想是:

如果原像素的灰度小于a,则该像素的灰度等于c;

如果原像素的灰度大于b,则该像素的灰度等于d。

(2)具体实现灰度化功能

在明白了灰度化的原理之后,就可进行编码来实现该功能。

①编辑菜单IDR_MAINFRAM,先在其中添加一菜单项,将其命名为”图像灰度化”,并将其ID号设为ID_READY_SCALE,对应文件FaceDetectView.Cpp中的函数ReadyLightingconpensate()实现.

②现该模块的核心代码如下:

获取蓝色分量

ColorB=*(lpData+lOffset);

获取绿色分量

ColorG=*(lpData+lOffset+1);

获取红色分量

ColorR=*(lpData+lOffset+2);

计算灰度值

gray=(ColorG*50+ColorR*39+ColorB*11)/100;

显示灰度图像

*(lpData+lOffset)=gray;

*(lpData+lOffset+1)=gray;

*(lpData+lOffset+2)=gray;

其中lpData是图片数据区,lOffset是图片像素的偏移,gray是图像的灰度值

3、高斯平滑

(1)算法思想

在介绍高斯平滑前,先介绍模板操作。

模板操作是数字图像处理中经常用到的一种运算方法,图像的平滑、锐化以及细化、边缘检测都要用到模板操作。

例如:

有一种常见的平滑算法是将原图中一个像素的灰度值和它周围邻近八个像素的灰度值相加,然后求得的平均值(除以9)作为新图中该像素的灰度值。

在图像的采集过程中,由于各种因素的影响,图像中往往会出现一些不规则的随机噪声,如数据在传输、存储时发生的数据丢失和损坏等,这些都会影响图像的质量。

处理噪声点的过程称之为平滑,平滑可以降低图像的视觉噪声,同时除去图像中的高频部分后,那些本来不明显的低频成分更容易识别。

而噪声点一般是孤

立的点,噪声点的像素灰度与它们的近邻像素有显著的区别,即灰度变化总在这附近有突变高频。

平滑可用卷积来实现,平滑的频率截止点由卷积核的大小及卷积系数决定。

用于平滑滤波的卷积核叫做低通过滤波器,低通过滤波器具有如下的特征:

1卷积核的行、列数为奇数,通常为3×

3的矩阵;

2卷积系数以中心点为中心对称分布;

3所有的卷积系数都为正数;

4距离中心较远的卷积系数的值较小或保持不变;

5卷积后的结果不改变图像的亮度。

经过卷积平滑后给随后的水平投影、二值化提供了较好的图像效果。

水平投影的曲线显得比较平滑,二值化后的图像孤立点比较少。

以下是几个常用的卷积核:

1/91/91/91/101/101/101/162/161/16

1/91/91/91/101/51/102/164/162/16

LP1LP2LP3

通常的处理是:

将中心点周围八个点的像素值乘于各自矩阵相应的系数后相加得到一个值,然后将这个值乘上中心点的系数,中心点的像素值赋为得到的最后值。

一般来说,不同的噪声有各自针对性的卷积算法。

本文使用的卷积算法是高斯卷积核,亦即上面卷积核的LP3。

高斯卷积是通过采样2维高斯函数得到的。

高斯平滑算法的优点是平滑后图像的失真少,算法更具备通用性,能去除不同的噪声干扰。

需要注意的是:

在平滑处理时,图像边界点无法处理,因此循环范围应设定在图像边界内。

(2)具体实现高斯平滑功能

知道高斯平滑原理之后,可进行编码将其实现:

1编辑菜单IDR_MAINFRAM,在菜单“预处理”中添加一子菜单项,命名为“高斯平滑”并将其ID设为ID_READY_Template。

2在类CFaceDetectView中添加“高斯平滑”菜单项的事件处理程序,其代码如下:

//进行模板操作

Template(tem,3,3,xishu);

Invalidate(TRUE);

其中tem是模板参数,xishu是模板系数;

Template()函数是实现高斯平滑的主要函数,其核心代码是:

for(m=i-((tem_h-1)/2);

m<

=i+((tem_h-1)/2);

m++)

{

for(n=j-((tem_w-1)/2);

n<

=j+((tem_w-1)/2);

n++)

注:

将以点(i,j)为中心,与模板大小相同的范围内的象素与模板对用位置的系数进行相乘并线形叠加

sum+=Gray[m][n]*tem[(m-i+((tem_h-1)/2))*tem_w+n-j+((tem_w-1)/2)];

}

将结果乘上总的模板系数

sum=(int)sum*xishu;

计算绝对值

sum=fabs(sum);

如果小于0,强制赋值为0

if(sum<

0)

sum=0;

如果大于255,强制赋值为255

if(sum>

sum=255;

HeightTemplate[i][j]=sum;

4、灰度均衡

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 解决方案 > 学习计划

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2