基于视频的行人检测研究毕业论文.docx

资源描述

基于视频的行人检测研究毕业论文.docx

《基于视频的行人检测研究毕业论文.docx》由会员分享，可在线阅读，更多相关《基于视频的行人检测研究毕业论文.docx（29页珍藏版）》请在冰点文库上搜索。

基于视频的行人检测研究毕业论文.docx

基于视频的行人检测研究

摘要

随着中国经济的快速发展，公路交通日益发达，更加便利，但交通事故频繁发生，并且有着进一步恶化的趋势，这个问题是亟待解决的。

为了保证行人的人生安全，保证交通的有序通畅，保证中国社会的和谐安定，视频的行人检测技术研发势在必行。

本论文主要是针对于基于视频的行人检测进行了研究，主要内容包括：

（1）对视频文件进行预处理，将视频一帧一帧地分离开来，以图片的形式进行保存，同时对其进行灰度化和去噪，加强视频图像的对比度，便于之后的目标识别和提取。

（2）目标图像的提取方法主要有背景差分法和帧间差分法，这两种方法各自有自己的优点和缺点，可以通过将两者相互结合，提取出完整的目标人物。

（3）当然二值化后的目标很可能产生空洞和斑点，致使图像走形，我们可以通过形态学处理，填充目标的空洞，从而呈现于实体相一致的二值图像。

关键词：

行人检测；背景差分法；帧间差分法；MATLAB；视频

ThePedestrianDetectionBasedVideoAbstract

WiththerapiddevelopmentofChina'seconomy,qualityoflifecontinuestoimprove,roadtransportincreasinglydeveloped,moreconvenient,butaccidentsoccurfrequently,andhasafurtherdeterioration,theproblemissolved.Inordertoensurethesafetyofpedestriansinlife,toensuresmoothandorderlytraffic,toensureharmonyandstabilityofChinesesociety,videopedestriandetectiontechnologydevelopmentimperative.Inaddition,insomelargesupermarkets,shoppingmalls,cinemas,especiallybanks,arelikelytoexisttheft,robberyevil,inordertocrackdownoncrimeandhelppolicecrackcasesmoreeffectively,weneedontheseoccasionsinstallationofpedestriandetectionsystem.

Thispaperismainlyaimedatvideo-basedpedestriandetectionhasbeenstudied,themaincontentsinclude:

（1）Pre-processingofthevideofile,thevideoframebyframeseparated,intheformofpicturestosave,whileitsgray,strengthenthecontrastofvideoimages,objectrecognitionandextractiontofacilitatelater.

（2）Extractionmethodsmainlytargetimagebackgroundsubtractionandframedifferencemethod,thesetwomethodseachhavetheirownadvantagesanddisadvantages,youcancombinethetwotoeachother,toextractthecompletetargetfigure.（3）Ofcourse,afterthetargetbinaryislikelytohavevoidsandspots,causingtheimagetotakeshape,wecanmorphologicalprocessing,fillingtheemptygoal,therebyrenderingtheentityconsistentbinaryimage.

Keywords：

PedestrianDetection；BackgroundSubtraction；FrameDifferenceMethod；MATLAB；Video

1绪论 1

1.1研究背景及意义 1

1.2研究现状 2

1.2.1国外研究现状 2

1.2.2国内研究现状 2

1.3论文的主要工作 2

2图像处理基础 4

2.1图像处理的简介 4

2.2图像分类 4

2.2.1二进制图像 4

2.2.2灰度图像 4

2.2.3RGB图像 5

2.2.4索引图像 5

2.2.5多帧图像 5

3图像的预处理 6

3.1图像的噪声 6

3.1.1高斯噪声 6

3.1.2椒盐噪声 6

3.2图像噪声的滤除方法 7

3.2.1中值滤波 7

3.2.2均值滤波 7

3.3图像增强 8

3.3.1灰度变换 8

3.3.2直方图增强 8

4目标检测 10

4.1背景差分法 10

4.2帧间差分法 11

4.3混合方法 12

5形态学处理 14

6论文总结 16

参考文献 17

致谢 18

附录 19

1 绪论

1.1研究背景及意义

自从邓小平提出“改革开放”以后，中国加速发展经济实力，综合国力也迅猛提升。

随着人民的生活质量的提升，曾经遥远的机动汽车也步入了寻常百姓家。

据2011年统计，世界各国汽车销量排行榜，中国以每年1900万辆高居榜首。

随着车辆大量的涌入街道，也给广大的百姓带来了不少的麻烦，尤以车祸为多。

为了克服诸如此类的问题，全球各

国纷纷研究开发新技术来解决人与汽车之间的矛盾。

这就诞生了基于视频的行人检测技术和车辆检测技术。

该技术是通过交通要道的视频探测器监视路况，并且能够在道路发生事故时及时通知警方，而且可以保存记录。

随后，该技术不仅仅使用于交通管理当中，也派生到了各行各业，如银行安保系统，超市监控系统，大型公司的机密保护系统，军事反恐组织等等。

以前处于信息初级时代，人们获取信息大都是文字，低效又费事。

之后发明了电脑，文字信息又转换成了二进制数，虽然速度加快了，可是却不利于人们的理解。

现在，在如今的信息爆炸时代，人们逐渐将信息又还原成了最原始的信息——可视信息，即视频。

其优点如下：

可视化。

视觉是人类与生俱来的，是我们感官世界的第一途径，是获取信息的最直接的方法。

将复杂的二进制数据通过行人检测技术转化成视频，极大的提高了人的理解度，更是大大减少了工作人员处理数据的时间，提高了工作效率。

可靠性。

计算机将纷繁的二进制数据组合成视频文件，化多为一，化繁为易，可以分门别类的储存。

同时，该系统又可以高效的准确无误的运行，反馈精确的图像信息。

价格低廉。

如今世界各国都在运用此类技术来检测交通路口，以防发生交通事故。

所以此类技术普遍容易掌握，又经过了一代又一代的研发更新，使用更加趋于成熟，所需的经济费用也就相对较少。

基于视频的行人检测技术原本是用来解决交通事故的。

旧的方法中应用最多的有电子线圈检测法和温度检测法。

（1）电子线圈检测法：

根据电磁感应定律，通电的线圈是可以产生感应磁场的，当线圈中加入铁芯后，感应磁场就会变化。

根据这个原理，事先在交通路口埋下线圈，并且通电，根据进出线圈物体的时刻可以计算出速度，这样就能判定是人还是汽车。

但是这种方法存在一个缺点，无法检测出缓慢行驶的汽车，灵敏度不够，而且有碍地下管道和地缆的铺设。

（2）温度检测法：

温度检测是利用物体的热辐射能随温度变化的原理检测的。

人与汽车都是有温度的，但不同之处在于，人的温度是恒定的，汽车的则是变化的。

利用红外温度检测设备可以精准的检测出行人。

但是红外温度感测器制作精密，价格昂贵，而且不容易操作。

根据上述的对比，足可见的基于视频的行人检测是最佳选择。

1.2研究现状

早在1978年，美国加利福尼亚州率先提出基于视频的车辆检测技术，随着时代的进步，逐渐延伸到了行人检测。

基于视频的行人检测是一种极具优势的检测技术，各国都在相继加大力度深入研究。

由于世界各国技术的发展参差不齐，所以研发进度也有缓有急。

1.2.1国外研究现状

在国外，基于视频的行人检测技术和车辆检测技术发展迅速，并且已经有所成就，还有一些实例产品也已经应用到了社会生活当中，例如日本，小小的一个岛国却交通便捷，全年都很少有交通事故发生，全有赖于VICS；再如新加坡的EMAS，已经覆盖了其境内所有的高速公路和交通要道。

再如美国，人民生活富庶，街道车水马龙，却鲜有事故，超市星罗棋布、玲琅满目，却很少有偷窃之举，这些全都是的VSAM的功劳。

1.2.2国内研究现状

在我国，由于国内科研发展起点相对落后，再加上国内环境条件的制约，至今为止还未有一套真正属于自己的完整体系的视频检测系统。

但是已经有一些初步产品投入市场，效果显著。

随着经济的飞速发展，我国的视频检测技术也逐渐步入正轨，发展势头也是突飞猛进，大有后来者居上的感觉。

1.3论文的主要工作

本论文的主要工作是基于视频的行人检测中软件部分：

一帧一帧地提取视频并且进行预处理，之后通过背景差分法和帧间差分法相结合对视频对象进行目标分割提取，随后进行形态学处理，最后输出。

本文的主要内容安排如下：

1绪论

介绍该课题研究的背景及意义和国内外关于基于视频的行人检测技术的科研发展和应用现状。

2图像处理基础

介绍了MATLAB软件对数字图像进行处理的功能，并且简单的描述了当下的一些

MATLAB所能够识别和处理的图像格式。

3图像预处理

要想对视频帧或者图像进行处理，必须先对其进行预处理。

视频的拍摄都包含有各种各样的噪声干扰，这会影响之后的步骤，所以先要进行去噪，之后将其灰度化，有利于区分目标物和背景。

4目标检测

根据第三章的步骤，已经将视频处理好了，接下来需要对一帧一帧地图像通过背景差分法和帧间差分法来将对象从整体中分割提取出来，再令二者相与，互补不足，得到完整的目标物，对其二值化输出。

5形态学处理

将提取出目标的图像进行形态学处理，可以填充空洞和斑点，能够更好地呈现完整的目标。

论文总结

最后，对课题研究工作进行总结。

2 图像处理基础

2.1图像处理的简介

数字图像处理（Digital Image Processing）是通过计算机对图像进行去除噪声、增强、复原、分割、提取特征等处理的方法和技术。

数字图像处理的产生和迅速发展主要受三个因素的影响：

一是计算机的发展；二是数学的发展（特别是离散数学理论的创立

和完善）；三是广泛的农牧业、林业、环境、军事、工业和医学等方面的应用需求的增长。

随计算机技术的发展，20世纪50年代，人们应用计算机处理一些图形和图像信息，这是最早的图像处理；20世纪60年代，人们应用计算机改善图像的质量，这时形成了数字图像处理这门学科。

2.2图像分类

图像是三维世界在二维平面的表示，具体来说就是用光学器件对一个物体、一个人或是一个场景等的可视化表示。

图像中包含了它所表达的事物的大部分信息。

据有关资料表示，人类所获得的大部分信息来源于视觉系统，也就是从图像中获得的。

中国有句古话叫“耳听为虚，眼见为实”，可见一斑。

根据图像的属性不同，图像分类方法也不同。

从获取方式上图像可分为拍摄类图像和绘制类图像；从颜色上图像可分为彩色图像、灰度图像和黑白图像等；从图像的内容上图像可分为人物图像、风景图像等；从功能上图像又可分为流程图、结构图、心电图、电路图、设计图等。

在数字图像处理领域，将图像分为模拟图像和数字图像两种，计算机处理的信号都是数字信号，所以在计算机上处理的图像均为数字图像。

根据数字图像在计算机中表示方法不同，又可分为二进制图像、灰度图像、RGB图像、索引图像和多帧图像。

2.2.1二进制图像

二进制图像也称为二值图像，通常用一个二维数组来描述，1位表示一个像素，组成图像的像素值非0即1，没有中间值。

通常0表示黑色，1表示白色。

二进制图像一般用来描述文字或者图形，其优点是占用空间少，缺点是当表示人物或风景图像时只能描述轮廓。

2.2.2灰度图像

灰度图像也称为单色图像，通常由一个二维数组表示一副图像，8位表示一个像素，

0表示黑色，255表示白色，1～254表示不同的深浅灰色。

通常灰度图像显示了黑色与白色之间许多级的颜色深度，比人眼所能识别的颜色深度范围要宽泛的多。

2.2.3RGB图像

RGB图像也称为真彩色，是一种彩色图像的表示方法，利用3个大小相同的二维数组表示一个像素，3个数组分别代表R、G、B三个分量，R表示红色，G表示绿色，B表示蓝色，通过三种基本颜色可以合成任意颜色。

每个像素中的每种颜色分量占8位，每一位由0～255中的任意数值表示。

2.2.4索引图像

索引图像是一种把像素值直接作为RGB调色板下标的图像。

在MATLAB中，索引图像包含一个数据矩阵X和一个颜色映射（调色板）矩阵map。

数据矩阵可以是8位无符号整型、16位无符号整型或双精度类型的。

2.2.5多帧图像

多帧图像是一种包含多幅图像或帧的图像文件，又称为多页图像或图像序列，主要用于需要对时间或场景上相关图像集合进行操作的场合。

3 图像的预处理

3.1图像的噪声

数字图像的噪声主要来自于图像的采集和传输过程。

图像传感器工作经常会受到各种因素的影响，例如在使用CCD摄像机获取图像时，光照强度和传感器的温度是产生噪声的主要原因。

图像在传输过程中也会受到噪声的干扰。

图像处理中常见的主要是高斯噪声和椒盐噪声。

3.1.1高斯噪声

高斯噪声，是指其概率密度函数服从高斯分布（即正态分布）的一类噪声，其功率谱密度是均匀分布的。

一幅图像里，如果存在有高斯噪声，就会使图像模糊不清，通常还会伴随着密密麻麻的小斑点，令图像难以辨认。

如图3-1所示。

图3-1 高斯噪声处理对比图

3.1.2椒盐噪声

椒盐噪声是由两种噪声组合而成的，一种是盐噪声（salt noise），另一种是胡椒噪声（peppernoise）。

众所周知，盐是白色的，胡椒是黑色的，所以盐噪声是高灰度噪声，胡椒噪声是低灰度噪声。

通常情况下，一幅图像会同时出现这两种噪声。

如果是彩色图

像，就会产生颜色斑驳的亮点；如果是灰度图像，就会产生错乱的黑白斑点。

如图3-2

和图3-3所示。

图3-2 彩色椒盐噪声处理对比图

图3-3 灰色椒盐噪声处理对比图

3.2图像噪声的滤除方法

在我们日常生活当中，所有的视频、照片、图像都或多或少的存在着噪声干扰，以致使得图像质量下降。

在MATLAB当中，提供了多种滤波方法去除噪声，这里主要介绍基础的中值滤波和均值滤波。

3.2.1中值滤波

根据排序统计理论，提出了中值滤波算法，它是一种能有效抑制噪声的非线性信号处理技术，可对灰度图像进行处理。

一副图像是由多个像素点组成的，每一点的像素值不同。

中值滤波是将一个像素点邻域的各点的值取中间值，以此来代替该点的像素值，如此可以使附近的像素值接近真实值，从而消除孤立的噪声点。

不论是由ＲＧＢ图像转换而得的灰度图像，还是从外界直接读取的灰度图像，都存在高斯噪声和椒盐噪声。

进行中值滤波不仅仅可以去除孤点噪声，而且还可以保持图像的边缘特性，不会使图像产生显著的模糊，尤其对消除椒盐噪声非常有效。

中值滤波的计算公式如式3-1：

f（x,y）=Median[I（x,y）]

（3-1）

其中I（x,y）代表图像各像素点的灰度值，Median是取所有像素点的中值。

3.2.2均值滤波

均值滤波是一种典型的线性滤波算法，可对灰度图像进行处理。

该算法将一个像素点附近8邻域内的像素为模板，再将该模板内的所有像素值求和，最后取平均值，用平均值来代替该点的像素值。

与中值滤波相比，该方法更加的容易、有效，可以很好地去除噪声，但由于图像的边缘处于高频部分，均值滤波又会阻止高频部分通过，这就会引起图像边缘模糊不清，降低图像的辨识度。

均值滤波的计算公式如下：

f（x,y）=1åI（x,y）

M （3-2）

其中I（x,y）代表图像各像素点的灰度值，M是模板中包含当前像素在内的像素总个数。

本论文研究主要是采取均值滤波的方法去除高斯噪声和椒盐噪声。

先将视频图像读入，之后进行灰度变换形成灰度图像，采用均值法去噪。

3.3图像增强

图像增强的主要目的是提高图像的质量和可辨识度，使图像更有利于观察或进一步分析处理。

图像增强技术一般通过对图像的某些特征，例如边缘信息、轮廓信息和对比度等进行突出或增强，从而更好的显示图像的游泳信息，提高图像的使用价值。

在一定标准下，处理后的图像比原图像效果更好。

图像增强按作用域可分为空域内处理和频域内处理，空域内处理是直接对图像进行处理，频域内处理是在图像的某个变换域内，对图像的变换系数进行运算，然后通过逆变换获得图像增强效果。

本论文着重介绍空域处理。

空域内的图像增强就是调整灰度图像的明暗对比度，是对图像中各个像素的灰度值直接进行处理。

常用的方法包括灰度变换增强和直方图增强。

3.3.1灰度变换

灰度变换增强是在空间域内对图像进行增强的一种简单而有效的方法。

灰度变换增强不改变原图像中像素的位置，只改变像素点的灰度值，并逐点进行，和周围的其他像素点无关。

如图3-4所示。

3.3.2直方图增强

图3-4 灰度变换对比图

图像的灰度直方图表示灰度图像中具有每种灰度的像素的个数，反映了图像中每种灰度级出现的频率，是图像的基本统计特征之一。

直方图均衡方法因为其有效性和简单性己成为图像对比度增强的最常用方法。

其基本思想是根据输入图像的灰度概率分布来确定其对应的输出灰度值，通过扩展图像的动态范围达到提升图像对比度的目的。

如图3-5所示。

图3-5 直方图处理对比图

本论文的研究采用的是灰度变换，该方式更加的容易便捷。

该步骤是将去除噪声的灰度图像进行灰度变换。

由于图像是一个一个的像素点组成的，所以需要逐行逐列的提取像素点进行灰度变换，之后保存修改后的图像，这样视频帧就预处理完毕，为后续工作奠定了基础。

4目标检测

日常生活中的目标通常是运动的，而目标检测就是将所检测的目标物体从运动场景中准确地提取出来。

目前常用的检测方法主要有背景差分法和帧间差分法。

4.1背景差分法

背景差分法又称为背景减除法，是静止背景下运动目标识别和分割的一种思路。

其原理是事先利用视频的N帧相互叠加，之后采取均值滤波，还原图像，提取出背景，再用当前帧减去背景图像，将运动目标物分割出来。

背景差分法检测目标准确无误，而且速度快，并且程序简单，相较帧间差分法，能够更好的识别和提取对象，是当下视频检测应用最广泛的一种方法。

其流程图如图4-1所示。

背景图像

二值化

目标图像

形态学处理

当前图像

I R

图4-1 背景差分法流程图

背景差分法的关键是如何获取背景图像。

背景图像，顾名思义，就是一副没有运动目标，单纯是运动场景的图画。

随着光照、时间的不断变化，背景图像也就随着变化，背景也就需要时刻更新。

背景图像的建模方法通常有基于单个高斯模型的背景建模，基于混合高斯模型的背景建模，基于中值滤波器的背景建模，基于卡尔曼滤波器的背景建模，基于核函数密度估计的背景建模。

背景差分法如果不考虑噪声n（x,y,t）的影响，视频帧图像I（x,y,t）可以看作是由背景图像B（x,y,t）和运动目标m（x,y,t）组成的：

I（x,y,t）=B（x,y,t）+m（x,y,t）

（4-1）

而在实际中，由于噪声的存在，式（4-1）并不能得到真正的运动目标。

视频帧图像应当是背景图像、运动目标和噪声组成的，即：

I（x,y,t）=B（x,y,t）+m（x,y,t）+n（x,y,t）

（4-2）

要想得到运动对象，先要二值化，下一步的处理，即分割处理。

目前最常用的分割技术是阈值分割：

R（x,y）=ì1

î0

D（x,y）>T

其他

（4-3）

其中D（x,y）表示当前帧与背景图像的差值，T表示设置的阈值，R（x,y）表示阈值处理后的二值图像。

本研究最先采用背景差分法提取目标，其中背景的提取是关键。

我采用的是均值法

提取背景，即将所有的视频图像相加取均值，这样就得到了背景图像，之后根据公式采取背景差分法进行目标提取并输出视频。

处理图像如图4-2和4-3所示。

图4-2 提取背景图

图4-3 背景差分法处理对比图

4.2帧间差分法

帧间差分法是一种通过将连续的两帧视频图像作差分运算，从运算结果中获得检测对象。

差分图像的每一个像素值与阈值比较，大于设定的阈值，就归为运动对象，否则属于背景。

其流程图如图4-4所示。

F（k） R

第k-1帧

F（k-1）

第k

二值化

形态学处理

目标图像

图4-4 帧间差分法流程图

帧间差分法的优点是：

算法实现简单，程序设计复杂度低；对场景光线的变化不太敏感，能够适应各种动态环境，稳定性较好，也不必像背景差分法那样更新背景。

其缺点是：

对于内部纹理较为均匀或者运动缓慢的运动对象时，难以完整的提取前景图像的所有像素点，致使提取图像产生空洞，而且还容易受外界噪声的干扰；对于运动迅速的对象，又会影响准确度。

差分算法的两帧选取也有一定的要求。

对快速运动的物体，需要选择较小的时间间隔，否则会没有重叠，检测不出目标：

对慢速运动的物体，应该选择较大的时间差，否则会完全重叠，也检测不出目标。

设f（k）和f（k-1）分别为时刻k和时刻k-1采集到的两幅图像，据此可以得到差分公式：

D（x,y）=ì1

|f（k）-f（k-1）|>T

î0

k í 其他

（4-4）

其中，T为阈值，Dk（x,y）是帧间差分后的二值图像。

两帧图像相减，有变化的区域赋值1，即白色，没变化的区域赋值0，即黑色。

如此可得目标对象。

本研究采用的第二种方法是帧间差分法，该方法较背景差分法更加的容易，但图像

多为轮廓，并不完整。

处理图像如图4-5所示。

图4-5 帧间差分法处理对比图

4.3混合方法

由上述可见，背景差分法和帧间差分法各自有各自的优点，也都有不足之处，不过两者之间可以互相弥补，用背景差分法可以很好地将目标完整的从静止的背景中提取出来，用帧间差分法可以将背景差分法提取出来的图像边缘化，使图像更加接近实体。

流程图如图4-6所示。

当前帧

背景图像

展开阅读全文