数字图像处理在物体距离测量中的应用Word格式文档下载.docx
《数字图像处理在物体距离测量中的应用Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《数字图像处理在物体距离测量中的应用Word格式文档下载.docx(43页珍藏版)》请在冰点文库上搜索。
![数字图像处理在物体距离测量中的应用Word格式文档下载.docx](https://file1.bingdoc.com/fileroot1/2023-4/29/9f01ca50-6a16-4acf-af00-6a056bd89a01/9f01ca50-6a16-4acf-af00-6a056bd89a011.gif)
3.6.3图像位置间距离的测量27
3.6.4换算为常用单位29
3.6.5误差计算。
29
3.6.6误差分析30
3.6.7实验总结30
第四章结束语31
参考文献32
致谢33
第一章绪论
1.1数字图像处理的发展概述[1]
数字图像处理(DigitalImageProcessing)又称为计算机图像处理,它是指将图像信号转换成数字信号并利用计算机对其进行处理的过程。
数字图像处理最早出现于20世纪50年代,当时的电子计算机已经发展到一定水平,人们开始利用计算机来处理图形和图像信息。
数字图像处理作为一门学科大约形成于20世纪60年代初期。
早期的图像处理的目的是改善图像的质量,它以人为对象,以改善人的视觉效果为目的。
图像处理中,输入的是质量低的图像,输出的是改善质量后的图像,常用的图像处理方法有图像增强、复原、编码、压缩等。
首次获得实际成功应用的是美国喷气推进实验室(JPL)。
他们对航天探测器徘徊者7号在1964年发回的几千张月球照片使用了图像处理技术,如几何校正、灰度变换、去除噪声等方法进行处理,并考虑了太阳位置和月球环境的影响,由计算机成功地绘制出月球表面地图,获得了巨大的成功。
随后又对探测飞船发回的近十万张照片进行更为复杂的图像处理,以致获得了月球的地形图、彩色图及全景镶嵌图,获得了非凡的成果,为人类登月创举奠定了坚实的基础,也推动了数字图像处理这门学科的诞生。
在以后的宇航空间技术,如对火星、土星等星球的探测研究中,数字图像处理技术都发挥了巨大的作用。
数字图像处理取得的另一个巨大成就是在医学上获得的成果。
1972年英国EMI公司工程师Housfield发明了用于头颅诊断的X射线计算机断层摄影装置,也就是我们通常所说的CT(ComputerTomograph)。
CT的基本方法是根据人的头部截面的投影,经计算机处理来重建截面图像,称为图像重建。
1975年EMI公司又成功研制出全身用的CT装置,获得了人体各个部位鲜明清晰的断层图像。
1979年,这项无损伤诊断技术获得了诺贝尔奖,说明它对人类作出了划时代的贡献。
与此同时,图像处理技术在许多应用领域受到广泛重视并取得了重大的开拓性成就,属于这些领域的有航空航天、生物医学工程、工业检测、机器人视觉、公安司法、军事制导、文化艺术等,使图像处理成为一门引人注目、前景远大的新型学科。
随着图像处理技术的深入发展,从70年代中期开始,随着计算机技术和人工智能、思维科学研究的迅速发展,数字图像处理向更高、更深层次发展。
人们已开始研究如何用计算机系统解释图像,实现类似人类视觉系统理解外部世界,这被称为图像理解或计算机视觉。
很多国家,特别是发达国家投入更多的人力、物力到这项研究,取得了不少重要的研究成果。
其中代表性的成果是70年代末MIT的Marr提出的视觉计算理论,这个理论成为计算机视觉领域其后十多年的主导思想。
图像理解虽然在理论方法研究上已取得不小的进展,但它本身是一个比较难的研究领域,存在不少困难,因人类本身对自己的视觉过程还了解甚少,因此计算机视觉是一个有待人们进一步探索的新领域。
1.2数字图像处理主要的研究内容[2]-[4]
数字图像处理主要研究的内容有以下几个方面:
1)图像变换由于图像阵列很大,直接在空间域中进行处理,涉及计算量很大。
因此,往往采用各种图像变换的方法,如傅立叶变换、沃尔什变换、离散余弦变换等间接处理技术,将空间域的处理转换为变换域处理,不仅可减少计算量,而且可获得更有效的处理(如傅立叶变换可在频域中进行数字滤波处理)。
目前新兴研究的小波变换在时域和频域中都具有良好的局部化特性,它在图像处理中也有着广泛而有效的应用。
2)图像编码压缩图像编码压缩技术可减少描述图像的数据量(即比特数),以便节省图像传输、处理时间和减少所占用的存储器容量。
压缩可以在不失真的前提下获得,也可以在允许的失真条件下进行。
编码是压缩技术中最重要的方法,它在图像处理技术中是发展最早且比较成熟的技术。
3)图像增强和复原图像增强和复原的目的是为了提高图像的质量,如去除噪声,提高图像的清晰度等。
图像增强不考虑图像降质的原因,突出图像中所感兴趣的部分。
如强化图像高频分量,可使图像中物体轮廓清晰,细节明显;
如强化低频分量可减少图像中噪声影响。
图像复原要求对图像降质的原因有一定的了解,一般讲应根据降质过程建立"
降质模型"
,再采用某种滤波方法,恢复或重建原来的图像。
4)图像分割图像分割是数字图像处理中的关键技术之一。
图像分割是将图像中有意义的特征部分提取出来,其有意义的特征有图像中的边缘、区域等,这是进一步进行图像识别、分析和理解的基础。
虽然目前已研究出不少边缘提取、区域分割的方法,但还没有一种普遍适用于各种图像的有效方法。
因此,对图像分割的研究还在不断深入之中,是目前图像处理中研究的热点之一。
5)图像描述图像描述是图像识别和理解的必要前提。
作为最简单的二值图像可采用其几何特性描述物体的特性,一般图像的描述方法采用二维形状描述,它有边界描述和区域描述两类方法。
对于特殊的纹理图像可采用二维纹理特征描述。
随着图像处理研究的深入发展,已经开始进行三维物体描述的研究,提出了体积描述、表面描述、广义圆柱体描述等方法。
6)图像分类(识别)图像分类(识别)属于模式识别的范畴,其主要内容是图像经过某些预处理(增强、复原、压缩)后,进行图像分割和特征提取,从而进行判决分类。
图像分类常采用经典的模式识别方法,有统计模式分类和句法(结构)模式分类,近年来新发展起来的模糊模式识别和人工神经网络模式分类在图像识别中也越来越受到重视。
1.3数字图像处理的基本特点[5]
目前,数字图像处理的信息大多是二维信息,处理信息量很大。
如一幅256×
256低分辨率黑白图像,要求约64kbit的数据量;
对高分辨率彩色512×
512图像,则要求768kbit数据量;
如果要处理30帧/秒的电视图像序列,则每秒要求500kbit~22.5Mbit数据量。
因此对计算机的计算速度、存储容量等要求较高。
(2)数字图像处理占用的频带较宽。
与语言信息相比,占用的频带要大几个数量级。
如电视图像的带宽约5.6MHz,而语音带宽仅为4kHz左右。
所以在成像、传输、存储、处理、显示等各个环节的实现上,技术难度较大,成本亦高,这就对频带压缩技术提出了更高的要求。
(3)数字图像中各个像素是不独立的,其相关性大。
在图像画面上,经常有很多像素有相同或接近的灰度。
就电视画面而言,同一行中相邻两个像素或相邻两行间的像素,其相关系数可达0.9以上,而相邻两帧之间的相关性比帧内相关性一般说还要大些。
因此,图像处理中信息压缩的潜力很大。
(4)由于图像是三维景物的二维投影,一幅图像本身不具备复现三维景物的全部几何信息的能力,很显然三维景物背后部分信息在二维图像画面上是反映不出来的。
因此,要分析和理解三维景物必须作合适的假定或附加新的测量,例如双目图像或多视点图像。
在理解三维景物时需要知识导引,这也是人工智能中正在致力解决的知识工程问题。
(5)数字图像处理后的图像一般是给人观察和评价的,因此受人的因素影响较大。
由于人的视觉系统很复杂,受环境条件、视觉性能、人的情绪爱好以及知识状况影响很大,作为图像质量的评价还有待进一步深入的研究。
另一方面,计算机视觉是模仿人的视觉,人的感知机理必然影响着计算机视觉的研究。
例如,什么是感知的初始基元,基元是如何组成的,局部与全局感知的关系,优先敏感的结构、属性和时间特征等,这些都是心理学和神经心理学正在着力研究的课题
1.4数字图像处理的优点[6]
1.再现性好
数字图像处理与模拟图像处理的根本不同在于,它不会因图像的存储、传输或复制等一系列变换操作而导致图像质量的退化。
只要图像在数字化时准确地表现了原稿,则数字图像处理过程始终能保持图像的再现。
2.处理精度高
按目前的技术,几乎可将一幅模拟图像数字化为任意大小的二维数组,这主要取决于图像数字化设备的能力。
现代扫描仪可以把每个像素的灰度等级量化为16位甚至更高,这意味着图像的数字化精度可以达到满足任一应用需求。
对计算机而言,不论数组大小,也不论每个像素的位数多少,其处理程序几乎是一样的。
换言之,从原理上讲不论图像的精度有多高,处理总是能实现的,只要在处理时改变程序中的数组参数就可以了。
回想一下图像的模拟处理,为了要把处理精度提高一个数量级,就要大幅度地改进处理装置,这在经济上是极不合算的。
3.适用面宽
图像可以来自多种信息源,它们可以是可见光图像,也可以是不可见的波谱图像(例如X射线图像、射线图像、超声波图像或红外图像等)。
从图像反映的客观实体尺度看,可以小到电子显微镜图像,大到航空照片、遥感图像甚至天文望远镜图像。
这些来自不同信息源的图像只要被变换为数字编码形式后,均是用二维数组表示的灰度图像(彩色图像也是由灰度图像组合成的,例如RGB图像由红、绿、蓝三个灰度图像组合而成)组合而成,因而均可用计算机来处理。
即只要针对不同的图像信息源,采取相应的图像信息采集措施,图像的数字处理方法适用于任何一种图像。
4.灵活性高
图像处理大体上可分为图像的像质改善、图像分析和图像重建三大部分,每一部分均包含丰富的内容。
由于图像的光学处理从原理上讲只能进行线性运算,这极大地限制了光学图像处理能实现的目标。
而数字图像处理不仅能完成线性运算,而且能实现非线性处理,即凡是可以用数学公式或逻辑关系来表达的一切运算均可用数字图像处理实现。
第二章数字图像的基本原理
2.1数字图像的硬件原理[7][8]
2.1.1CCD原理
CCD(ChargeCoupledDevice,电荷耦合器),用一个形象的比喻来说明,CCD的结构就像一排排输送带上并列放置的小桶,光线就像雨滴撒入各个小桶中,每个小桶代表一个像素。
快门开启到关闭的拍摄过程,其实就是按一定的顺序测量某一短暂的时间中,小桶中落进了多少“光滴”,并形成相应的数据文件。
一般的CCD每原色的亮度用8位数据来记录,即其小桶上的刻度有28格,也有的是10位甚至12位,更高的色彩位数在记录色彩时可以更精确,尤其是在光线条件比较差时,能够记录下丰富的暗部细节层次。
2.1.2照明
照明是影响机器视觉系统输入的重要因素,因为它直接影响输入数据的质量和至少30%的应用效果。
由于没有通用的机器视觉照明设备,所以针对每个特定的应用实例,要选择相应的照明装置,以达到最佳效果。
过去,许多工业用的机器视觉系统用可见光作为光源,这主要是因为可见光容易获得,价格低,并且便于操作。
常用的几种可见光源是白帜灯、日光灯、水银灯和钠光灯。
但是,这些光源的一个最大缺点是光能不能保持稳定。
以日光灯为例,在使用的第一个100小时内,光能将下降15%,随着使用时间的增加,光能将不断下降。
因此,如何使光能在一定的程度上保持稳定,是实用化过程中急需要解决的问题。
另一个方面,环境光将改变这些光源照射到物体上的总光能,使输出的图像数据存在噪声,一般采用加防护屏的方法,减少环境光的影响。
由于存在上述问题,在现今的工业应用中,对于某些要求高的检测任务,常采用X射线、超声波等不可见光作为光源。
但是不可见光不利于检测系统的操作,且价格较高,所以,目前在实际应用中,仍多用可见光作为光源。
照明系统按其照射方法可分为:
背向照明、前向照明、结构光和频闪光照明等。
其中,背向照明是被测物放在光源和摄像机之间,它的优点是能获得高对比度的图像。
前向照明是光源和摄像机位于被测物的同侧,这种方式便于安装。
结构光照明是将光栅或线光源等投射到被测物上,根据它们产生的畸变,解调出被测物的三维信息。
频闪光照明是将高频率的光脉冲照射到物体上,摄像机拍摄要求与光源同步。
2.1.3镜头及其成像原理
镜头是摄像机最主要的组成部分,并被喻为人的眼睛。
人眼之所以能看到宇宙万物,是由于凭眼球水晶体能在视网膜上结成影像的缘故;
摄像机所以能摄影成像,也主要是靠镜头将被摄体结成影像投在摄像管或固体摄像器件的成像面上。
因此说,镜头就是摄像机的眼睛。
电视画面的清晰程度和影像层次是否丰富等表现能力,受光学镜头的内在质量所制约。
当今市场上常见的各种摄像机的镜头都是加膜镜头。
加膜就是在镜头表面涂上一层带色彩的薄膜,用以消减镜片与镜片之间所产生的色散现象,还能减少逆光拍摄时所产生的眩光,保护光线顺利通过镜头,提高镜头透光的能力,使所摄的画面更清晰。
摄像者在自学摄像的过程中,首先要熟知镜头的成像原理,它主要包括焦距、视角、视场和像场。
焦距是焦点距离的简称。
例如,把放大镜的一面对着太阳,另一面对着纸片,上下移动到一定的距离时,纸片上就会聚成一个很亮的光点,而且一会儿就能把纸片烧焦成小孔,故称之为“焦点”。
从透镜中心到纸片的距离,就是透镜的焦点距离。
对摄像机来说,焦距相当于从镜头“中心”到摄像管或固体摄像器件成像面的距离。
焦距是标志着光学镜头性能的重要数据之一,因为镜头拍摄影像的大小是受焦距控制的。
在电视摄像的过程中,摄像者经常变换焦距来进行造型和构图,以形成多样化的视觉效果。
例如,在对同一距离的同一目标拍摄时,镜头的焦距越长,镜头的水平视角越窄,拍摄到景物的范围也就越小;
镜头的焦距越短,镜头的水平视角越宽,拍摄到的景物范围也就越大。
一个摄像机镜头能涵盖多大范围的景物,通常以角度来表示,这个角度就叫镜头的视角。
被摄对象透过镜头在焦点平面上结成可见影像所包括的面积,是镜头的视场。
但是,视场上所呈现的影像,中心和边缘的清晰度和亮度不一样。
中心部分及比较接近中心部分的影像清晰度较高,也较明亮;
边缘部分的影像清晰度差,也暗得多。
这边缘部分的影像,对摄像来说是不能用的。
所以,在设计摄像机的镜头时,只采用视场。
需要重点指出,摄像机最终拍摄画面的尺寸并不完全取决于镜头的像场尺寸。
也就是说,镜头成像尺寸必须与摄像管或固体摄像器件成像面的最佳尺寸一致。
当摄像机镜头的成像尺寸被确定之后,对一个固定焦距的镜头来说则相对具有一个固定的视野,常用视场来表示视野的大小。
它的规律是,焦距越短,视角和视场就越大。
所以短焦距镜头又被称为广角镜头。
2.1.4图像采集卡
虽然图像采集卡只是完整的图像数字处理系统的一个部件,但是它扮演一个非常重要的角色。
图像采集卡直接决定了摄像头的接口:
黑白、彩色、模拟、数字等等。
使用模拟输入的图像采集卡,目标是尽量不变地将摄像头采集的图像转换为数字数据。
使用不正确的图像采集卡可能得到错误的数据。
工业用的图像采集卡通常用于检测任务,多媒体采集卡由于它通过自动增益控制、边沿增强和颜色增强电路来更改图像数据,所以不用在这个领域里。
使用数字输入的图像采集卡的目标是将摄像头输出的数字图像数据转换并输送到PC中作处理。
现在你能找到的比较典型的是PCI或AGP兼容的捕获卡,可以将图像迅速地传送到计算机存储器进行处理。
有些捕获卡有内置的多路开关。
例如,你可以连接8个不同的摄像机然后告诉捕获卡采用那一个摄像机抓拍到的信息。
有些捕获卡有内置的数字输入口以触发捕获卡进行捕获,当捕获卡正在抓拍图像时数字输出口触发闸门。
2.2数字图像的软件原理
2.2.1图像的数字化[9]
数字图像实质上是一段能够被计算机还原显示和输出为一幅图像的数字码。
在计算机中,图像是以数字方式来记录、处理和保存的,所以图像也可以说是数字化图像。
2.2.2数字图像类型[10]
数字化图像按照记录方式可以分为位图图像与矢量图像。
(1)矢量图像:
矢量图像也可以说是向量式图像,用数学的矢量方式来记录图像内容,以线条和色块为主。
例如一条线段的数据只需要记录两个端点的坐标、线段的粗细和色彩等,因此它的文件所占的容量较小,也可以很容易地进行放大、缩小或旋转等操作,并且不会失真,精确度较高并可以制作3D图像。
但这种图像有一个缺陷,不易制作色调丰富或色彩变化太多的图像,而且绘制出来的图形不是很逼真,无法像照片一样精确地描写自然界的景象,同时也不易在不同的软件间交换文件。
矢量处理比较适合存储各种图表和工程设计图。
(2)位图图像:
位图图像弥补了矢量式图像的缺陷,它能够制作出色彩和色调变化丰富的图像,可以逼真地表现自然界的景象,同时也可以很容易地在不同软件之间交换文件,这就是位图图像的优点;
而其缺点则是它无法制作真正的3D图像,并且图像缩放和旋转时会产生失真的现象,同时文件较大,对内存和硬盘空间容量的需求也较高。
位图方式就是将图像的每一像素点转换为一个数据。
如果用1位数据来记录,那么它只能代表2种颜色(21=2);
如果以8位来记录,便可以表现出256种颜色或色调(28=256),因此使用的位元素越多所能表现的色彩也越多。
通常我们使用的颜色有16色、256色、增强16位和真彩色24位。
一般所说的真彩色是指24位(28×
28×
28)的位图存储模式适合于内容复杂的图像和真实照片。
但随着分辨率以及颜色数的提高,图像所占用的磁盘空间也就相当大;
另外由于在放大图像的过程中,其图像势必要变得模糊而失真,放大后的图像像素点实际上变成了像素“方格”。
用数码相机和扫描仪获取的图像都属于位图。
2.2.3数字图像格式简介[10]-[13]
要利用计算机对数字化图像进行处理,首先要对图像的文件格式要有清楚的认识,因为我们前面说过,自然界的图像以模拟信号的形式存在,在用计算机进行处理以前,首先要数字化,比如摄像头(CCD)摄取的信号在送往计算机处理前,一般情况下要经过数模转换,这个任务常常由图像采集卡完成,它的输出一般为裸图的形式;
如果用户想要生成目标图像文件,必须根据文件的格式做相应的处理。
随着科技的发展,数码像机、数码摄像机已经进入寻常百姓家,我们可以利用这些设备作为图像处理系统的输入设备来为后续的图像处理提供信息源。
无论是什么设备,它总是提供按一定的图像文件格式来提供信息,比较常用的有BMP格式、JPEG格式、GIF格式等等,所以我们在进行图像处理以前,首先要对图像的格式要有清晰的认识,只有在此基础上才可以进行进一步的开发处理。
在讲述图像文件格式前,先对图像作一个简单的分类。
除了最简单的图像外,所有的图像都有颜色,而单色图像则是带有颜色的图像中比较简单的格式,它一般由黑色区域和白色区域组成,可以用一个比特表示一个像素,“1”表示黑色,“0”表示白色,当然也可以倒过来表示,这种图像称之为二值图像。
我们也可以用8个比特(一个字节)表示一个像素,相当于把黑和白等分为256个级别,“0”表示为黑,“255”表示为白,该字节的数值表示相应像素值的灰度值或亮度值,数值越接近“0”,对应像素点越黑,相反,则对应像素点越白,此种图像我们一般称之为灰度图像。
单色图像和灰度图像又统称为黑白图像,与之对应存在着彩色图像,这种图像要复杂一些,表示图像时,常用的图像彩色模式有RGB模式、CMYK模式和HIS模式,一般情况下我们只使用RGB模式,R对应红色,G对应绿色,B对应蓝色,它们统称为三基色,这三中色彩的不同搭配,就可以搭配成各种现实中的色彩,此时彩色图像的每一个像素都需要3个样本组成的一组数据表示,其中每个样本用于表示该像素的一个基本颜色
对于现存的所有的图像文件格式,我们在这里主要介绍BMP图像文件格式,并且文件里的图像数据是未压缩的,因为图像的数字化处理主要是对图像中的各个像素进行相应的处理,而未压缩的BMP图像中的像素数值正好与实际要处理的数字图像相对应,这种格式的文件最合适我们对之进行数字化处理。
(1)BMP格式:
BMP图像格式是WindowsBitMap的缩写,它是最普遍的点阵图格式之一,也是WNDOWS及OS/2两种操作系统的标准格式。
在Windows窗口系统中被广泛应用,在Windows环境中运行的图形图像软件都支持BMP图像格式,它也是最不容易出问题的图像格式。
BMP只能存储四种图像数据:
单色、16色、256色和全彩色。
BMP图像数据有压缩或不压缩两种处理方式。
其中压缩方式只有RRLE4(16色)和RLE8(256色)两种,而由于24位BMP格式的图像文件无法压缩,因而文件尺寸比较大。
(2)PCX格式:
PCX图像格式是MSDOS下常用的格式,它架起了DOS和Windows操作的桥梁。
在Windows操作系统尚未普及时,在MS?
/FONT>
DOS下图像的绘制、排版,多用PCX格式,从最早的16色,发展至今已可达1677万色。
(3)GIF格式:
GIF是GraphicsInterchangeFormat(图形交换格式)的简写,是CompuServe公司所制订的图像文件格式,由于CompuServe公司开放使用权限,所以广受应用。
目前,GIF图像文件已经成为网络和BBS上图像传输的通用格式,经常用于动画、透明图像等。
一个GIF文件能够储存多张图像,图像数据用一个字节存储一个像素点,采用LZW压缩格式,尺寸较小。
图像数据有两种排列方式:
顺序排列和交叉排列,但G1F格式的图像最多只有256色。
(4)JPEG格式:
JPEG是JointPhotographicExpertsGroup的缩写。
JPEG是一种高效率的压缩图像,在保存时能够将人眼无法分辨的资料删除,以节省储存空间,但这些被删除的资料无法在解压时还原,所以JPEG档案并不适合放大观看,输出成印刷品时其质量也会受到影响,这种类型的图像压缩方式,称为“失真压缩”或“破坏性压缩”。
(5)TIF(F)格式:
TIF(F)是TaggedImageFileFormat的缩写,它被用于在应用程序之间和计算机平台之间交换文件,几乎被所有绘画、图像编辑和页面排版应用程序所支持。
而且几乎所有桌面扫描仪都可以生成TIFF图像。
TIF格式支持带A1pha通道的CMYK、RGB和灰度文件,支持不带A1pha通道的Lab、索引颜色和位图文件。
TIF也支持LZW压缩。
TIF常被用于彩色图像的扫瞄,它是以RGB的全彩模式储存。
(6)PSD格式:
PSD图像是AdobePhotoshop的专用图像格式,可以储存成RGB或CMYK模式,而且能自定义颜色数目储存,PSD可以将不同的物件以层级(Layer)分离储存,以便于修改和制作各种特殊效果。
2.2.4BMP图像结构[10][11]
1、第一部分为位图文件头BITMAPFILEHEADER,它是一个结构,其定义如下:
typedefstructagBITMAPFILEHEADER{
WORDbfType;
WORDbfSize;
WORDbfReserved1;
WORDbfReserved2;
WORDbfOffBits;
}BITMAPFILEHEADER,FAR*LPBITMAPFILEHEADER,*PBITMAPFILEHEADER;
该结构的长度是固定的,为14个字节,各个域的说明如下:
Ø
bfT