毕业论文设计基于贝叶斯算法的自动抠图程序设计与实现.doc

资源描述

毕业论文设计基于贝叶斯算法的自动抠图程序设计与实现.doc

《毕业论文设计基于贝叶斯算法的自动抠图程序设计与实现.doc》由会员分享，可在线阅读，更多相关《毕业论文设计基于贝叶斯算法的自动抠图程序设计与实现.doc（42页珍藏版）》请在冰点文库上搜索。

毕业论文设计基于贝叶斯算法的自动抠图程序设计与实现.doc

山东大学本科毕业论文

摘要 5

ABSTRACT 6

第1章绪论 7

1.1自动抠图程序设计开发背景 7

1.2国内外研究现状 7

1.3解决的主要问题 9

1.4本文的主要工作 9

1.5论文的组织结构 10

第2章自动抠图程序设计需求分析 11

2.1自动抠图程序设计概述 11

2.1.1自动抠图程序设计项目背景 11

2.1.2自动抠图程序设计项目说明 11

2.1.3数字抠图的原理和方法概述 12

2.2自动抠图程序设计目标和解决的问题 14

第3章几种抠图方法的比较 16

3.1基于采样的抠图方法 16

3.1.1Knockout方法抠图 16

3.1.2通过区域区域生长制作trimap 17

3.2基于传播的方法抠图 19

第四章贝叶斯抠图方法的MATLAB实现 22

4.1MATLAB功能简介 23

4.1.1MATLAB简介 23

4.1.2MATLAB特点 23

4.1.3MATLAB优势 23

4.1.3M语言编程 24

4.2自动抠图程序设计界面介绍 24

4.2.1自动抠图程序设计核心代码 25

4.2.2自动抠图程序设计操作流程介绍及流程图展示 27

第5章自动抠图程序设计实现与测试 27

5.1自动抠图程序设计总体实现 28

5.2MATLAB运行结果展示 30

第6章结论 31

致谢 33

参考文献 34

附录1英文原文 36

附录2译文 36

基于贝叶斯算法的自动抠图程序设计与实现

摘要

数字抠图技术是一种从目标图像中把需要的前景物体从背景中抽取的数字图像处理技术，随着图像处理、广告传媒和虚拟现实等领域的蓬勃发展，数字抠图技术也越来越普遍地应用于各种图像处理软件。

最初的蓝屏抠图技术和差异抠图技术囿于技术的限制，在抠图过程中存在极大的局限性。

虽然目前数字抠图技术日趋成熟，但仍不能在图像处理实践过程中满足对于抠图结果灵活性、准确性和易用性的要求。

本论文对于抠图方法有了一些新的认知，即通过贝叶斯算法来处理，也就是基于贝叶斯算法的数字抠图方法。

本论文简要介绍了图像前景与背景分离技术的研究背景及其研究现状,并分析比较了几种算法的优劣性。

本论文的主要工作包括:

研究并分析了Knockout方法抠图的实现方法、trimap抠图的实现方法和Bayes抠图的实现。

因为Bayes抠图只需要一些简单的矩阵运算，就可以得到较为准确的抠图结果，所以是容易实现的。

这种方法也是非常准确的，因为通过三分图的前期处理，它可以有效地处理非线性局部颜色分布问题，从而解决了非线性的数字抠图问题。

利用MATLAB软件对本文研究的算法进行编程测试，实验结果表明，该算法优于许多其它的抠图方法。

关键词：

数字抠图；贝叶斯抠图；局部学习；三分图；自然图像抠图

ABSTRACT

Thedigitalmattingisatechnologythatcanextractaforegroundelementofarbitraryshapewhichusersneedfromabackgroundimagebythewayofestimatingacolorandopacityfortheforegroundelementateverypixel.Ithasbeenwidelyusedinimageprocessing,advertisingmediaandvirtualrealityinareassuchasdigitaltechnologyincreasinglymattingcommonlyusedinavarietyofimageprocessingsoftware.Theinitialbluescreenmattingmattingtechnologyandtechnicaldifferencesconfinedtotechnicallimitations,thereareseverelimitationsinthediggingprocess.Althoughdigitalmattingtechnologymatures,butstillcannotmeettheresultsformattingflexibility,accuracyandeaseofuserequirementsofimageprocessinginpractice.

Inthispaper,amethodformattinghassomenewawareness,throughBayesalgorithmtoprocess,whichisadigitalmattingBayesianalgorithmbasedapproach.Thispaperbrieflydescribestheimageforegroundandbackgroundresearchbackgroundandpresentstatusofthetechnology,andtheanalysisandcomparisonoftheadvantagesanddisadvantagesofseveralalgorithms.

Themainworkofthispaperinclude:

researchandanalysisoftheimplementationKnockoutmatting,trimapmattingmethodsandBayesmattingimplementation.BecauseBayesmattingrequiresonlyafewsimplematrixoperations,youcangetmoreaccurateresultsmatting,itiseasytoachieve.Thismethodisveryaccurate,becausethepre-treatmentbytrimap,itcaneffectivelydealwiththeproblemofnonlinearpartialcolordistribution,therebysolvingtheproblemofnon-lineardigitalmatting.UsingMATLABsoftwareprogrammingalgorithmresearchExperimentalresultsshowthatthealgorithmissuperiortomanyothermattingmethods.

Keywords:

digitalmatting;Bayesianmatting;locallearning;trimap;naturalimagematting

第1章绪论

1.1自动抠图程序设计开发背景

伴随着信息媒介的更新与发展，图像信息在人类日常生活中发挥着不可取代的重要作用，在人类信息传播的历史进程中“图像传播”是至关重要也是极具过渡性的环节。

图像符号所具备的特殊传播力使得图像这一信息载体在人类社会进入信息化时代后向传统传播媒介发起挑战。

以图像为中心的视觉文化系统逐步成熟并且向着更为多元化的方向迅猛发展。

上世纪80年代到90年代随着计算机技术的飞速发展，整合了文字、声音、图像的多媒体时代应运而生数字图像作品大放异彩。

数字图像处理、计算机视觉等学科在人类生活中已经产生了深刻的影响，现如今数字图像已然成为信息传输的又一重要媒介[1]，它们同文字、语言相辅相成，构成了现代人类表达和交流的主要手段。

哲学家维兰·傅拉瑟VilémFlusser认为图像符（graphical symbol）是“用以规定加入秩序化的符号系统。

”[2]在动画影视快速发展的今天，抠图与图像合成技术日趋成为图像处理与影视制作过程中占主导地位的关键技术。

抠图（matting）是指人们从目标图像中将需要的前景物体抽取出来的数字图像处理技术。

其与图像合成技术在杂志、二维图形艺术、电视、广告等传媒制作业中已成为不扩或缺的核心手段。

1.2国内外研究现状

数字抠图技术（technologyofdigitalmatting）的一些研究由来已久，以下针对近年来国内外的相关研究作一个简单的讨论与阐述。

抠图与图像合成技术是影视制作中不可或缺的关键技术,其广泛应用于媒体制作中。

抠图是指把任意形状的前景物体从图像中抽取出来的一种技术,图像合成技术则是把抽取出来的前景物体和一幅新的背景图像合成为新的图像的过程。

“抠图和图像合成是一组互逆的基本操作，抠图与图像合成技术始于19世纪50年代,它经历了光学和数字两大发展阶段。

20世纪80年代,数字抠图方法逐渐取代了光学抠图方法。

”[3]当前，数字抠图与图像合成技术已经在各种应用中占据了举足轻重地位。

数字抠图技术主要分为蓝屏抠图和自然图像抠图,此外还有环境抠图阴影抠图和视频抠图三种扩展和应用。

基于单张图像的抠图算法是当前抠图技术的主流研究方向。

此类方法通过用户先赋予图像部分的预处理工作，即一些必要的标记笔画和轮廓描述或通过计算得出一幅三分图，无论哪一种处理从本质上都将目标图像的部分像素点指定为了确定的前背景点。

因此抠图算法的主要目标即为如何从这些已知α值的像素点中确定的信息并规定其它区域中像素点的α值求解。

根据求解的大致结果的差异可以主要可以把抠图技术分为以下三类：

1）基于颜色采样的方法：

此类方法假设未知像素点的前背景颜色可以由少量已知的像素采样点的颜色来确定。

其具体技术的发展又可以大致分为两个阶段。

早期的方法通常收集一些距离需要求解像素较近的已知像素点作为采样点集并为其建立模型，并以此估算使得目标像素点呈现给定颜色最大概率的前背景颜色以及对应的α值。

而近期的方法则致力于在保证效率的前提下收集更多可靠的前背景像素对，并为每个未知像素点选取一对最好的前背景颜色，再分别来计算每个像素的α值。

早期的方法比如BayesianMatting[4]、Ruzon-Tomasi[5]、Hillman[6]等都是基于采样的方法，但是通过采样的方法采集到的前景和背景像素的样本点具有不确定性，使得最终得到的掩膜值不够精确；

2）基于关联的方法：

该类方法从特定的假定模型出发，如Closed-form抠图法中的颜色线性模型，建立一个包含全部未知区域和部分已知区域像素点的α值关联矩阵并将该关联矩阵嵌入一个优化方程中，经过整体优化后再求解α值。

基于传播的方法不需要通过采集样本点来估计掩膜值，它假设未知像素在一个小窗口内是局部平滑的，再通过闭合空间中求解α。

RandomWalkMatting[7]、ClosedFormSolution[8]、PoissonMatting[9]等都属于基于传播的方法，该方法对大部分图片都能取得较好的结果；

3）基于采样和关联的混合方法：

该类方法将以上两类方法相结合，通常的做法是先利用采样的方法估算未知区域像素点初始的α值，再建立α值关联矩阵，将二者联立置于一个统一的优化方程中，最后优化求解。

采样与传播相结合的方法能取得更好的结果，如SharedMatting[10]、RobustMatting[11]、ComprehensiveSamplingMatting[12]等。

本论文所研究的贝叶斯算法只是针对单张图片的方法，也就是将人们需要的前景物体比较准确地从图像中提取出来，以能够无缝隙地合成到指定背景中。

下面将会简明介绍一些抠图方法，并通过与本文所研究的方法对比，来说明贝叶斯方法对于抠图的一些实际效果。

1.3解决的主要问题

在现实生活中，很多事物因为其特有的特征使得抠图成为一大难题，例如动物的毛发，透明的物体，如图1-1所示，等等，这些图像的复杂特征大大增加了抠图的难度，使得精确抠图并不是那么的容易实现。

动物的毛发边缘面积通常没有一个像素点大，这样就会使得交界处的像素点颜色由图像的前景颜色和背景颜色共同决定，即一个像素点既包含的前景的颜色，同时也包含了背景的颜色，传统的抠图技术根本不可能精确的划分这一个像素点的哪一部分属于前景，哪一部分属于背景，也就不可能把前景图像精确的抠取出来。

同理，因为透明的物体使前景和背景重叠在一起，利用传统的抠图技术也不能把透明的物体抠取出来。

为了解决这些复染的问题，对数字图像抠图方法的研究就显得举足轻重。

针对此类问题本论文对抠图算法做了必要的改进和优化，对比几种现有的算法，将贝叶斯抠图稍作改进。

本程序设计可以较好地实现抠图，对透明物体、毛发、镂空网状物体等较为复杂的前景物象进行trimap处理，通过生成准确的α图完成抠图过程。

图1-1动物毛发、玻璃杯、纱网样例

1.4本文的主要工作

本论文在现有主流的自动抠图软件基础上，分析了自动抠图技术的发展现状和历程，回顾了自动抠图技术的发展和突破，并结合现有的抠图算法的思想，设计和实现了贝叶斯抠图的程序设计。

为了在工作中选取比较合适的抠图算法，本文对前人实现的几种典型算法进行实验比较。

详细介绍了目前出现的两种典型数字图像抠图方法，综备分析比较各种数字图像抠图算法的优缺点。

研究和分析了两种典型的数字图像枢图方法：

基于采样的抠图方法一—Knockout抠图

基于传播的抠图方法一—Poisson抠图

较为详细研究了这上述两种典型抠图算法，综合比较这两种算法的抠图效果、抠图速率等方面，并通过实验比较加以证实理论的研究。

1.5论文的组织结构

第一章绪论，主要描述自动抠图程序设计的开发背景、自动抠图技术的国内外现状，本文解决的主要问题和完成的工作。

第二章为自动抠图程序设计需求分析，该部分主要阐述了现行抠图技术的需求和发展趋势，对自动抠图项目进行了必要的说明并且较为详细地介绍了抠图技术的发展历程。

介绍了数字抠图的原理以及其设计目标和解决的问题。

第三章对比了几种典型的抠图方法并且将它们的算法实现过程做了较为详细地比较。

其中将贝叶斯算法做了详细地介绍，由于所介绍的几种算法都需要事先进行trimap的预处理，所以也介绍了通过区域生长制作trimap的过程。

第四章详细介绍了贝叶斯抠图的matlab实现过程，其中对matlab程序和M语言做了详细的介绍和比对。

对本程序设计的界面进行了展示，并且显示bayesian抠图的核心代码和自动抠图程序设计操作流程介绍及流程图展示。

第五章为自动抠图程序设计实现与测试，其中MATLAB运行结果展示了本程序的操作流程和各环节的效果展示。

第2章自动抠图程序设计需求分析

2.1自动抠图程序设计概述

2.1.1自动抠图程序设计项目背景

抠图技术是一种图像处理技术，这种图像处理技术能将用户需要的图像从整幅图像中提取出来，也就是将图像的前景部分和背景部分进行分离。

这是图像的前景和背景部的一部分被分离的图像处理技术，图像处理技术，例如图像可以提取。

切口早期技术背景图像具有非常苟刻的要求，如在技术和蓝屏消光的消光技术的差别，这两种技术都在图像的背景有具体的要求，这使得该技术推广和消光应用有一个非常大的局限性，无法满足用户的需求。

在蓝色的消光技术的关键技术是设置背景图片，则需要扣除放置在图像编辑过程中拍摄将是绿色或蓝色背景的自然背景的实际需要更换一个绿色或蓝色背景上的对象;在的技术和蓝屏消光的消光技术原理类似的差别时，背景图像是固定的，由图像的蓝色或绿色的背景天然背景，这是相同的，但没有背景对象的前景背景图像替换，并且要被处理的图像来区分比较的对象的不同部分需要扣除。

这两种技术有非常大的局限性，无法满足员工的需求。

随着计算机技术的迅速发展，图像处理人员从自然背景采取拉为所需的图像越来越要求，如对更好和更精确的消光效果，更快的速度要求抠图时间人类交互它需要一个更短，或甚至实现实时数据透视图需要，这些需求也进一步促进了数字图像抠图技术的发展。

2.1.2自动抠图程序设计项目说明

前景提取与图像合成（即自动抠图技术）是计算机图像处理和视觉特效制作中的基本操作。

前景提取是指从一幅图像中提取出任意形状的前景对象，而图像合成是将提取出的前景对象放置在一个新的背景对象上合成一幅新的图像。

前景提取与图像合成技术最早是从电影制作中发展起来的。

而今，前景提取与图像合成是视觉特效制作中最重要的也是最常用的操作。

通过前景提取与图像合成操作，我们可以将新物体无缝地插入到一个场景中，也可以将演员放在一个全新的位置上。

在虚拟现实和虚实融合方面也得到了充分的应用。

另外，前景提取与图像合成技术也在其他领域有广泛的应用，比如杂志、二维图形艺术、电视、广告等传媒制作业。

2.1.3数字抠图的原理和方法概述

给定一个目标图像I，图像可视为前景F与背景B关于α的线性组合。

数字抠图和图像合成技术用Porter等提出的合成方程

（1）如以下所示：

I=αF+（1−α）B公式

（1）

其中，I，F和B分别表示合成图像、前景图像和背景图像。

α称为掩膜值，它表示I对应点的颜色值中含前景颜色的百分比或该点的不透明程度。

图像的抠图通常是用来为图像合成服务的，即两者是一对对偶的操作。

当对指定图像完成抠图之后，可以再利用方程

（1）把前景和所获得的透明度图与一幅新的背景图合成起来，最后形成一幅新的图像。

基于抠图所获得的合成图像应该能在前背景交接边界区域拥有无缝融合的特性，以给观者呈现出一种与实际拍摄图接近的甚至以假乱真的视觉体验。

正鉴于抠图技术这一良好的特性，它在图像合成及电影制作等领域都有着广泛应用，这也是近几年学术研究的热点问题。

图像的抠图和前背景分割问题也密切相关，实际上，后者也致力于分离人们给定图像的前景并且可基于方程

（1）来定义。

但此时变量α的只能取值为0或1，其中“0”表示绝对背景点，而“1”则对应绝对前景点。

所以，从定义上看，抠图问题可视作前背景分割问题的拓展，但抠图技术是一种相对前背景分割技术的要求更精细化的前景提取技术。

这种精细化的必要性尤其体现在对某些自然图像前景抠取的任务中，例如包含某些特定前景的图像。

具体来说，这些图像的前景通常有一些毛绒或者毛发的边缘又或是半透明的材质等。

这些图像在部分前景区域，尤其是前背景的交界处，其像素点的颜色为前景色与背景色的混合色，即是前景透明度0<α<1，这将是前背景分割技术无法处理的。

因此，在此种情形下，高质量的前景提取效果必须通过抠图技术来获得。

人们常常使用三分图划分或是标记的方法进行区分前景背景，尽管如此，抠图还是存在许多不足。

因此，人们对此进行了进一步的约束。

例如，根据一系列距离最近的被标记的前景背景像素，未知像素属于前景还是背景能很好地被估计出来[1,13]，前景背景被假设是局部平滑的[14,15,16]，预估的α值是局部一致的[17,18]等等。

第一个约束通常适应于以三分图为基础的抠图问题，而后两个约束更适应于以涂鸦标记为基础的抠图问题。

这些约束条件通过实验证明是比较有价值的，并且以这些约束为前提的许多技术文献[19]早已被提出用来获取更高质量的前景。

为了利用额外提供的条件与约束来解决抠图问题，产生精确结果的一个关键因素是如何建立α值与一系列相关的彩色图像像素之间的关系模型，这种关系简称为alpha-color模型。

人们常常选取alpha-color模型的像素作为样本点，而利用选取的alpha-color模型来估计没被标记的像素的α值。

对于基于三分图的抠图技术而言，通常一系列最近的标记像素是样本点，但对于基于涂鸦的抠图技术而言，样本点通常是被估计像素的一些相邻像素。

之前的抠图方法建立了不同的alpha-color关系模型，但大多数方法所选择的模型则是基于上面所提及到的额外提供的条件和约束。

例如，[20]、[21]里假设关联颜色分布于RGB空间的一条直线上，并且以此为基础，一些线性alpha-color模型被演绎和使用。

在文献[20]中，样本数据对是被标记的前景背景像素对，并且，通过计算未被标记的像素与颜色数据对连线的距离来隐性指定一个线性的alpha-color模型。

在[12]中，样本点为局部边界区域的像素，并且一个线性的alpha-color模型是被显性的演绎的。

先前的抠图技术的共同问题是它们的假设不能被满意地执行，其失败的原因或许是其假设的alpha-color模型（例如在[20]和[15]里的线性模型）不足以准确代表对应的alpha-color关系。

在本文中，对于解决数字抠图问题将会有一些新的认知，即通过Bayesian算法建立alpha-color模型，此方法更适用于基于涂鸦的抠图方法。

基于全局的学习方法从一些附近被标记过的像素那学习到alpha-color模型，此方法更适用于基于三分图的抠图方法。

本文所研究的方法拥有众多优势。

第一，因为只需要一些简单的矩阵运算，此种方法是容易实现的。

第二，本文研究的方法产生的结果是极其准确的。

因为通过结合核技巧，它可以有效地处理非线性局部颜色分布问题，因此超越了许多以前的研究的收获，例如[15,20]里的相关研究。

正如通过理论分析和综合性实验所示，本文研究的方法优于许多最近的抠图方法。

第三，此种新的认知也将鼓舞更多使用其他学习方法和图像特征研究的深入开展。

2.2自动抠图程序设计目标和解决的问题

图像是人类获取和交换信息的主要来源，该图像是人类获取和交换信息的主要来源，因此，图像处理的应用涉及到人类生活和工作的各个方面，与扩大范围的人类活动，图像处理的应用也将继续扩大。

（1）生物医学工程

在生物医学工程应用数字图像处理是广泛和富有成效。

如CT技术，红血细胞，白血细胞，以确定技术，染色体分析，医疗诊断，以确定肿瘤细胞，增加光图像清晰度，超声波图像处理，心电图分析等被广泛使用的图像处理技术。

（2）通讯工程

通信工程多媒体通信发展的主要方向是声音，文字，图像和数据的组合。

其中，由于信息是非常大量的图像数据，诸如彩色电视信号的传输速率高达上述，图像通信成为通信工程领域的一个重大问题。

为了解决这个问题，在国内外也正在研究的图像压缩方法，这需要使用图像处理技术的传输。

（3）工业和工程领域

在工业领域，数字图像处理技术通常用于印刷电路板的缺陷检查，质量的汽车零部件装配线检测，物体的自动分拣等，为了人类无法达到能源资源勘探的区域中，如地球区域的中心，数字图像处理技术已经被移植到智能机器人系统中，通过捕获和分析的完整资源勘探任务的图像。

（四）公共安全领域

在公安领域，图像处理技术主要应用于指纹识别，面部识别，图像复原，模拟画像，交通监控，事故分析等领域。

此外，交通管理，车牌自动识别，自动检测等很多的速度向数字图像处理技术。

展开阅读全文