毕业设计论文基于贝叶斯判别的数字图像识别的实现与分析.docx
《毕业设计论文基于贝叶斯判别的数字图像识别的实现与分析.docx》由会员分享,可在线阅读,更多相关《毕业设计论文基于贝叶斯判别的数字图像识别的实现与分析.docx(41页珍藏版)》请在冰点文库上搜索。
毕业设计论文基于贝叶斯判别的数字图像识别的实现与分析
计算机科学与工程学院
综合设计报告
设计名称:
图像处理与机器视觉综合设计
设计题目:
基于贝叶斯判别的数字图像识别的实现与分析
学生学号:
专业班级:
学生姓名:
学生成绩:
指导教师(职称):
课题工作时间:
2015.5.10至2015.5.26
说明:
1、报告中的第一、二、三项由指导教师在综合设计开始前填写并发给每个学生;四、五两项(中英文摘要)由学生在完成综合设计后填写。
2、学生成绩由指导教师根据学生的设计情况给出各项分值及总评成绩。
3、指导教师评语一栏由指导教师就学生在整个设计期间的平时表现、设计完成情况、报告的质量及答辩情况,给出客观、全面的评价。
4、所有学生必须参加综合设计的答辩环节,凡不参加答辩者,其成绩一律按不及格处理。
答辩小组成员应由2人及以上教师组成。
5、报告正文字数一般应不少于5000字,也可由指导教师根据本门综合设计的情况另行规定。
6、平时表现成绩低于6分的学生,其综合设计成绩按不及格处理。
7、此表格式为武汉工程大学计算机科学与工程学院提供的基本格式(适用于学院各类综合设计),各教研室可根据本门综合设计的特点及内容做适当的调整,并上报学院批准。
成绩评定表
学生姓名:
学号:
班级:
类别
合计
分值
各项分值
评分标准
实际得分
合计得分
备注
平时表现
10
10
按时参加综合设计,无旷课、迟到、早退、违反实验室纪律等情况。
完成情况
30
20
按设计任务书的要求完成了全部任务,能完整演示其设计内容,符合要求。
10
能对其设计内容进行详细、完整的介绍,并能就指导教师提出的问题进行正确的回答。
报告质量
35
10
报告文字通顺,内容翔实,论述充分、完整,立论正确,结构严谨合理;报告字数符合相关要求,工整规范,整齐划一。
5
课题背景介绍清楚,综述分析充分。
5
设计方案合理、可行,论证严谨,逻辑性强,具有说服力。
5
符号统一;图表完备、符合规范要求。
5
能对整个设计过程进行全面的总结,得出有价值的结论或结果。
5
参考文献数量在3篇以上,格式符合要求,在正文中正确引用。
答辩情况
25
10
在规定时间内能就所设计的内容进行阐述,言简意明,重点突出,论点正确,条理清晰。
15
在规定时间内能准确、完整、流利地回答教师所提出的问题。
总评成绩:
分
补充说明:
指导教师:
(签字)
日期:
2011年12月6日
答辩记录表
学生姓名:
学号:
班级:
答辩地点:
答辩内容记录:
答辩成绩
合计
分值
各项分值
评分标准
实际得分
合计得分
备注
25
10
在规定时间内能就所设计的内容进行阐述,言简意明,重点突出,论点正确,条理清晰。
15
在规定时间内能准确、完整、流利地回答教师所提出的问题。
答辩小组成员(签字):
2015年5月26日
指导教师评语
指导教师:
(签字)
日期:
年月日
一、综合设计目的、条件、任务和内容要求:
目的:
本综合设计是实践教学环节中的重要项目,在于检验学生对智能科学与技术专业知识的掌握程度,提高学生综合使用所学知识的开发有效率的智能系统的能力。
条件:
PC机,VC++6开发环境,Matlab开发环境.
内容要求:
总体要求:
数字识别是模式识别中的一个重要分支,在多个领域中有着非常广泛的应用,数字的识别有多种方法,本设计主要目的是要求学生使用贝叶斯判别完成对数字的识别,建立对随机模式分类方法的初步认识,并重点研究贝叶斯分类方法在数字识别领域中的具体应用.
设计报告的内容要求:
1、第一章应包含以下内容:
有关数字识别各种算法的综述与比较,如,在某某章论述我们设计的…方法。
2、在第二章给出整体设计方案,应包含:
1)基于贝叶斯判别数字识别的算法伪代码。
2)设计中的数据结构及其含义;3)设计中的函数原型;4)各函数之间的交互关系;5)系统中的模块划分、这些模块间的关系;6)这个整体设计方案的优点与缺点。
3、在第三章给出详细设计方案,应包含:
1)基于贝叶斯判别数字识别的实现代码,并有合理的注释。
2)数据结构的具体实现方法及采用该方法的原因;3)设计方案中主要函数的实现方法及采用该方法的原因;4)函数之间交互关系的实现方法及采用该方法的原因;5)本详细设计方案的优点和缺点。
4、在第四章给出结果与分析。
应包含:
基于贝叶斯判别数字识别算法对给出数字图像识别的正确率及运算效率。
5、第五章对本次设计过程进行总结,应包含:
1)对基于贝叶斯判别数字识别设计内容的理解;2)对完成设计任务中难点的处理过程与体会;3)对智能系统效率提升方法的理解。
4)其他的体会与经验。
6、中英文摘要和报告内容语言通畅、逻辑结构清晰,不含语法错误,报告文字应符合“成绩评定表中”对设计报告文字质量的基本要求。
指导教师签字:
年月日
二、进度安排:
第11-13周完成设计任务,第13周的周二进行答辩。
具体如下:
11周完成理论认知和算法设计阶段,12周完成贝叶斯判别算法,13周联机调试完成最终的综合设计任务。
三、应收集资料及主要参考文献:
应收集的资料:
贝叶斯判别的基本思想、主要概念贝叶斯判别的发展过程;贝叶斯判别及其求解算法的国内外研究现状(包括理论研究和应用项目)。
主要参考文献:
[1]王沫然编著.Matlab与科学计算(第2版)[M].北京:
电子工业出版社,2003
[2]李金宗编著.模式识别[M].北京:
高等教育出版社,1994..
[3]冈萨雷斯编著.数字图像处理(第2版)[M].北京:
电子工业出版社,2003.
四、综合设计(课程设计)摘要(中文):
数字识别就是通过计算机用数学技术方法来研究模式的自动处理和识别。
随着计算机技术的发展,人类对模式识别技术提出了更高的要求。
特别是对于大量己有的印刷资料和手稿,计算机自动识别输入己成为必须研究的课题,所以数字识别在文献检索、办公自动化、邮政系统、银行票据处理等方面有着广阔的应用前景。
关键词:
自动;模式识别;应用前景
五、综合设计(课程设计)Abstract(英文):
Thedigitalrecognitionresearcheshowtotreatwithandrecognizepatternautomaticallythroughcomputerwithmatharithmetic.Alongwiththedevelopmentofcomputertechnology,humanneedmoreadvanceddigitalrecognitiontechnology.Especiallyforlargenumbersofprinteddataandmanuscript,theautomaticrecognitionandinputofChinesecharactersbecomesastringenttask,thereforethedigitalrecognitionwillhaveabroadapplicationprospectonliteratureretrieval,officeautomation,postalservicesystem,bankbillprocessing.
Keywords:
automatically;digitalrecognition;applicationprospect
摘要
数字识别就是通过计算机用数学技术方法来研究模式的自动处理和识别。
随着计算机技术的发展,人类对模式识别技术提出了更高的要求。
特别是对于大量己有的印刷资料和手稿,计算机自动识别输入己成为必须研究的课题,所以数字识别在文献检索、办公自动化、邮政系统、银行票据处理等方面有着广阔的应用前景。
关键词:
自动;模式识别;应用前景
Abstract
Thedigitalrecognitionresearcheshowtotreatwithandrecognizepatternautomaticallythroughcomputerwithmatharithmetic.Alongwiththedevelopmentofcomputertechnology,humanneedmoreadvanceddigitalrecognitiontechnology.Especiallyforlargenumbersofprinteddataandmanuscript,theautomaticrecognitionandinputofChinesecharactersbecomesastringenttask,thereforethedigitalrecognitionwillhaveabroadapplicationprospectonliteratureretrieval,officeautomation,postalservicesystem,bankbillprocessing.
Keywords:
automatically;digitalrecognition;applicationprospect
第一章绪论
1.1课题研究的意义
手写体数字识别的研究有很大的实用价值,例如在邮政编码、税务报表、统计报表财务报表、银行票据、海关等需要处理大量字符信息录入的场合,在很大程度上要依赖数据信息的输入。
随着人们生活水平的提高,经济活动的发展,通信联系的需求使信函的互换量大幅度增加,我国函件业务量也在不断增长,预计到2010年,一些大城市的中心邮局每天处理量将高达几百万件,业务量的急剧上升使得邮件的分拣自动化成为大势所趋。
在邮件的自动分拣中,手写数字识别(OCR)往往与光学条码识别(OBR---OpticalBarReading),人工辅助识别等手段相结合,完成邮政编码的阅读。
目前使用量最大的OVCS分拣机的性能指标:
OCR拒分率30%,OCR分拣差错率1.1%。
如果能通过手写数字识别技术实现信息的自动录入,将会促进这一事业的进展。
手写体数字识别的研究不仅有很大的应用价值,而且有重要的理论价值,由于数字别的类别较小,有助于作深入分析及验证一些新的理论。
例如人工神经网络,相当一部分的ANN模型和算法都以手写数字识别作为具体的实验平台。
可以说,手写体数字识别的研究将有助于模式识别、机器理解、机器人技术的发展,对今后研究如何更好地进行人机交互,使计算机具有和人一样的能力有很大的理论价值。
1.2国内外究动态目前水平
手写体字符的识别在很早以前就开始了。
国外从20世纪70年代初研制成“光学字符别机(OCR)”,能够自动识别印刷体的英文文字及阿拉伯数字。
20世纪70年代中期出现了能识别手写数字的OCR。
在20世纪70年代末和80年代初又出现了能识别手写英文母的OCR。
日本于20世纪80年代初研制了印刷体汉字识别样机,这是最早的汉字OCR。
我国从20世纪70年代就开始进行了字符(英文字母和数字)识别的研究,20世纪80年代己进入实用阶段,主要用于邮政信函自动分检,人口普查和生产统计报表。
手写体数字识别是手写字符识别的一个重要分支,它又分为在线手写体识别和离线写体识别。
在线手写体识别通过记录文字图像抬笔、落笔、笔迹上各像素的空间位,以及各笔段之间的时间关系等信息,对这些信息进行处理,在处理过程中,系统以定的规则提取信息特征,再由识别模块将信息特征与识别库的特征进行比较、加以识别,最后转化为计算机所使用的文字代码。
在线手写体识别的一个重要的不足就是要求写入者必须在指定的设备上书写。
而离线手写体识别则是通过使用任何一种图像采集设备,如CCD、扫描仪、数码相机等将手写者已写好的文字作为图像输入到计算机中,然后由计算机去识别。
在过去的数十年中,研究者们提出了许许多多的识别方法。
按使用的特征不同,这方法主要可以分为三类:
基于结构特征的方法、基于统计特征的方法和人工神经网结构特征通常包括圆、端点、交叉点、笔划、轮廓等,对于一个复杂的模式,采用分解的方法将其划分为若干较简单的子模式乃至基元,通过对基元和子模式识别的综合建立在统计数学,特别是贝叶斯决策理论基础上,通过模式紧密性、距离和相似性度量等感念和假定,形成了统计决策方法的一系列结论。
人工神经网络具有学习和联想功能,在字符识别中主要采用基于BP算法的多层感知机及多层卷积神经网络;基于正规化方法构建的径向基函数网络;以及具有“拓扑保持”特性的自组织特征映射(包括学习矢量量化LvQ)等。
一般来说,各类特征各有优势。
例如,使用统计特征的分类器易于训练,而且对于使用统计特征的分类器,在给定训练集上能够得到相对较高识别率;而结构特征的主要优点之一是能描述字符的结构,在识别过程中能有效的结合几何和结构的知识,因此能够得到可靠性较高的识别结果。
神经网络具有自学习、容错性、分类能力强和并行处理等特点。
手写体识别目前的研究方向是:
特征提取问题,这个方面一是在现有基础上进行组合,另一个是引入新的特征技术;分类器研究,一是多分类器继集成,另一个方向是研究新的分类器。
、
1.3手写体数字识别简介
手写体数字识别是指利用电子计算机自动辨认手写体阿拉伯数字的一种技
术,它属于光学字符识别(OCR)的范畴·手写体数字识别又分为联机识别(on-line)和脱机识别(off-line)两种。
其中,最为困难的就是脱机手写字符的识别。
主要是因为脱机手写体识别过程无法获得字符书写时的一些动态信息。
然而,手写体数字识别技术的研究是非常有价值的,它具有广阔的应用前景。
手写体数字识别系统性能的评价方法
作为一个识别系统,我们最终要用某些参数来评价其性能的高低,手写数字识别也不例外。
评价的指标除了借用一般文字识别里的通常做法外,还要根据数字识别的特点进行修改和补充。
对一个手写数字识别系统,可以用两方面的指标表征系统的性能:
识别率A正确识别样本数/全部样本数*100%(1.1)
误识率S误识样本/全部样本数*100%(1.2)
两者的关系A+S=100%(1.3)
数字识别的应用中,人们往往很关心的一个指标是“识别精度”,即在所有识
别的字符中,正确识别的比例,表示如下:
:
识别精度:
P=A/(A+S)*100%(1.4)
一个理想的系统应是S尽量小,然而A尽可能大。
1.4识别的技术难点
手写体数字识别的研究是一项具有相当难度的工作,此项工作的难点主要在
于以下几方面:
1.阿拉伯数字的字形信息量很小,不同数字写法字形相差不大,使得准确区分某些数字相当困难。
2.要识别的数字虽然只有十种,而且笔划简单,但同一数字写法千差万别,不同的人写法也不尽相同,很难完全做到兼顾各种写法的极高识别率的通用性数字识别系统。
3.在实际应用中,对数字的单字识别正确率的要求要比文字要苛刻得多。
这是因为文字有上下文关系,但数字没有上下文关系,每个单字的识别都至关重要,
而且数字识别经常涉及的财会、金融领域,其严格性更是不言而喻的。
因此,
用户的要求不是单纯的高正确率,更重要的是极低的误识率。
4.大批量数据处理对系统速度又有相当的要求,许多理论上很完美但速度过低的方法也是行不通的。
综上所述,研究高性能的手写数字识别算法是一个有相当的挑战性的课题,同样的把高效的手写体数字识别算法应用于实际工作之中也是具有重要意义的。
第二章贝叶斯方法应用于手写体数字识别
2.1贝叶斯由来
贝叶斯(R.T.Bayes,1702—1761)学派奠基性的工作,是英国学者贝叶斯的一篇具有哲学性的论文——《关于几率性问题求解的讨论》。
著名数学家拉普拉斯利用贝叶斯的方法导出了重要的“相继律”,从而引起人们对贝叶斯的方法和理论的重视。
尽管利用贝叶斯方法可以推导出很多有意义的结果,但是,由于理论上和实际应用中存在很多问题,在19世纪,贝叶斯理论并未被普遍接受。
进入20世纪,意大利的菲纳特、英国的杰弗莱、古特、萨凡奇、林德莱对贝叶斯学派的形成做出了重要贡献,1958年英国历史最长的统计杂志Biometrika重新全文刊载了贝叶斯的论文。
20世纪50年代,罗宾斯(H.Robbins)将经典统计学派的方法和贝叶斯学派的方法进行融合,提出了经验贝叶斯方法(EB方法)。
如今,贝叶斯学派的思想方法已渗透到了许多学科。
贝叶斯理论在人工智能、机器学习、数据挖掘等方面也有广泛应用。
20世纪80年代,贝叶斯网络被用于专家系统的知识表示,90年代可学习的贝叶斯网络被用于数据挖掘和机器学习。
涉及因果推理、不确定性知识表达、聚类分析等方面的贝叶斯方法的文章大量涌现。
并且出现了专门研究贝叶斯理论的组织和学术刊物ISBA。
贝叶斯分类是一种统计学分类方法,可以预测类成员关系的可能性,如给定样本属于一个特定类的概率。
目前,贝叶斯分类方法已在文本分类、字母识别、经济预测等领域获得了成功的应用。
贝叶斯方法正在以其独特的不确定性知识表达形式、丰富的概率表达能力、综合先验知识的增量学习等特性成为众多数据挖掘方法中最引人注目的焦点之一。
2.2贝叶斯公式
贝叶斯公式建立起先验概率和后验概率的联系。
先验概率是指根据历史资料或主观判断确定的各事件发生的概率,由于没能经过实验证实,属于检验前的概率,所以称为先验概率。
先验概率一般分为两类,一是客观先验概率,指利用历史资料计算得到的概率;二是主观先验概率,指在没有历史资料或历史资料不全的情况下,仅仅凭借主观经验判断得到的概率。
后验概率是指利用贝叶斯公式,结合调查等方式获取了新的附加信息,对先验概率进行修正后得到的更符合实际的概率。
1.先验概率
先验概率
针对M个事件出现的可能性而言,不考虑其他任何条件。
例如,由统计资料表明总药品数为N,其中正常的药品数位
,异常药品数位
,则:
(2.1)
我们称
及
为先验概率。
显然在一般情况下正常药品占比例大,即
。
仅按先验概率来决策,就会吧所有药品都划归为正常药品,并没有达到将正常药品与异常药品分开的目的。
这表明由先验概率所提供的信息太少。
2.贝叶斯公式也称为后验概率公式或逆概率公式,有几种不同的形式。
通常采用事件形式或随机变量形式表示。
2.1.事件形式
设A1,A2,…,An互不相容,并且有
(必然事件),则对于任一事件B,有
(i=1,2,…,n)(2.2)
2.2随机变量形式
设x和θ为两个随机变量,x是观测向量,θ是未知参数向量,其联合分布密度是p(x,θ),p(x|θ)是x对θ的条件密度,π(θ)是θ的先验分布密度,于是θ对x的条件密度p(θ|x)为
(2.3)
贝叶斯假设指出,在没有任何关于θ的信息时,可以认为θ的先验分布是均匀分布。
当然,确定先验分布的准则还包括杰弗莱准则、最大熵准则、共轭分布族等。
总之,贝叶斯方法的重点在于研究如何合理地使用先验信息。
2.3贝叶斯公式Bayes决策理论
在分类的时候难免出现错分类的情况,如何做出合理的判决就是Bayes决策理论所要讨论的问题,其中具有代表性的是最小错误概率的Bayes决策[3]
基于最小错误率的贝叶斯决策:
假定得到一个待识别量的特征X后,每个样品X有n个特征,即
通过样品库,计算先验概率
及类别条件概率密度函数
,得到呈现状态X时,该样品分属各类别的概率,显然这个概率值可以作为识别对象判属的依据,从后验概率分布图4—4可见。
在X值小时,药品被判为正常比较合理的,判断错误的可能性小。
基于最小错误概率的贝叶斯决策就是按后验概率的大小判别的。
这个判别又可以根据类别数目,写成不同的集中等价形式。
图(2.1)
1.两类问题
若两类样品属于
类中的一类,已知两类的先验概率分别为
,
。
两类的类条件概率密度为
.则任给一X。
判别X的类别。
由贝叶斯公式可知:
(2.4)
由全概率公式可知
(2.5)
其中M为类别。
对于两类问题
(2.6)
所以用后验概率来判别为
(2.7)
判别函数还有另外两种形式。
(1)似然比形式
(2.8)
其中上面公式中的
在统计学中称为似然比,而
称为似然比阀值。
(2)对数形式
(2.9)
上面三种判别函数是一致的,也可以用后验概率来表示判别函数。
2.多类问题
现在讨论多类问题的情况。
判别函数的一般形式如下图:
图(2.2)
若样本分为M类
,各类的先验概率分别为
,
,...
各类的类条件概率密度分别为
,
,...
就有M个判别函数。
在取得一个观察特征X之后,在特征X的条件下,看哪个类的概率最大,就应该把X归于概率最大的那个类。
因此对于任一模式X,可以通过比较各个判别函数来确定X的类别。
(2.10)
就是把X代入M个判别函数中,看哪个判别函数最大,就把X归于这一类。
判别函数的对数形式为:
(2.11)
由于先验概率通常是很容易求出来的,贝叶斯分类器的核心问题就是求出类条件概率密度
如果求出了条件概率,则后验概率就可以求出了,判别问题就可以解决了。
在大多数情况下,类条件密度可以采用多维变量的正态密度函数来模拟。
在工程上的许多问题中,统计数据往往满足正态分布规律,多维变量的正态密度函数为:
(2.12)
其中:
所以此时的正态分布的贝叶斯分类器判别函数为:
(2.13)
2.4贝叶斯应用于的手写体数字理论部分
2.4.1特征描述
在模式识别技术中,被观测的每个对象称为样品,例如本文中的每个手写数字可以作为一个样品,共写了10个数字,所以就有10个样品(X1,X2,X3,X4,X5,X6,X7,X8,X9,X10),一共有10个不同的类别。
对于一个样品来说,必须确定一些与识别有关的因素作为研究的根据,每一个因素称为一个特征。
模式就是样品所具有的特征描述。
模式的特征集由处于同一个特征空间的特征向量表示,特征向量的每个元素称为特征,该向量也因此称为特征向量。
一般用小写字母x,y,z来表示特征。
如果一个样品X有n个特征,则可把X看成一个n维列向量,该向量称为特征向量X,记作:
X=
=
T(2.14)
抽取图像特征的目的是为了进行分类,识别图像。
也就是把图像变成n维空间的一个向量,实际上就是看成n维空间中的一个点,这样有利于从几何上考虑问题,计算上比较方便。
如果一个对象的特征观察值为{x1,x2,…,xn},它可构成一个n维的特征向量值X,即X={x1,x2,…,xn}T,式中x1,x2,…,xn为特征向量X的各个分量。
在模式识别的过程中,要对许多具体对象进行测量,以获得许多观测值,其中有均值、方差、协方差与协方差矩阵。
1.均值
N个样品的均值可表示为:
(2.15)
其中
是第i个特征的平均值,
(2.16)