字符识别毕业设计Word文档格式.docx

上传人:b****1 文档编号:5758176 上传时间:2023-05-05 格式:DOCX 页数:73 大小:677.55KB
下载 相关 举报
字符识别毕业设计Word文档格式.docx_第1页
第1页 / 共73页
字符识别毕业设计Word文档格式.docx_第2页
第2页 / 共73页
字符识别毕业设计Word文档格式.docx_第3页
第3页 / 共73页
字符识别毕业设计Word文档格式.docx_第4页
第4页 / 共73页
字符识别毕业设计Word文档格式.docx_第5页
第5页 / 共73页
字符识别毕业设计Word文档格式.docx_第6页
第6页 / 共73页
字符识别毕业设计Word文档格式.docx_第7页
第7页 / 共73页
字符识别毕业设计Word文档格式.docx_第8页
第8页 / 共73页
字符识别毕业设计Word文档格式.docx_第9页
第9页 / 共73页
字符识别毕业设计Word文档格式.docx_第10页
第10页 / 共73页
字符识别毕业设计Word文档格式.docx_第11页
第11页 / 共73页
字符识别毕业设计Word文档格式.docx_第12页
第12页 / 共73页
字符识别毕业设计Word文档格式.docx_第13页
第13页 / 共73页
字符识别毕业设计Word文档格式.docx_第14页
第14页 / 共73页
字符识别毕业设计Word文档格式.docx_第15页
第15页 / 共73页
字符识别毕业设计Word文档格式.docx_第16页
第16页 / 共73页
字符识别毕业设计Word文档格式.docx_第17页
第17页 / 共73页
字符识别毕业设计Word文档格式.docx_第18页
第18页 / 共73页
字符识别毕业设计Word文档格式.docx_第19页
第19页 / 共73页
字符识别毕业设计Word文档格式.docx_第20页
第20页 / 共73页
亲,该文档总共73页,到这儿已超出免费预览范围,如果喜欢就下载吧!
下载资源
资源描述

字符识别毕业设计Word文档格式.docx

《字符识别毕业设计Word文档格式.docx》由会员分享,可在线阅读,更多相关《字符识别毕业设计Word文档格式.docx(73页珍藏版)》请在冰点文库上搜索。

字符识别毕业设计Word文档格式.docx

1.2.2字符识别系统用到的方法3

1.2.3字符识别原理4

1.3国内外研究现状和发展趋势5

1.4基于神经网络的字符识别系统6

1.4.1系统简介6

1.4.2系统的基本技术要求7

1.4.3系统的软硬件平台7

第二章字符识别系统中的关键技术8

2.1特征提取8

2.1.1基本概念8

2.1.2区域内部的数字特征10

2.1.3基于边界的形状特征13

2.2神经网络18

2.2.1人工神经元18

2.2.2人工神经网络构成22

2.2.3人工神经网络的学习规则23

2.2.4BP神经网络24

第三章系统的实现31

3.1系统流程图31

3.2程序实现31

3.3程序的总体框架36

第四章系统使用说明、测试及注意事项37

4.1系统使用说明37

4.2系统测试39

4.2.1数字识别39

4.2.2字母识别40

4.2.3汉字识别40

4.2.4车牌识别41

4.3注意事项41

第五章结论和展望42

致谢43

参考文献44

外文原文与译文46

●外文原文46

●译文57

第一章概述

1.1基本概念

随着21世纪经济全球化和信息时代的到来,计算机技术、通信技术和计算机网络技术迅猛发展,自动化的信息处理能力和水平不断提高,并在人们社会活动和生活的各个领域得到广泛应用。

高速度、高效率的生活节奏,使汽车普及成为必然趋势,交通管理自动化越来越成为亟待解决的问题。

在这种情况下,作为信息来源的自动检测、图像识别技术越来越受到人们的重视。

目前指纹识别、视网膜识别技术已经到了实用阶段;

声音识别技术发展也相当快,而对汽车牌照等相关信息的自动采集和管理对于交通车辆管理、园区车辆管理、停车场管理、交警稽查等方面有着十分重要的意义,成为信息处理技术的一项重要研究课题。

车辆牌照识别(LicensePlateRecognition,LPR)技术作为交通管理自动化的重要手段,其任务是分析、处理汽车监控图像,自动识别汽车牌号,并进行相关智能化数据库管理。

LPR系统可以广泛应用于高速公路电子收费站、出入控制、公路流量监控、失窃车辆查询、停车场车辆管理、公路稽查、监测黑牌机动车、监控违章车辆的电子警察等需要车牌认证的重要场合,尤其在高速公路收费系统中,实现不停车收费技术可提高公路系统的运行效率,LPR系统更具有不可替代的作用,因而对LPR车牌识别技术的研究和应用系统开发具有重要的现实意义。

LPR系统中的两个关键子系统是车牌定位系统和车牌字符分割识别系统。

关于车牌识别技术及定位系统研究,国内外学者已经作了大量工作,但实际效果并不理想,对辅助光源要求高,很难有效解决复杂背景下多车牌识别的技术难题,如:

车牌图像的倾斜、车牌表面污秽或磨损、光线干扰等都会影响定位的准确性。

传统车牌识别一般仅支持单一车辆,背景比较简单。

而当今许多实际应用场合,如在繁忙交通路口临时对欠税费报废挂失等车辆的稽查,则监视区域比较复杂,现有识别方法无法直接应用,一般同时出现多辆汽车,背景有广告牌、树木、建筑物、斑马线以及各种背景文字等。

车牌定位与识别方法,总体来说是图像处理技术与车牌本身特点的有机结合,当然也包括小波分析、神经网络、数学形态学、模糊理论等数学知识的有效运用。

一个车牌定位与识别系统基本包括:

图像预处理、车牌搜索、车牌定位、车牌校正、车牌字符分割和字符识别结果的输出。

本系统主要是在对汽车图像进行细致分析,从而研究车牌定位与识别的算法问题。

1.2字符识别简介

1.2.1字符识别发展概况

字符识别发展可分为三个阶段:

第一个阶段为初级阶段,在这一阶段中,技术上是应用一维图像的处理方法完成二维图像的识别任务。

这样萌芽了一个基本思想—抽取特征向量的构造和它的相关函数。

现在此法仍不失为一种重要的匹配方法。

第二个阶段为基础理论研究阶段。

提出了表示边界的链码法,用于结构分析的细化思想,以及一些离散图形上的拓扑性研究,形成了不仅能抽取局部特征,而且能抽取大范围的凹凸区域、连通性、孔等特征的算法,完成了作为基础理论核心的“特征抽取理论”,及所谓的K-L展开法工作。

第三个阶段为发展阶段。

这一阶段的研究工作是技术和实际相结合,针对实际系统的要求和设备可能提供的条件,提出了更为复杂的技术。

但就多种方法分类来说为二大方法:

相关法和构造解析法。

在这两类方法的基础上,已研究出了不同类各具特色的实用系统。

字符识别系统根据输入设备的不同有如下分类[19],如图1.1所示:

 

图1.1字符识别分类

目前开展比较多,并进入实用阶段的是光学字符识别系统(OCR系统)。

日本虽说起步不是最早,但因投入了大量的人力和物力,目前处于世界领先地位。

七五年日本拥有650台光学字符识别机,进入了实用阶段。

到一九七八年,能阅读英文字母、数字、片假名和平假名等118种OCRT0300上市。

之后,其研究方向转向了汉字识别。

我国是从七十年代开始字符研究的。

一九七八年,中科院自动化研究所等合作研制出了“倍函自动化分检机”,可识别0~9个数字;

一九八七年清华大学研制的汉字识别系统通过了技术鉴定,可识别国家二级汉字库6000多字,识别率可达99%,速度为1字/4秒;

一九八七年十二月,西安交大人工智能和机器人研究所研制的汉字识别系统也通过了技术鉴定,同样可识别汉字6000多,识别速度可达1字/1秒,识别率达98%以上,处于国内领先地位。

这都为字符识别的实际应用提供了广阔的前景。

1.2.2字符识别系统用到的方法

字符识别系统用到的方法很多。

下面以表格的形式,其用到的方法作一简单的介绍和比较。

表1.1几种识别方法的比较

统计决策

句法结构

模糊判决

逻辑推理

神经网络

主要理论支柱

概率论

数理统计

形式语言

自动机技术

模糊数学

演绎逻辑

布尔代数

神经生理学

模式描述方法

特征向量

符号串、树、图

模糊集合

字符串表示的事实

以不同活跃度表示的输入结点集

模式类判定

是一个聚合类。

用条件概率分布P(X|wi)表示,m类就有m个分布,然后判定未知模式属于哪一个分布。

是一种语言。

用一个文法表示一类,m类就有m个文法,然后判定未知模式遵循哪一个文法。

是一种集合运算。

用隶属度将模糊集合划分为若干子集,m类就有m个子集,然后根据择近原则分类。

是一种布尔演算。

从事实出发运用一系列规则,推理得到不同结果,m类就有m个结果。

是一个非线性动态系统。

通过对样本的学习建立起记忆,然后将未知模式判决为其最接近的记忆。

主要方法

几何分类:

线性分类、非线性分类

统计分类:

Bayes决策

无教师的分类:

聚类分析

CYK剖析算法

Early算法

转移图法

隶属度函数的设计:

模糊设计法二元对比排序法

推理法

模糊集运算规则

模糊矩阵

产生式推理

语义网推理

框架推理

BP模型

HOP模型

高阶网

主要优缺点

优点:

比较成熟,能考虑干扰、噪声等影响,识别模式基元能力强。

缺点:

对结构复杂的模式抽取特征困难。

不能反映模式的结构特征,难以描述模式的性质,难以从整体考虑识别问题。

识别方便,可从简单的基元开始,由繁至简。

能反映模式的结构特性,能描述模式的性质,对图像的畸变的抗干扰能力较强。

当存在干扰及噪声时,抽取基元困难,且易失误。

由于用隶属度函数作为样品与模板间相似度的度量,故往往能反映它们整体的与主要的特性,从而允许样品有相当的干扰与畸变。

准确合理的隶属度往往难以建立,故限制了它的应用。

已建立了关于知识表示及组织,目标搜索及匹配的完整体系。

对需同过众多规则的推理达到目标确认的问题,有很好的效果。

当样品有缺损,背景不清晰,规则不明确甚至有歧义时,效果不好。

可处理一些环境信息十分复杂,背景知识不清楚,推理规则不明确的问题。

允许样品有较大的缺损和畸变。

模型在不断丰富与完善中,目前能识别的程式类还不够多。

本系统中主要用到的是基于神经网络的字符识别方法。

1.2.3字符识别原理

近年来,字符识别逐渐成为模式识别领域内的一个重要分支。

和其他模式识别的应用一样,字符识别的基本思想也是匹配判别。

抽取代表未知字符模式本质的表达形式(如各种特征)和预先存储在机器中的标准字符模式表达形式的集合(称为字典)逐一匹配,用一定的准则进行判别,在机器存储的标准字符模式表达形式的集合中,找出最接近输入字符模式的表达形式,该表达形式对应的字就是识别结果。

字符识别的原理框图如图1.2。

图1.2字符识别的原理框图

字符识别的原理如上图所示。

文字经光电扫描,模数转换为带灰度值的数字信号送至预处理环节。

预处理的内容和要求取决于识别方法,一般包括行字切分,二值化,规范化等。

经过预处理,字符模式成为规范化的二值数字点阵信息。

对该二值化汉字点阵,抽取一定的表达形式后,与存储在字典中已知的标准字符表达形式匹配判别,就可识别出输入的未知字符。

图1.3中点划线以下是识别系统的学习部分。

学习是根据多个未知字样抽取出模式表达形式,自动构造或修改充实字典,不断提高系统识别率。

字符的模式表达形式和相应的字典形式有多种,每种形式又可以选择不同的特征,每种特征又有不同的抽取方法。

这些就使得判别方法和准则以及所用的数学工具不同,形成了种类繁多,形式各异的字符识别方法。

1.3国内外研究现状和发展趋势

车牌识别技术自1988年以来,人们就对它进行了广泛的研究,目前国内外已经有众多的算法,一些实用的LPR技术也开始用于车流监控、出入控制、电子收费、移动稽查等场合。

然而,无论是LPR算法还是LPR产品几乎都存在一定的局限性,都需要适应新的要求而不断完善,如现有系统几乎都无法有效解决复杂背景下的多车牌图像分割定位与有效识别的技术障碍,另外也很难适应全天候复杂环境及高速度的要求。

车牌字符识别实际上是依附在车牌上的印刷体文字的识别,能否正确识别不仅是文字识别技术的问题,还是考虑其载体——车牌区域的影响。

车牌字符识别技术是文字识别技术与车牌图像自身因素协调兼顾的综合性技术。

由于摄像机的性能、车牌的整洁度、光照条件、拍摄时的倾斜角度及车辆运动等因素的影响使牌照中的字符可能出现比较严重的模糊、歪斜、缺损或污迹干扰,这些都给字符识别带来了难度。

尽管如此,我国依然有大量的学者从事车牌字符识别研究,文献给出了基于神经网络的车牌识别方法,对于解析度较高和图像比较清晰的车牌,这些方法能有效识别车牌中的字符,但对于较低解析度和较为模糊的车牌无能为力,因为这些方法只有在车牌中的每个字符被独立分割出来的前提下才能完成识别工作。

而独立分割车牌取得字符,对较低解析度和较为模糊的车牌来说是非常困难的。

车牌字符识别的研究在技术上已经取得了一定突破,然而离复杂多变的实际应用要求还有一定差距,许多新方法仅停留在理论和文章上或者限定在比较狭窄的约束范围内,并不能以产品的形式大范围投入使用。

因而车牌字符识别的实用化研究仍然有很长的路要走。

目前的车牌识别方法主要是针对车辆自动缓停收费、停车场管理等场合,所监视的区域一般只有单一车辆,背景也比较简单。

而如今的许多实际应用场合,监视区域比较复杂,现有的方法无法直接应用。

比如在移动交警稽查、高速公路的监视与监控、城市交通要道的监视与监控,所监控的区域一般会同时出现多辆汽车,背景也比较复杂,有广告牌、树木、建筑物、斑马线以及各种背景文字等。

所以本课题针对这种情况创新性的提出了一种复杂背景下多车牌定位分割与识别方法,并考虑了彩色分割与ColorLP算法,这也是当前车牌图像识别的发展趋势。

当然,车牌识别系统的具体应用发展也很迅猛,从原来的停车静止拍摄场景应用,如收费站、停车场等,发展到移动公路车辆稽查、违章自动报警、超载闯红灯等实时监控场合应用,增加神经网络自适应识别学习训练功能,对于系统响应的速度、网络化、智能化、识别成功率等实用化要求也越来越高。

随着上述核心技术的研究发展,应用领域和功能等也获得大幅提高。

1.4基于神经网络的字符识别系统

1.4.1系统简介

该系统是为了辨认识别图像中的字符而设计的,它通过对图片的一系列处理,最后识别得出图片中显示的字符。

系统即可以单独使用,也可以把它作为一个识别系统的软件核心应用到车牌识别系统中去。

1.4.2系统的基本技术要求

下面是系统具体要达到的基本技术要求

1.输入图片中可以含有多个字符;

2.字符的识别准确率大于90%;

3.每张图片的处理时间(识别时间)不能大于1S;

4.对图片噪声具有较强的适应性;

5.系统要能长时间无故障的运行;

6.系统的操作要求简单;

1.4.3系统的软硬件平台

(1).系统的软件平台

因为系统运行的过程当中,主要进行的都是图象处理,在这个过程当中要进行大量的数据处理,所以处理器和内存要求比较高,CUP要求主频在600HZ及其以上,内存在128MB及其以上。

(2).系统的软件平台

系统可以运行于Windows98,Windows2000,WindowsXP或者Windows2003操作系统下。

程序调试时,需要使用MicrosoftVisualC++6.0(SP6)。

第二章字符识别系统中的关键技术

2.1特征提取

图像处理的高级阶段是数字图像分析(也对以称为图像理解),主要使用计算机系统,从图像中提取有用的数据或信息,生成非图像的描述或表示,如数值、符号等,即抽取图像特征,从而识别视觉图像。

为了能让计算机系统认识图像,人们首先必须寻找出算法,分析图像的特征,然后将其特征用数学的办法表示出来并教会计算机也能读懂这些特征。

这样,计算机才能具有认识或者识别图像的本领,称图像模式识别,也叫图像识别。

要使计算机具有识别的本领,首先要得到图像的各种特征,即特征提取。

图像特征是指图像的原始特性或属性。

每一幅图像都有其本身的特征,其中有些是视觉直接感受到的自然特征,如亮度、边缘的轮廓、纹理或色彩等;

有些是需要通过变换或测量才能得到的人为特征,如谱、直方图等。

图像特征提取的结果给出了某一具体的图像中与其他图像相区别的特征。

例如,描述物体表面灰度变化的纹理特征,描述物体外形的形状特征等。

2.1.1特征提取基本概念

图像识别是根据一定的图像特征进行的,显然这些特征的选择很重要,它强烈地影响到图像识别分类器的设计、性能及其识别结果的准确性。

特征选择错误,分类就个能分得准确,甚至无法分类。

因此,特征选择是图像识别中的一个关键问题。

由于实际问题中常常不容易找到那些最重要的特征,或者某些图像特征还会随着环境的变化而发生变化,这就使得特征的选择和提取复杂化。

特征选择和提取的基本任务是如何从众多特征中找出那些最有效的特征。

在样本数量不是很多的情况下,用很多特征进行分类器设计,从计算复杂程度和分类器性能来看都是不适宜的。

因此研究如何把高维特征宁间压缩到低维特征空间以便有效地识别图像成为一个重要的课题,例如手写体文字识别的特征选择的研究已将近半个世纪,但依然是一个研究的难点和热点。

为了进行识别,需要把图像从测量空间变换到维数大大减少的特征空间,被识别的图像在这个特征空中就是由一个特征向量来表示。

为了方便起见,对几个经常用道的有关名词作一些说明。

1.特征形成

根据待识别的图像,通过计算机产生一维原始特征,称之为特征形成。

2.特征提取

原始特征的数量很大,或者说图像本身处于一个高维空间中,通过映射(或变换)的方法可以用低维空间来表示样本,这个过程叫做特征提取。

映射后的特征是原始特征某种组合。

所谓特征提取在广义上说是一种变换。

3.特征提取

从一组特征中挑选出一些最有效的特征以达到降低特征空间维数的目的,这个过程叫做特征选择。

目前几乎没有解析的方法能够知道特征的选择,很多情况下,凭直觉的引导可以列出一些可能的特征表,然后用特征排序的方法计算不同特征的识别效率。

利用其结果对表进行删减,从而选出若干最好的特征。

良好的特征应具备以下4个特点:

(1)可区别性。

对属于不同类的图像来说,他们的特征应具备明显的差异。

(2)可靠性。

对于不同类型的图像,特征值应该比较接近。

例如,杂志封面的文字图像的分割中,颜色是一个不好的特征。

因为,封面文字的颜色可以是各种色彩,尽管它们都属于文字图像。

(3)独立性好。

所选择的特征之间彼此不相关。

例如细胞的曲径和细胞的面积高度相关,因为面积大致与直径的平方成正比。

这两个特征基本上反映的是相同的属性,即细胞的大小。

但是,有时相关性很高的特征组合起来可以减少噪声干扰,它们一般不作为单独的特征使用。

(4)数量少。

图像识别系统的复杂程度随着系统维数(特征的个数)迅速增长。

尤为重要的是用来训练分类器和测试结果的图像样本随特征数量呈指数关系增长。

而且,增加带噪声的特征或与现存特征相关性高的特征实际上会使识别系统的性能下降。

实际应用中特征提取过程往往包括:

先测试一组自觉上合理的特征,然后减少成数目合适的满意集。

通常符合上述要求的理想特征是很少甚至没有的。

对计算机图像识别系统而言,物体的形状是一个赖以识别的重要特征。

一个图像形状和结构特征有两种形式,一种是数字特征主要包括几何属性(如长短、面积、距离和凹凸特性等),统计属性(如黑色像素点在垂直方向的投影)和拓扑属性(如连通、欧拉数);

另一种是由字符串和图等所表示的句法语言。

它可以刻画某一图像不同部分之间的相互关系(如文字识别中的笔划关系),也可以描述不同目标间的关系。

由于感兴趣的是图像的形状和结构特征,所以其灰度信息往往可以忽略,只要能将它与其他目标或背景区分开来即可。

常用的一种技术是二值化图像,即将感兴趣的部分(区域或边界)标以最大灰度级,把背景(也包括其他任何不感兴趣的部分)标以最小灰度级,通常为零。

二值化图像在形状和结构分析中占有很重要的地位,本节讨论的算法如没有特别说明都是基于二值化图像的。

2.1.2区域内部的数字特征

1.矩

给定二维连续函数f(x,y),下式定义了其pq阶矩:

(2.1)

矩在文字识别中作为有效统计特征而被广泛运用,它之所以能被用来表征一幅二维图像是基于下面的帕普利斯(Papoulis)惟一性定理:

如果f(x,y)是分段连续的,只在xy平面的有限部分中有非零值,则所有各阶矩皆存在,并且矩序列{Mpq}此才惟一地被f(x,y)所确定,反之{Mpq}也唯一地确正f(x,y)。

对一幅二值图像{f(x,y):

i,j=0,1,2…N-1}来说,上述条件无疑可被满足。

因此,可定义其pq阶矩为:

Mpq=∑∑f(i,j)ipjq(2.2)

不同p、q值下可以得到不同的图像矩Mpq。

,常用的区域矩特征有以下几个:

(1)质心

(2.3)

(2)中心矩

(2.4)

(3)Hu矩组

Hu矩组是{mpq}个矩的函数,它满足平移、旋转不变性,因而可被广泛地应用于区域形状识别中。

M1=m20+m02

M2=(m20-m02)2+4m112

M3=(m30-3m12)2+(3m21+m03)2

M4=(m30+m12)2+(m21+m03)2

M5=(m30-m12)(m30+m12)(m30+m12)2-3(m21+m03)2+(3m12-m03)

(m21+m03)3(m30+m12)2-(m

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 医药卫生 > 基础医学

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2