模式识别概论.docx

上传人:b****1 文档编号:10398525 上传时间:2023-05-25 格式:DOCX 页数:10 大小:1.85MB
下载 相关 举报
模式识别概论.docx_第1页
第1页 / 共10页
模式识别概论.docx_第2页
第2页 / 共10页
模式识别概论.docx_第3页
第3页 / 共10页
模式识别概论.docx_第4页
第4页 / 共10页
模式识别概论.docx_第5页
第5页 / 共10页
模式识别概论.docx_第6页
第6页 / 共10页
模式识别概论.docx_第7页
第7页 / 共10页
模式识别概论.docx_第8页
第8页 / 共10页
模式识别概论.docx_第9页
第9页 / 共10页
模式识别概论.docx_第10页
第10页 / 共10页
亲,该文档总共10页,全部预览完了,如果喜欢就下载吧!
下载资源
资源描述

模式识别概论.docx

《模式识别概论.docx》由会员分享,可在线阅读,更多相关《模式识别概论.docx(10页珍藏版)》请在冰点文库上搜索。

模式识别概论.docx

模式识别概论

模式识别概论

 

 

学院:

通信工程学院

专业:

电子与通信工程

学号:

*********3

姓名:

肖峰

课程:

模式识别

主讲:

戚玉涛博士

二○一○年七月七日

模式识别(PatternRecognition)是人类的一项基本智能,在日常生活中,人们经常在进行“模式识别”。

随着20世纪40年代计算机的出现以及50年代人工智能的兴起,人们当然也希望能用计算机来代替或扩展人类的部分脑力劳动,计算机模式识别在20世纪60年代初迅速发展并成为一门新学科。

 

一、模式识别简介

1.模式识别的定义

模式识别是指对表征事物或现象的各种形式的(数值的、文字的和逻辑关系的)信息进行处理和分析,以对事物或现象进行描述、辨认、分类和解释的过程,是信息科学和人工智能的重要组成部分。

模式识别又常称作模式分类,从处理问题的性质和解决问题的方法等角度,模式识别分为有监督的分类(SupervisedClassification)和无监督的分类(UnsupervisedClassification)两种。

二者的主要差别在于,各实验样本所属的类别是否预先已知。

一般说来,有监督的分类往往需要提供大量已知类别的样本,但在实际问题中,这是存在一定困难的,因此研究无监督的分类就变得十分有必要了。

 

模式还可分成抽象的和具体的两种形式。

前者如意识、思想、议论等,属于概念识别研究的范畴,是人工智能的另一研究分支。

我们所指的模式识别主要是对语音波形、地震波、心电图、脑电图、图片、照片、文字、符号、生物传感器等对象的具体模式进行辨识和分类。

 

2.模式识别的相关研究

模式识别研究主要集中在两方面,一是研究生物体(包括人)是如何感知对象的,属于认识科学的范畴,二是在给定的任务下,如何用计算机实现模式识别的理论和方法。

前者是生理学家、心理学家、生物学家和神经生理学家的研究内容,后者通过数学家、信息学专家和计算机科学工作者近几十年来的努力,已经取得了系统的研究成果。

 

 应用计算机对一组事件或过程进行辨识和分类,所识别的事件或过程可以是文字、声音、图像等具体对象,也可以是状态、程度等抽象对象。

这些对象与数字形式的信息相区别,称为模式信息。

模式识别所分类的类别数目由特定的识别问题决定。

有时,开始时无法得知实际的类别数,需要识别系统反复观测被识别对象以后确定。

模式识别与统计学、心理学、语言学、计算机科学、生物学、控制论等都有关系。

它与人工智能、图像处理的研究有交叉关系。

例如自适应或自组织的模式识别系统包含了人工智能的学习机制;人工智能研究的景物理解、自然语言理解也包含模式识别问题。

又如模式识别中的预处理和特征抽取环节应用图像处理的技术;图像处理中的图像分析也应用模式识别的技术。

二、模式识别的过程

模式识别的处理过程主要五个部分组成:

数据获取、预处理、特征提取与选择、分类器设计和分类决策。

系统框图如下所示:

图1.模式识别的基本过程

数据获取是指通过各类传感器将原始的电信号、光信号等转化为计算机可处理的数据形式;预处理是指祛除信号中的噪声,加强有用的信息,并对各种退化现象进行一定程度复原;特征提取和选择是指提取能够反映样本的本质属性的特征,并对测量空间和特征空间进行变换以及降维处理;分类器设计是指按照某种决策规则将特征空间分成相应的决策域,其中用来划分决策域的边界面称为决策面,用于表达决策规则的某些函数称为判别函数;分类决策是在特征空间中用统计方法把待识别对象归为某一类,在训练集的基础上确定某个判定规则。

处理流程如下图所示:

图2.模式识别的流程

三、模式识别的方法  

1.模版匹配法

模板匹配法的基本思想是,首先对每个类别建立一个或多个模版,然后让输入样本和数据库中每个类别的模版进行比较,例如求相关或距离,根据相似性(相关性或距离)大小进行决策。

模板匹匹配法的优点是直接,简单,而缺点是适应性差。

2.决策理论方法  

又称统计方法,是发展较早也比较成熟的一种方法。

被识别对象首先数字化,变换为适于计算机处理的数字信息。

一个模式常常要用很大的信息量来表示。

许多模式识别系统在数字化环节之后还进行预处理,用于除去混入的干扰信息并减少某些变形和失真。

随后是进行特征抽取,即从数字化后或预处理后的输入模式中抽取一组特征。

所谓特征是选定的一种度量,它对于一般的变形和失真保持不变或几乎不变,并且只含尽可能少的冗余信息。

特征抽取过程将输入模式从对象空间映射到特征空间。

这时,模式可用特征空间中的一个点或一个特征矢量表示。

这种映射不仅压缩了信息量,而且易于分类。

在决策理论方法中,特征抽取占有重要的地位,但尚无通用的理论指导,只能通过分析具体识别对象决定选取何种特征。

特征抽取后可进行分类,即从特征空间再映射到决策空间。

为此而引入鉴别函数,由特征矢量计算出相应于各类别的鉴别函数值,通过鉴别函数值的比较实行分类。

 

3.句法方法

又称结构方法或语言学方法。

其基本思想是把一个模式描述为较简单的子模式的组合,子模式又可描述为更简单的子模式的组合,最终得到一个树形的结构描述,在底层的最简单的子模式称为模式基元。

在句法方法中选取基元的问题相当于在决策理论方法中选取特征的问题。

通常要求所选的基元能对模式提供一个紧凑的反映其结构关系的描述,又要易于用非句法方法加以抽取。

显然,基元本身不应该含有重要的结构信息。

模式以一组基元和它们的组合关系来描述,称为模式描述语句,这相当于在语言中,句子和短语用词组合,词用字符组合一样。

基元组合成模式的规则,由所谓语法来指定。

一旦基元被鉴别,识别过程可通过句法分析进行,即分析给定的模式语句是否符合指定的语法,满足某类语法的即被分入该类。

  模式识别方法的选择取决于问题的性质。

如果被识别的对象极为复杂,而且包含丰富的结构信息,一般采用句法方法;被识别对象不很复杂或不含明显的结构信息,一般采用决策理论方法。

这两种方法不能截然分开,在句法方法中,基元本身就是用决策理论方法抽取的。

在应用中,将这两种方法结合起来分别施加于不同的层次,常能收到较好的效果。

  

4.神经网络方法

神经网络方法是根据生物原型的研究,建立神经元、神经网络的理论模型,其中包括概念模型、知识模型、物理化学模型、数学模型等。

图3.生物神经元的组成

图4.人工神经元模型

网络模型与算法研究,在理论模型研究的基础上构作具体的神经网络模型,以实现计算机模拟或准备制作硬件,包括网络学习算法的研究,这方面的工作也称为技术模型研究。

人工神经网络应用系统,在网络模型与算法研究的基础上,利用人工神经网络组成实际的应用系统,例如,完成某种信号处理或模式识别的功能、构作专家系统、制成机器人等。

四、模式识别的应用  

模式识别可用于文字和语音识别、遥感和医学诊断等方面。

 

图5.模式识别的应用领域 

1.文字识别  

汉字已有数千年的历史,也是世界上使用人数最多的文字,对于中华民族灿烂文化的形成和发展有着不可磨灭的功勋。

所以在信息技术及计算机技术日益普及的今天,如何将文字方便、快速地输入到计算机中已成为影响人机接口效率的一个重要瓶颈,也关系到计算机能否真正在我过得到普及的应用。

目前,汉字输入主要分为人工键盘输入和机器自动识别输入两种。

其中人工键入速度慢而且劳动强度大;自动输入又分为汉字识别输入及语音识别输入。

从识别技术的难度来说,手写体识别的难度高于印刷体识别,而在手写体识别中,脱机手写体的难度又远远超过了联机手写体识别。

到目前为止,除了脱机手写体数字的识别已有实际应用外,汉字等文字的脱机手写体识别还处在实验室阶段。

  

2.语音识别  

语音识别技术技术所涉及的领域包括:

信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。

近年来,在生物识别技术领域中,声纹识别技术以其独特的方便性、经济性和准确性等优势受到世人瞩目,并日益成为人们日常生活和工作中重要且普及的安验证方式。

而且利用基因算法训练连续隐马尔柯夫模型的语音识别方法现已成为语音识别的主流技术,该方法在语音识别时识别速度较快,也有较高的识别率。

  

3.生物特征识别  

每个个体都有唯一的可以测量或可自动识别和验证的生理特性或行为方式,即生物特征。

它可划分为生理特征(如指纹、面像、虹膜、掌纹等)和行为特征(如步态、声音、笔迹等)。

生物识特征别就是依据每个个体之间独一无二的生物特征对其进行识别与身份的认证。

具体一点,生物特征识别技术就是通过计算机与光学、声学、生物传感器和生物统计学原理等高科技手段密切结合,利用人体固有的生理特性和行为特征来进行个人身份的鉴定。

图6.模式识别在生物特征识别中的应用

4.遥感  

遥感图像识别已广泛用于农作物估产、资源勘察、气象预报和军事侦察等。

图7.模式识别在遥感图像中的应用

5.医学诊断

在癌细胞检测、X射线照片分析、血液化验、染色体分析、心电图诊断和脑电图诊断等方面,模式识别已取得了成效。

  图8.模式识别在医学诊断中的应用

五、模式识别的发展潜力

模式识别技术是人工智能的基础技术,21世纪是智能化、信息化、计算化、网络化的世纪,在这个以数字计算为特征的世纪里,作为人工智能技术基础学科的模式识别技术,必将获得巨大的发展空间。

在国际上,各大权威研究机构,各大公司都纷纷开始将模式识别技术作为公司的战略研发重点加以重视。

  

图9.模式识别的发展方向

1.语音识别技术  

语音识别技术正逐步成为信息技术中人机接口(HumanComputerInterface,HCI)的关键技术,语音技术的应用已经成为一个具有竞争性的新兴高技术产业。

中国互联网中心的市场预测:

未来5年,中文语音技术领域将会有超过400亿人民币的市场容量,然后每年以超过30%的速度增长。

  

2.生物认证技术 

生物认证技术(Biometrics)本世纪最受关注的安全认证技术,它的发展是大势所趋。

人们愿意忘掉所有的密码、扔掉所有的磁卡,凭借自身的唯一性来标识身份与保密。

国际数据集团(IDC)预测:

作为未来的必然发展方向的移动电子商务基础核心技术的生物识别技术在未来10年的时间里将达到100亿美元的市场规模。

  

3.数字水印技术 

90年代以来才在国际上开始发展起来的数字水印技术(DigitalWatermarking)是最具发展潜力与优势的数字媒体版权保护技术。

IDC预测,数字水印技术在未来的5年内全球市场容量超过80亿美元。

 

六、结束语  

模式识别从20世纪20年代发展至今,人们的一种普遍看法是不存在对所有模式识别问题都适用的单一模型和解决识别问题的单一技术,我们现在拥有的只是一个工具袋,所要做的是结合具体问题把统计的和句法的识别结合起来,把统计模式识别或句法模式识别与人工智能中的启发式搜索结合起来,把统计模式识别或句法模式识别与支持向量机的机器学习结合起来,把人工神经元网络与各种已有技术以及人工智能中的专家系统、不确定推理方法结合起来,深入掌握各种工具的效能和应有的可能性,互相取长补短,开创模式识别应用的新局面。

  

对于识别二维模式的能力,存在各种理论解释。

模板说认为,我们所知的每一个模式,在长时记忆中都有一个相应的模板或微缩副本。

模式识别就是与视觉刺激最合适的模板进行匹配。

特征说认为,视觉刺激由各种特征组成,模式识别是比较呈现刺激的特征和储存在长时记忆中的模式特征。

特征说解释了模式识别中的一些自下而上过程,但它不强调基于环境的信息和期待的自上而下加工,基于结构描述的理论可能比模板说或特征说更为合适。

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 经管营销 > 经济市场

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2