《模式识别》知识重点总结与计算题Word文档格式.docx

资源描述

《模式识别》知识重点总结与计算题Word文档格式.docx

《《模式识别》知识重点总结与计算题Word文档格式.docx》由会员分享，可在线阅读，更多相关《《模式识别》知识重点总结与计算题Word文档格式.docx（12页珍藏版）》请在冰点文库上搜索。

《模式识别》知识重点总结与计算题Word文档格式.docx

　　该种度量通过类内离散矩阵Sw和类间离散矩阵Sb实现。

　　感知准则函数：

准则函数以使错分类样本到分界面距离之和最小为原则。

　　其优点是通过错分类样本提供的信息对分类器函数进行修正，这种准则是人工神经元网络多层感知器的基础。

　　支持向量机：

基本思想是在两类线性可分条件下，所设计的分类器界面使两类之间的间隔为最大,它的基本出发点是使期望泛化风险尽可能小。

一、试问“模式”与“模式类”的含义。

如果一位姓王的先生是位老年人，试问“王先生”和“老头”谁是模式，谁是模式类？

在模式识别学科中，就“模式”与“模式类”而言，模式类是一类事物的代表，概念或典型，而“模式”则是某一事物的具体体现，如“老头”是模式类，而王先生则是“模式”，是“老头”的具体化。

二、试说明Mahalanobis距离平方的定义，到某点的Mahalanobis距离平方为常数的轨迹的几何意义，它与欧氏距离的区别与联系。

Mahalanobis距离的平方定义为：

　　其中x，u为两个数据，

是一个正定对称矩阵（一般为协方差矩阵）。

根据定义，距某一点的Mahalanobis距离相等点的轨迹是超椭球，如果是单位矩阵Σ，则Mahalanobis距离就是通常的欧氏距离。

三、试说明用监督学习与非监督学习两种方法对道路图像中道路区域的划分的基本做法，以说明这两种学习方法的定义与它们间的区别。

　　就道路图像的分割而言，监督学习方法则先在训练用图像中获取道路象素与非道路象素集，进行分类器设计，然后用所设计的分类器对道路图像进行分割。

使用非监督学习方法，则依据道路路面象素与非道路象素之间的聚类分析进行聚类运算，以实现道路图像的分割.

四、试述动态聚类与分级聚类这两种方法的原理与不同。

　答：

动态聚类是指对当前聚类通过迭代运算改善聚类；

分级聚类则是将样本个体，按相似度标准合并，随着相似度要求的降低实现合并。

五、如果观察一个时序信号时在离散时刻序列得到的观察量序列表示为

，而该时序信号的内在状态序列表示成

。

如果计算在给定O条件下出现S的概率，试问此概率是何种概率。

如果从观察序列来估计状态序列的最大似然估计，这与Bayes决策中基于最小错误率的决策有什么关系。

在给定观察序列

条件下分析它由某个状态序列S产生的概率似后验概率，写成P（S|O），而通过O求对状态序列的最大似然估计,与贝叶斯决策的最小错误率决策相当。

六、已知一组数据的协方差矩阵为

，试问

　　1．协方差矩阵中各元素的含义。

　　2．求该数组的两个主分量。

　　3．主分量分析或称K-L变换，它的最佳准则是什么？

　　4．为什么说经主分量分析后，消除了各分量之间的相关性。

协方差矩阵为

，则

　　1）对角元素是各分量的方差，非对角元素是各分量之间的协方差。

2）主分量，通过求协方差矩阵的特征值，用

得

，相应的特征向量为：

，对应特征向量为

，对应

这两个特征向量即为主分量。

　　3）K-L变换的最佳准则为：

对一组数据进行按一组正交基分解，在只取相同数量分量的条件下，以均方误差计算截尾误差最小。

　　4）在经主分量分解后，协方差矩阵成为对角矩阵，因而各主分量间相关消除。

七、试说明以下问题求解是基于监督学习或是非监督学习：

　　1.求数据集的主分量2.汉字识别3.自组织特征映射4.CT图像的分割

1、求数据集的主分量是非监督学习方法；

2、汉字识别对待识别字符加上相应类别号——有监督学习方法；

　　3、自组织特征映射——将高维数组按保留近似度向低维映射——非监督学习；

　　4、CT图像分割——按数据自然分布聚类——非监督学习方法；

八、在一两维特征空间，两类决策域由两条直线H1和H2分界，

　　其中

　　而包含H1与H2的锐角部分为第一类，其余为第二类。

　　试求：

1．用一双层感知器构造该分类器2．用凹函数的并构造该分类器

按题意要求

　　1）H1与H2将空间划分成四个部分，按使H1与H2大于零与小于零表示成四个区域，而第一类属于（－＋）区域，为方便起见，令

则第一类在（＋＋）区域。

用双层感知器，神经元用

域值，则在第一类样本输入时，两隐层结点的输出均为＋1，其余则分别为（＋－），（――），（－＋）,故可按图设置域值。

　　2）用凹函数的并表示：

或表示成

，如

，否则

十、对一副道路图像，希望把道路部分划分出来，可以采用以下两种方法：

1．在该图像中分别在道路部分与非道路部分画出一个窗口，把在这两个窗口中的象素数据作为训练集，用Fisher准则方法求得分类器参数，再用该分类器对整幅图进行分类。

2．将整幅图的每个象素的属性记录在一张数据表中，然后用某种方法将这些数据按它们的自然分布状况划分成两类。

因此每个象素就分别得到相应的类别号，从而实现了道路图像的分割。

试问以上两种方法哪一种是监督学习，哪个是非监督学习？

第一种方法中标记了两类样本的标号，需要人手工干预训练过程，属于监督学习方法；

第二种方法只是依照数据的自然分布，把它们划分成两类，属于非监督学习方法。

十一、已知有两类数据,分别为

试求：

该组数据的类内及类间离散矩阵

及

第一类的均值向量为

十三、试分析五种常用决策规则思想方法的异同。

答、五种常用决策是：

1.基于最小错误率的贝叶斯决策，利用概率论中的贝叶斯公式，得出使得错误率最小的分类规则。

2.基于最小风险的贝叶斯决策，引入了损失函数，得出使决策风险最小的分类。

当在0－1损失函数条件下，基于最小风险的贝叶斯决策变成基于最小错误率的贝叶斯决策。

3.在限定一类错误率条件下使另一类错误率最小的两类别决策。

4.最大最小决策：

类先验概率未知，考察先验概率变化对错误率的影响，找出使最小贝叶斯奉献最大的先验概率，以这种最坏情况设计分类器。

5.序贯分类方法，除了考虑分类造成的损失外，还考虑特征获取造成的代价，先用一部分特征分类，然后逐步加入性特征以减少分类损失，同时平衡总的损失，以求得最有效益。

十五、既然有线性判别函数，为什么还要引进非线性判别函数？

试分析由“线性判别函数”向“非线性判别函数”推广的思想和方法。

实际中有很多模式识别问题并不是线性可分的，这时就需要采用非线性分类器，比如当两类样本分不具有多峰性质并互相交错时，简单的线性判别函数往往会带来较大的分类错误。

这时，树分类器作为一种分段线性分类器，常常能有效地应用于这种情况。

十六、1.什么是特征选择？

2.什么是Fisher线性判别？

1.特征选择就是从一组特征中挑选出一些最有效的特征以达到降低特征空间维数的目的。

2.Fisher线性判别：

可以考虑把d维空间的样本投影到一条直线上，形成一维空间，即把维数压缩到一维，这在数学上容易办到，然而，即使样本在d维空间里形成若干紧凑的互相分得开的集群，如果把它们投影到一条任意的直线上，也可能使得几类样本混在一起而变得无法识别。

但是在一般情况下，总可以找到某个方向，使得在这个方向的直线上，样本的投影能分开得最好。

问题是如何根据实际情况找到这条最好的、最易于分类的投影线，这就是Fisher算法所要解决的基本问题。

十八、请论述模式识别系统的主要组成部分及其设计流程，并简述各组成部分中常用方法的主要思想。

信息获取：

通过测量、采样和量化，可以用矩阵或向量表示二维图像或以为波形。

预处理：

去除噪声，加强有用的信息，并对输入测量仪器或其他因素造成的退化现象进行复原。

特征选择和提取：

为了有效地实现分类识别，就要对原始数据进行变换，得到最能反映分类本质的特征。

分类决策：

在特征空间中用统计方法把识别对象归为某一类。

二十、定性说明基于参数方法和非参数方法的概率密度估计有什么区别？

基于参数方法：

是由已知类别的样本集对总体分布的某些参数进行统计推断

非参数方法：

已知样本所属类别，但未知总体概率密度函数形式

二十二、简述支持向量机的基本思想。

SVM从线性可分情况下的最优分类面发展而来。

最优分类面就是要求分类线不但能将两类正确分开（训练错误率为0），且使分类间隔最大。

SVM考虑寻找一个满足分类要求的超平面，并且使训练集中的点距离分类面尽可能的远，也就是寻找一个分类面使它两侧的空白区域（margin）最大。

过两类样本中离分类面最近的点，且平行于最优分类面的超平面上H1，H2的训练样本就叫支持向量。

五、（12分，每问4分）在目标识别中，假定有农田和装甲车两种类型，类型ω1和类型ω2分别代表农田和装甲车，它们的先验概率分别为0.8和0.2，损失函数如表1所示。

现在做了三次试验，获得三个样本的类概率密度如下：

：

0.3，0.1，0.6

：

0.7，0.8，0.3

（1）试用贝叶斯最小误判概率准则判决三个样本各属于哪一个类型；

（2）假定只考虑前两种判决，试用贝叶斯最小风险准则判决三个样本各属于哪一类；

（3）把拒绝判决考虑在内，重新考核三次试验的结果。

表1

类型

损失

判决

解：

由题可知：

，，，

，

（1）（4分）根据贝叶斯最小误判概率准则知：

，则可以任判；

，则判为；

（2）（4分）由题可知：

则，判为；

，判为；

（3）（4分）对于两类问题，对于样本，假设已知，有

则对于第一个样本，

，则拒判；

，拒判。

十四、假设在某个地区细胞识别中正常（w1）和异常（w2）两类先验概率分别为P（w1）=0.9，P（w2）=0.1，现有一待识别的细胞，其观察值为x，从类条件概率密度分布曲线上查得

，并且已知

试对该细胞x用一下两种方法进行分类：

1基于最小错误率的贝叶斯决策；

2基于最小风险的贝叶斯决策；

请分析两种结果的异同及原因。

十九、有两类样本集

1.用K-L变换求其二维特征空间，并求出其特征空间的坐标轴；

2.使用Fisher线性判别方法给出这两类样本的分类面。

展开阅读全文