模式识别期末试题2012.pdf

资源描述

模式识别期末试题2012.pdf

《模式识别期末试题2012.pdf》由会员分享，可在线阅读，更多相关《模式识别期末试题2012.pdf（17页珍藏版）》请在冰点文库上搜索。

模式识别期末试题2012.pdf

1模式识别练习题模式识别练习题填空题1、模式识别系统的基本构成单元包括：

模式采集、特征选择与提取和模式分类。

2、统计模式识别中描述模式的方法一般使用特征矢量；句法模式识别中模式描述方法一般有串、树、网。

3、影响层次聚类算法结果的主要因素有计算模式距离的测度计算模式距离的测度、聚类准则聚类准则、类间距离门限类间距离门限、预定的类别预定的类别数目数目。

4、线性判别函数的正负和数值大小的几何意义是正正（负负）表示样本点位于判别界面法向量指向的正表示样本点位于判别界面法向量指向的正（负负）半空间中；绝对值正比于样本点到判别界面的距离。

半空间中；绝对值正比于样本点到判别界面的距离。

5、感知器算法11。

（1）只适用于线性可分的情况；

（2）线性可分、不可分都适用。

6、在统计模式分类问题中，聂曼-皮尔逊判决准则主要用于某一种判决错误较另一种判决错误更为重某一种判决错误较另一种判决错误更为重要要情况；最小最大判别准则主要用于先验概率未知的先验概率未知的情况。

7、“特征个数越多越有利于分类”这种说法正确吗？

错误错误。

特征选择的主要目的是从从nn个特征中选出最有利于分类的的个特征中选出最有利于分类的的mm个特征（个特征（mnmn）的条件下，可以使用分支定界法以减少计算量。

8、散度Jij越大，说明i类模式与j类模式的分布差别越大差别越大；当i类模式与j类模式的分布相同时，Jij=00。

选择题1、影响聚类算法结果的主要因素有（BBCCDD）。

A.已知类别的样本质量；B.分类准则；C.特征选取；D.模式相似性测度2、模式识别中，马式距离较之于欧式距离的优点是（CCDD）。

A.平移不变性；B.旋转不变性；C尺度不变性；D.考虑了模式的分布3、影响基本K-均值算法的主要因素有（DDAABB）。

A.样本输入顺序；B.模式相似性测度；C.聚类准则；D.初始类中心的选取24、位势函数法的积累势函数K（x）的作用相当于Bayes判决中的（BBDD）。

A.先验概率；B.后验概率；C.类概率密度；D.类概率密度与先验概率的乘积5、在统计模式分类问题中，当先验概率未知时，可以使用（BBDD）。

A.最小损失准则；B.最小最大损失准则；C.最小误判概率准则；D.N-P判决6、散度JD是根据（CC）构造的可分性判据。

A.先验概率；B.后验概率；C.类概率密度；D.信息熵；E.几何距离7、似然函数的概型已知且为单峰，则可用（AABBCCDDEE）估计该似然函数。

A.矩估计；B.最大似然估计；C.Bayes估计；D.Bayes学习；E.Parzen窗法8、KN近邻元法较之Parzen窗法的优点是（BB）。

A.所需样本数较少；B.稳定性较好；C.分辨率较高；D.连续性较好9、从分类的角度讲，用DKLT做特征提取主要利用了DKLT的性质：

（AACC）。

A.变换产生的新分量正交或不相关；B.以部分新的分量表示原矢量均方误差最小；C.使变换后的矢量能量更集中10、如果以特征向量的相关系数作为模式相似性测度，则影响聚类算法结果的主要因素有（BBCC）。

A.已知类别样本质量；B.分类准则；C.特征选取；D.量纲11、欧式距离具有（AABB）；马式距离具有（AABBCCDD）。

A.平移不变性；B.旋转不变性；C.尺度缩放不变性；D.不受量纲影响的特性12、聚类分析算法属于（AA）；判别域代数界面方程法属于（CC）。

A.无监督分类；B.有监督分类；C.统计模式识别方法；D.句法模式识别方法13、若描述模式的特征量为0-1二值特征量，则一般采用（DD）进行相似性度量。

A.距离测度；B.模糊测度；C.相似测度；D.匹配测度14、下列函数可以作为聚类分析中的准则函数的有（AACCDD）。

A.1BWSSTrJ；B.1BWSSJ；C.cjnijjijmxJ112）（；D.）（）（1mmmmJjcjj15、Fisher线性判别函数的求解过程是将N维特征矢量投影在（BB）中进行。

A.二维空间；B.一维空间；C.N-1维空间简单题一、试问“模式”与“模式类”的含义。

如果一位姓王的先生是位老年人，试问“王先生”和“老头”谁是模式，谁是模式类？

3答：

在模式识别学科中，就“模式”与“模式类”而言，模式类是一类事物的代表，概念或典型，而“模式”则是某一事物的具体体现，如“老头”是模式类，而王先生则是“模式”是“老头”的具体化。

二、试说明Mahalanobis距离平方的定义，到某点的Mahalanobis距离平方为常数的轨迹的几何意义，它与欧氏距离的区别与联系。

答：

Mahalanobis距离的平方定义为：

12）（）（）,（uxuxuxrT其中x，u为两个数据，是一个正定对称矩阵（一般为协方差矩阵）。

根据定义，距某一点的Mahalanobis距离相等点的轨迹是超椭球，如果是单位矩阵，则Mahalanobis距离就是通常的欧氏距离。

三、试说明用监督学习与非监督学习两种方法对道路图像中道路区域的划分的基本做法，以说明这两种学习方法的定义与它们间的区别。

答：

监督学习方法用来对数据实现分类，分类规则通过训练获得。

该训练集由带分类号的数据集组成，因此监督学习方法的训练过程是离线的。

非监督学习方法不需要单独的离线训练过程，也没有带分类号（标号）的训练数据集，一般用来对数据集进行分析，如聚类，确定其分布的主分量等。

就道路图像的分割而言，监督学习方法则先在训练用图像中获取道路象素与非道路象素集，进行分类器设计，然后用所设计的分类器对道路图像进行分割。

使用非监督学习方法，则依据道路路面象素与非道路象素之间的聚类分析进行聚类运算，以实现道路图像的分割。

四、试述动态聚类与分级聚类这两种方法的原理与不同。

答：

动态聚类是指对当前聚类通过迭代运算改善聚类；分级聚类则是将样本个体，按相似度标准合并，随着相似度要求的降低实现合并。

五、如果观察一个时序信号时在离散时刻序列得到的观察量序列表示为，而该时序信号的内在状态序列表示成。

如果计算在给定O条件下出现S的概率，试问此概率是何种概率。

如果从观察序列来估计状态序列的最大似然估计，这与Bayes决策中基于最小错误率的决策有什么关系。

答：

在给定观察序列条件下分析它由某个状态序列S产生的概率是后验概4率，写成P（S|O），而通过O求对状态序列的最大似然估计，与贝叶斯决策的最小错误率决策相当。

六、已知一组数据的协方差矩阵为12/12/11，试问1协方差矩阵中各元素的含义。

2求该数组的两个主分量。

3主分量分析或称K-L变换，它的最佳准则是什么？

4为什么说经主分量分析后，消除了各分量之间的相关性。

答：

协方差矩阵为12/12/11，则1.对角元素是各分量的方差，非对角元素是各分量之间的协方差。

2.主分量，通过求协方差矩阵的特征值，用1212110得4/1）1（2，则2/32/1，相应的：

2/3，对应特征向量为11，21，对应11。

这两个特征向量，即为主分量。

3.K-L变换的最佳准则为：

对一组数据进行按一组正交基分解，在只取相同数量分量的条件下，以均方误差计算截尾误差最小。

4.在经主分量分解后，协方差矩阵成为对角矩阵，因而各主分量间相关性消除。

七、试说明以下问题求解是基于监督学习或是非监督学习：

1.求数据集的主分量2.汉字识别3.自组织特征映射4.CT图像的分割答：

1、求数据集的主分量是非监督学习方法；2、汉字识别：

对待识别字符加上相应类别号有监督学习方法；53、自组织特征映射将高维数组按保留近似度向低维映射非监督学习；4、CT图像分割按数据自然分布聚类非监督学习方法；八八、试列举线性分类器中最著名的三种最佳准则以及它们各自的原理。

答：

线性分类器三种最优准则：

Fisher准则准则：

根据两类样本一般类内密集，类间分离的特点，寻找线性分类器最佳的法线向量方向，使两类样本在该方向上的投影满足类内尽可能密集，类间尽可能分开。

这种度量通过类内离散矩阵Sw和类间离散矩阵Sb实现。

感知准则函数感知准则函数：

准则函数以使错分类样本到分界面距离之和最小为原则。

其优点是通过错分类样本提供的信息对分类器函数进行修正，这种准则是人工神经元网络多层感知器的基础。

支持向量机支持向量机：

基本思想是在两类线性可分条件下，所设计的分类器界面使两类之间的间隔为最大，它的基本出发点是使期望泛化风险尽可能小。

九、证明在正定或半正定时，Mahalanobis距离r符合距离定义的三个条件，即

（1）r（a,b）=r（b,a）

（2）当且仅当a=b时，有r（a,b）=0（3）r（a,c）r（a,b）+r（b,c）证明：

（1）根据定义：

11）（）（）（）（）,（ababbababarTT

（2）由于为对称阵，故可以分解为DPDPTT，其中nD0000001，且所有特征值大于等于零。

可以认为）（）（）（）（）（）（）,（1baDPbaDPbaDPDPbabababarTTTTT这就变为了传统意义上的欧氏距离，可以由欧氏距离满足的性质直接证明本命题。

6十、对一副道路图像，希望把道路部分划分出来，可以采用以下两种方法：

1在该图像中分别在道路部分与非道路部分画出一个窗口，把在这两个窗口中的象素数据作为训练集，用Fisher准则方法求得分类器参数，再用该分类器对整幅图进行分类。

2将整幅图的每个象素的属性记录在一张数据表中，然后用某种方法将这些数据按它们的自然分布状况划分成两类。

因此每个象素就分别得到相应的类别号，从而实现了道路图像的分割。

试问以上两种方法哪一种是监督学习，哪个是非监督学习？

答：

第一种方法中标记了两类样本的标号，需要人手工干预训练过程，属于监督学习方法；第二种方法只是依照数据的自然分布，把它们划分成两类，属于非监督学习方法。

十一、已知有两类数据,分别为110201:

1w111001:

2w试求：

该组数据的类内及类间离散矩阵ws及bs。

P88答：

第一类的均值向量为633691）（31111Tiiimxmxs，211231）（31222Tiiimxmxs600691）（2121sssw166361813136313621bs见见88页公式页公式十二、设一个二维空间中的两类样本服从正态分布，其参数分别为：

71001,）0,1（11T，2002,）0,1（12T，先验概率）（）（21wPwP，试证明：

其基于最小错误率的贝叶斯决策分界面方程为一圆，并求其方程。

证明：

先验概率相等条件下，基于最小错误率贝叶斯决策的分界面上两类条件概率密度函数相等。

因此有：

2122211111ln21）（）（21ln21）（）（21uXuXuXuXTT4ln21）1（21）1（22212221xxxx化简为4ln28）3（2221xx，是一个圆的方程。

十三、试分析五种常用决策规则思想方法的异同。

答、五种常用决策是：

1.基于最小错误率的贝叶斯决策，利用概率论中的贝叶斯公式，得出使得错误率最小的分类规则。

2.基于最小风险的贝叶斯决策，引入了损失函数，得出使决策风险最小的分类。

当在01损失函数条件下，基于最小风险的贝叶斯决策变成基于最小错误率的贝叶斯决策。

3.在限定一类错误率条件下使另一类错误率最小的两类别决策。

4.最大最小决策：

类先验概率未知，考察先验概率变化对错误率的影响，找出使最小贝叶斯奉献最大的先验概率，以这种最坏情况设计分类器。

5.序贯分类方法，除了考虑分类造成的损失外，还考虑特征获取造成的代价，先用一部分特征分类，然后逐步加入性特征以减少分类损失，同时平衡总的损失，以求得最有效益。

十四、假设在某个地区细胞识别中正常（w1）和异常（w2）两类先验概率分别为9.0）（1wP，81.0）（2wP，现有一待识别的细胞，其观察值为x，从类条件概率密度分布曲线上查得2.0）（1wxP，4.0）（2wxP，并且已知011，612，121，022试对该细胞x用一下两种方法进行分类：

1.基于最小错误率的贝叶斯决策；2.基于最小风险的贝叶斯决策；请分析两种结果的异同及原因。

答：

1.2.9十五、既然有线性判别函数，为什么还要引进非线性判别函数？

试分析由“线性判别函数”向“非线性判别函数”推广的思想和方法。

答：

实际中有很多模式识别问题并不是线性可分的，这时就需要采用非线性分类器，比如当两类样本分不具有多峰性质并互相交错时，简单的线性判别函数往往会带来较大的分类错误。

这时，树分类器作为一种分段线性分类器，常常能有效地应用于这种情况。

十六、1.什么是特征选择？

2.什么是Fisher线性判别？

答：

1.特征选择就是从一组特征中挑选出一些最有效的特征以达到降低特征空间维数的目的。

2.Fisher线性判别：

可以考虑把d维空间的样本投影到一条直线上，形成一维空间，即把维数压缩到一维，这在数学上容易办到，然而，即使样本在d维空间里形成若干紧凑的互相分得开的集群，如果把它们投影到一条任意的直线上，也可能使得几类样本混在一起而变得无法识别。

但是在一般情况下，总可以找到某个方向，使得在这个方向的直线上，样本的投影能分开得最好。

问题是如何根据实际情况找到这条最好的、最易于分类的投影线，这就是Fisher算法所要解决的基本问题。

十七、写出两类和多类情况下最小风险贝叶斯决策判别函数和决策面方程。

两类问题：

判别函数）（）（）（2121111xwpxwpxg）（）（）（2221212xwpxwpxg决策面方程：

）（）（21xgxgC类问题：

判别函数）（）（1xwpxgjijcji，ci,.2,1决策面方程：

）（）（xgxgji，ji，ci,.2,1，cj,.2,110十八、请论述模式识别系统的主要组成部分及其设计流程，并简述各组成部分中常用方法的主要思想。

信息获取：

通过测量、采样和量化，可以用矩阵或向量表示二维图像或波形。

预处理：

去除噪声，加强有用的信息，并对输入测量仪器或其他因素造成的退化现象进行复原。

特征选择和提取：

为了有效地实现分类识别，就要对原始数据进行变换，得到最能反映分类本质的特征。

分类决策：

在特征空间中用统计方法把识别对象归为某一类。

十九、有两类样本集Tx0,0,011，Tx0,0,121，Tx1,0,131，Tx0,1,141Tx1,0,012，Tx0,1,022，Tx1,1,032，Tx1,1,1421.用K-L变换求其二维特征空间，并求出其特征空间的坐标轴；2.使用Fisher线性判别方法给出这两类样本的分类面。

数据获取数据获取预处理预处理特征提取与选特征提取与选分类决策分类决策分类器设计分类器设计信号空间特征空间11iTiiTxxXXE81二十、定性说明基于参数方法和非参数方法的概率密度估计有什么区别？

答：

基于参数方法：

是由已知类别的样本集对总体分布的某些参数进行统计推断非参数方法：

已知样本所属类别，但未知总体概率密度函数形式12二十一、答：

500221）（2121ws,4.00011ws二十二、简述支持向量机的基本思想。

答：

SVM从线性可分情况下的最优分类面发展而来。

最优分类面就是要求分类线不但能将两类正确分开（训练错误率为0），且使分类间隔最大。

SVM考虑寻找一个满足分类要求的超平面，并且使训练集中的点距离分类面尽可能13的远，也就是寻找一个分类面使它两侧的空白区域（margin）最大。

过两类样本中离分类面最近的点，且平行于最优分类面的超平面上H1，H2的训练样本就叫支持向量。

二十三、设两个家庭，每家3-5人，选每个人的一张照片，共8张，混放在一起，将照片两两对照，得出描述其“相似程度”的模糊关系矩阵。

要求按相似程度聚类，希望把二个家庭分开。

二十四、设654321,xxxxxxX，标准模型由以下模糊集合表示：

）,1.0（）,0.0（）,4.0（）,5.0（）,8.0（）,0.1（6543211xxxxxxA）,8.0（）,5.0（）,7.0（）,2.0（）,0.1（）,0.0（6543212xxxxxxA）,7.0（）,0.1（）,5.0（）,0（）,2.0（）,8.0（6543213xxxxxxA）,0.1（）,5.0（）,0（）,8.0（）,7.0（）,5.0（6543214xxxxxxA14现有一待识别的模型）,8.0（）,0.1（）,4.0（）,1.0（）,2.0（）,7.0（654321xxxxxxB采用海明贴近度计算，B与哪个标准模型最相近？

解：

海明贴近度：

niiBiAHxxnBA111,5.06317.0104.06.03.0611）,（1BAH6.064.2105.03.01.08.07.0611）,（2BAH93.064.011.001.01.001.0611）,（3BAH58.065.212.05.04.07.05.02.0611）,（4BAH）,（93.058.0,93.0,6.0,5.0max3BAHB与3A最相似。

二十五、设论域54321,xxxxxX，给定模糊关系矩阵：

141.047.047.047.041.0141.041.041.047.0041148.062.047.041.048.0148.047.041.062.048.01R要求按不同水平分类。

解：

矩阵显然具有自反性、对称性。

计算RR：

RRR141.047.047.047.041.0141.041.041.047.0041148.062.047.041.048.0148.047.041.062.048.01141.047.047.047.041.0141.041.041.047.0041148.062.047.041.048.0148.047.041.062.048.01141.047.047.047.041.0141.041.041.047.0041148.062.047.041.048.0148.047.041.062.048.01RRRR为一模糊等价矩阵，可据不同水平分类。

1）1：

54321xxxxx1510000010000010000010000011R54321xxxxx此时共分五类：

1x、2x、3x、4x、5x，“最细”的分类。

54321xxxxx2）62.0：

10000010000010100010001010.62R54321xxxxx此时分为4类：

31,xx、2x、4x、5x。

54321xxxxx3）48.0：

10000010000011100111001110.48R54321xxxxx此时分为3类：

321,xxx、4x、5x。

54321xxxxx4）47.0：

10111010001011110111101110.47R54321xxxxx此时分为2类：

5321,xxxx、4x。

5）41.0：

11111111111111111111111110.41R此时五个元素合为1类，即最粗的分类。

二十六、设有4个二维样本，分别是T10,0X，T21,0XT31,3X，T42,3X利用模糊K-均值算法把它们聚为两类。

16解：

（1）根据要求N=4，K=2。

（2）根据先验知识确定初始隶属度矩阵：

4321XXXX9.03.02.01.01.07.08.09.00U21由U（0）可知，倾向于X1、X2、X3为一类，X4为一类。

NjmijNjjmijiLLL11XZ4321XXXX9.03.02.01.01.07.08.09.00U21T10,0XT21,0XT31,3XT42,3X（3）计算聚类中心01Z、02Z，取m=2，有）231.0137.0108.0009.0（022221Z59.077.0）1.07.08.09.0（2222）239.0133.0102.0001.0（022222Z84.184.2）9.03.02.01.0（2222KpmpjijijddL112）（1159.077.001Z84.184.202ZT10,0XT21,0XT31,3XT42,3X（4）计算新的隶属度矩阵U

（1）。

取m=2，分别计算）1（ij。

如对X3有：

14.5）59.01（）77.03（22213d73.0）84.11（）84.23（22223d17得12.073.014.514.514.511122321321321313dddd类似地，可得到U

（1）中其它元素，有4321XXXX99.088.008.008.001.012.092.092.0）1（1ijU21若满足收敛条件LLijijji1max,，则迭代结束，否则返回（3）计算聚类中心。

假设此时满足收敛条件，迭代结束，则根据U

（1）进行聚类。

）1（）1（2111，）1（）1（2212，1211,XX）1（）1（1323，）1（）1（1424，2423,XX88.0）73.073.014.573.0（11122322321322323dddd

展开阅读全文