一般在国
分性判据对特征个数具有单调性和(Cnm>>n)的条件下,可以使用分支定界法以减少计算量。
8、散度Jij越大,说明i类模式与j类模式的分布差别越大:
当i类模式与j类模式的分布相同时,Jij=_0-。
二、选择题
1、影响聚类算法结果的主要因素有(B、C、D)。
A.已知类别的样本质量;B.分类准则;C.特征选取;D.模式相似性测度
2、模式识别中,马式距离较之于欧式距离的优点是(C、D)。
A.平移不变性;B.旋转不变性;C尺度不变性;D.考虑了模式的分布
3、影响基本K-均值算法的主要因素有(ABD)。
A.样本输入顺序;B.模式相似T测度;C.聚类准则;D.初始类中心的选取
4、位势函数法的积累势函数K(x)的作用相当于Bayes判决中的(BD)。
精品文档
A.先验概率;B,后验概率;C.类概率密度;D.类概率密度与先验概率的乘积
5、在统计模式分类问题中,当先验概率未知时,可以使用(BD)。
A.最小损失准则;B.最小最大损失准则;C.最小误判概率准则;D.N-P判决
6、散度Jd是根据(C)构造的可分性判据。
A.先验概率;B.后验概率;C.类概率密度;D.信息"E.几何距离
7、似然函数的概型已知且为单峰,则可用(ABCDE)估计该似然函数。
A.矩估计;B.最大似然估计;C.Bayes估计;D.Bayes学习;E.Parzen窗法
8、KN近邻元法较之Parzen窗法的优点是(B)。
A.所需样本数较少;B.稳定性较好;C.分辨率较高;D.连续性较好
9、从分类的角度讲,用DKLT做特征提取主要利用了DKLT的性质:
(AC)。
A.变换产生的新分量正交或不相关;B.以部分新的分量表示原矢量均方误差最小;C.使变换后的矢量能量
更集中
10、如果以特征向量的相关系数作为模式相似性测度,则影响聚类算法结果的主要因素有(BC)。
A.已知类别样本质量;B.分类准则;C.特征选取;D.量纲11、欧式距离具有(AB);马式距离具有(ABCD)。
A.平移不变性;B.旋转不变性;C.尺度缩放不变性;D.不受量纲影响的特性
12、聚类分析算法属于(A);判别域代数界面方程法属于(C)。
A.无监督分类;B.有监督分类;C.统计模式识别方法;D.句法模式识别方法
13、若描述模式的特征量为0-1二值特征量,则一般采用(D)进行相似性度量。
A.距离测度;B.模糊测度;C.相似测度;D.匹配测度
14、下列函数可以作为聚类分析中的准则函数的有(ACD)。
cnj2c
A.JTHS^Sb];B.jSwSb1;C.Jki⑴mJ;D.j阿布)阿m)
j1i1j1
15、Fisher线性判别函数的求解过程是将N维特征矢量投影在(B)中进行。
A.二维空间;B.一维空间;C.N-1维空间
16、用parzen窗法估计类概率密度函数时,窗宽过窄导致波动过大的原因是(BC)。
A.窗函数幅度过小;B.窗函数幅度过大;C.窗口中落入的样本数过少;D.窗口中落入的样本数过多。
17、如下聚类算法中,属于静态聚类算法的是(AB)。
A.最大最小距离聚类;B.层次聚类;C.c-均值聚类。
18、一般,k-NN最近邻方法在(B)的情况下效果较好。
A.样本较多但典型性不好;B.样本较少但典型性好;C.样本呈团状分布;D.样本呈链状分布
19、影响c均值聚类算法效果的主要因素之一是初始类心的选取,相比较而言,(C)c个样本作为初始类心
较好。
A.按输入顺序选前;B.选相距最远的;C.选分布密度最高处的;D.随机挑选。
20、类域界面方程法中,能求线性不可分情况下分类问题近似或精确解的方法是(BCD)。
A.感知器算法;B.伪逆法;C.基于二次准则的H-K算法;D.势函数法。
三、简答题
1、试说明Mahalanobis距离平方的定义,到某点的Mahalanobis距离平方为常数的轨迹的几何意义,它与欧氏距离的区别与联系。
2T1,、
答:
Mahalanobis距离的平万定义为:
r(x,u)(xu)(xu)
其中x,u为两个数据,1是一个正定对称矩阵(一般为协方差矩阵)。
根据定义,距某一点
的Mahalanobis距离相等点的轨迹是超椭球,如果是单位矩阵2,则Mahalanobis距离就是通
常的欧氏距离。
2、试说明用监督学习与非监督学习两种方法对道路图像中道路区域的划分的基本做法,以说明这
两种学习方法的定义与它们间的区别。
答:
监督学习方法用来对数据实现分类,分类规则通过训练获得。
该训练集由带分类号的数
据集组成,因此监督学习方法的训练过程是离线的。
非监督学习方法不需要单独的离线训练过程,也没有带分类号(标号)的训练数据集,一般用来对数据集进行分析,如聚类,确定其分布的主分量等。
就道路图像的分割而言,监督学习方法则先在训练用图像中获取道路象素与非道路象素集,
精品文档
进行分类器设计,然后用所设计的分类器对道路图像进行分割。
使用非监督学习方法,则依据道路路面象素与非道路象素之间的聚类分析进行聚类运算,以
实现道路图像的分割。
11/2
1/2
3、已知一组数据的协方差矩阵为,试问
(1)协方差矩阵中各元素的含义
(2)求该数组的两个主分量
(3)主分量分析或称K-L变换,它的最佳准则是什么?
(4)为什么说经主分量分析后,消除了各分量之间的相关性。
、」11/2
答:
协方差矩阵为,则
1/21
(1)对角元素是各分量的方差,非对角元素是各分量之间的协方差。
11
(2)主分量,通过求协方差矩阵的特征值,用12=0得
(1)21/4,则
2
1/2.、.一.11.1
,相应地:
3/2,对应特征向量为,一,对应。
3/2121
这两个特征向量,即为主分量。
(3)K-L变换的最佳准则为:
对一组数据进行按一组正交基分解,在只取相同数量分量的条件下,以均方误差计算截尾误
差最小。
(4)在经主分量分解后,协方差矩阵成为对角矩阵,因而各主分量间相关性消除。
4、试说明以下问题求解是基于监督学习或是非监督学习:
(1)求数据集的主分量
(2)汉字识别
精品文档
(3)自组织特征映射
⑷CT图像的分割
答:
(1)求数据集的主分量是非监督学习方法;
(2)汉字识别:
对待识别字符加上相应类别号一有监督学习方法;
(3)自组织特征映射一将高维数组按保留近似度向低维映射一非监督学习;
(4)CT图像分割一按数据自然分布聚类一非监督学习方法;
5、试列举线性分类器中最著名的三种最佳准则以及它们各自的原理。
答:
线性分类器三种最优准则:
Fisher准则:
根据两类样本一般类内密集,类间分离的特点,寻找线性分类器最佳的法线向量方
向,使两类样本在该方向上的投影满足类内尽可能密集,类间尽可能分开。
这种度量通过类内离散矩阵Sw和类间离散矩阵Sb实现。
感知准则函数:
准则函数以使错分类样本到分界面距离之和最小为原则。
其优点是通过错分类样本提供的信息对分类器函数进行修正,这种准则是人工神经元网络多层感知器的基础。
支持向量机:
基本思想是在两类线性可分条件下,所设计的分类器界面使两类之间的间隔为最大,它的基本出发点是使期望泛化风险尽可能小。
6、试分析五种常用决策规则思想方法的异同。
答、五种常用决策是:
1.基于最小错误率的贝叶斯决策,利用概率论中的贝叶斯公式,得出使得错误率最小的分类规则。
2.基于最小风险的贝叶斯决策,引入了损失函数,得出使决策风险最小的分类。
当在0-1损失函数条件下,基于最小风险的贝叶斯决策变成基于最小错误率的贝叶斯决策。
3.在限定一类错误率条件下使另一类错误率最小的两类别决策。
4.最大最小决策:
类先验概率未知,考察先验概率变化对错误率的影响,找出使最小贝叶斯
奉献最大的先验概率,以这种最坏情况设计分类器。
5.一贯分类方法,除了考虑分类造成的损失外,还考虑特征获取造成的代价,先用一部分特
征分类,然后逐步加入性特征以减少分类损失,同时平衡总的损失,以求得最有效益。
7、1.什么是特征选择?
2.什么是Fisher线性判别?
答:
1.特征选择就是从一组特征中挑选出一些最有效的特征以达到降低特征空间维数的目的。
2.Fisher线性判别:
可以考虑把d维空间的样本投影到一条直线上,形成一维空间,即把维
数压缩到一维,这在数学上容易办到,然而,即使样本在d维空间里形成若干紧凑的互相分得开
的集群,如果把它们投影到一条任意的直线上,也可能使得几类样本混在一起而变得无法识别。
但是在一般情况下,总可以找到某个方向,使得在这个方向的直线上,样本的投影能分开得最好。
问题是如何根据实际情况找到这条最好的、最易于分类的投影线,这就是Fisher算法所要解决的
基本问题。
8、写出两类和多类情况下最小风险贝叶斯决策判别函数和决策面方程。
两类问题:
判别函数gi(x)iip(Wix)12p(W2x)
g2(X)21P(WiX)22P(W2X)
决策面方程:
gi(x)g2(x)
c
C类问题:
判别函数gi(x)ijP(Wjx),i1,2,……c
ji
决策面方程:
gi(x)gj(x),ij,i1,2,……c,j1,2,……c
信息获取:
通过测量、采样和量化,可以用矩阵或向量表示二维图像或波形。
预处理:
去除噪声,加强有用的信息,并对输入测量仪器或其他因素造成的退化现象进行复原。
特征选择和提取:
为了有效地实现分类识别,就要对原始数据进行变换,得到最能反映分类本质的特征。
分类决策:
在特征空间中用统计方法把识别对象归为某一类
10、简述支持向量机的基本思想。
答:
SVM从线性可分情况下的最优分类面发展而来。
最优分类面就是要求分类线不但能将两类正确分开(训练错误率为0),且使分类间隔最大。
SVM考虑寻找一个满足分类要求的超平面,并且使训练集中的点距离分类面尽可能的远,
Hi,H2的训练样本就叫
也就是寻找一个分类面使它两侧的空白区域(margin)最大。
过两类样本中离分类面最近的点,且平行于最优分类面的超平面上
支持向量。
四、计算题
、……112
1、设两类样本的类内散布矩阵分别为S1
121
S2
1
12
12
1
两类的类心分别为
mi=(2,0)T,m2=(2,2)T,试用巾sher准则求其决策面方程。
生力110110
斛:
Sw2(S15)01'Sw01
d(x)0x
或写出决策面方程d(x)
x21
2、已知两个一维模式类别的类概率密度函数为精品文档
p(x/1)
x
其它
P(x/
2)
2x3
其它
先验概率
P(i)=0.6,P(
2)=0.4,
(1)求0-1代价Bayes判决函数;
(2)求总错误概率P(e);
各属于哪一类别。
(3)判断样本x1=1.35,x2=1.45,x3=1.55,x4=1.65
答:
(1)基于0-1代价Bayes判决函数为:
0.67时,x
当P(x|1)P
(2)0.42
-P(x|2)
(1)0.63
3
5
x1
P(e)
P(
J*D2
P(x|1)dxP(
2)*DP(x|2)dx
1.6
x)dx0.4*(x
1
⑶Xi
1.35,
P(x/
1)/P(x/
2)
0.65/0.35
1.86
0.67,
所以Xi
w1
X2
1.45,
p(x/
1)/p(x/
2)
0.55/0.45
1.22
0.67,
所以X2
W)
X3
1.55,
P(x/
1)/p(x/
2)
0.45/0.55
0.82
0.67
所以X3
Wi
X4
1.65,
P(x/
1)/p(x/
2)
0.35/0.65
0.54
0.67,所以X4
w2
3、假设在某个地区细胞识别中正常(W1)和异常(W2)两类先验概率分别为P(Wi)0.8,P(w2)0.2,
现有一待识别的细胞,其观察值为x,从类条件概率密度分布曲线上查得P(x/wi)0.25,
P(x/W2)0.6,并且已知110,126,211,220
试对该细胞x用一下两种方法进行分类:
(1)基于最小错误率的贝叶斯决策;
(2)基于最小风险的贝叶斯决策;
请分析两种结果的异同及原因。
答:
(1)利用贝叶斯公式,分别计算出W1和W2的后验概率:
一…、,\p(XW1)p(W1)
P(w1x)-2
p(XWj)p(Wj1)j1
根据贝叶斯决策规则:
p(W2x)1p(W1x)0.375
p(W1x)0.625p(W2x)0.375,所以把x归为正常状态。
(2)根据条件和上面算出的后验概率,计算出条件风险:
2
R(小)1jp(Wj|x)11P(w/x)12P(W2|x)3.125
j1
2
R(2x)2jp(Wjx)21P(Wix)22P(W22x)1.75
j1
由于R(ix)R(2x),即决策为W2的条件风险小于决策为wi的条件风险,因此采取决策行动2,即判断待识别的细胞x为W2类----异常细胞。
将
(1)与
(2)相对比,其分类结果正好相反,这是因为这里影响决策结果的因素又多了一个,即损失”;而且两类错误决策所造成的损失相差很悬殊,因此损失”起了主导作用。
4、有两类样本集x1[0,0,0]T,x;[1,0,0]T,x;[1,0,1]T,x:
[1,1,0]T
1__T2__T3__T4__T
x2[0,0,1],x2[0,1,0],x2[0,1,1],x2[1,1,1]
用K-L变换求其二维特征空间,并求出其特征空间的坐标轴;
使用Fisher线性判别方法给出这两类样本的分类面。
解:
E[XXt]
1
8
xixi
0.5
0.25
0.25
E[XX
T
]
0.25
0.5
0.25
0.25
0.25
0.5
0.25
0
0
0
0.25
0
U
(2)
T
0
0
1
其对应的特征值和特征向量为:
111
,降到二维空间,取U/袤72
2,6、3
211
111
666
J262
2
1
0
1
1
1
对应的坐标:
1
2
2
1
1
2
02
2
.2
2
\A/,
2
2
02
1
1
W2-1
1
2
6
v6
6
6
6
6
0.25
0.75
0.75
2
2
0
(2)m1
m2
9
2
2
1
1
1
1
1
2
16
16
16
16
16
16
16
16
16
4
、,、t2
1
1
1
1
1
1
1
2
S1(x
mKxim1)
—
i1
16
16
16
16
16
16
16
16
16
2
1
1
1
1
1
2
2
9
16
16
16
16
16
16
16
16
16
12
1
2
1
0
1616
16
4
4
29
2
1
2
1
1616
16
4
4
4
12
1
1
1
2
1616
16
4
4
4
0.75
0.25
0.25
S2
4
(Xii1
m2)(x
m2)
1
16
3
16
1
16
3
16
9
16
3
16
1
16
3
16
1
16
1
16
1
16
3
16
1
16
1
16
3
16
3
16
3
16
9
16
1
16
1
16
1
16
1
16
1
16
1
16
1
16
1
16
1
16
9
163
163
16
3
16
1
16
1
16
3
161
161
16
3
4
1
4
1
4
1
4
3
4
1
4
1
4
1
4
3
4
Sw
S2)
Sw1(m1
m2)
y0
*T
wm1
*T
wm2
2
所以判别函数为g(x)
5、假设两类模式服从如下的正态分布:
11
1,2,1
11
0,0T,Sw
2(1
Sw1
0.4
12
Sb(i
2i1
)(i
)T%
2)(
2)T
Sw1Sb
0.40.4
1
因为SwSb的秩为
1,所以
_1_、
SwSb只有一个非零特征值,
1矩阵,即
为求解SwSb的特征值,解方程Sw1SbwiW,
_11,…
即一Sw(12)(1
4
一,1,、T1,
因为一(12)W为标量,所以,WSw(1
4
T。
6、现有样本集X={(0,0)T,(0,1)T,(2,1)T,(2,3)T,(3,4)T,(1,0)T},
试用K-means{C-均值}算法进行聚类分析(类数C=2),初始聚类中心为(0,0)T、(0,1)
解:
第一步:
由题意知C=2,初始聚类中心为Z10=(0,0)T,Z20=(0,1)t
第二步:
||xi-Zio||二||(0,0)t-(0,0)T||二0
||X1-Z20||二||(0,0)T-(0,1)T||二1
因为||xi-Zio||<||xi-Z20||,所以xii
||X2-Z10||=||(0,1)T-(0,0)T||二1
||X2-Z20||二||(0,1)T-(0,1)T||二0
因为||X2-Z10||>||X2-Z20||,所以X22
同理
因为||x3-Zio||=51/2>||x3-Z20||=2,所以X32
因为||x4-Zio||=81/2>||x4-Z20||=51/2,所以X42
X52,X61
由此得到新的类:
1={x1,X6}N1=2,2={x2,X3,X4,X5}N2=4
第三步:
根据新分成的两类计算新的聚类中心
Zii=(xi+X6)/2=(0.5,0)T
Z2i=(x2+x3+x4+x5)/4=(1.75,2.25)t
第四步:
因为新旧聚类中心不等,转第二步
第二步:
重新计算xi,X2,X3,X4,X5,X6到Zll、Zl2的距离,把它们归为最近聚类中心,重新分为
两类1={x1,x2,X6}N1=3,2={x3,X4,X5}N2=3
第三步:
根据新分成的两类计算新的聚类中心
Z12=(x1+x2+x6)/3=(1/3,1/3)t
Z22=(X3+x4+X5)/3=(7/3,8/3)T
第四步:
因为新旧聚类中心不等,转第二步
重新计算X1,X2,X3,X4,X5,X6到Z12、Z22的距离,把它们归为最近聚类中心,重新分为两类
1={x1,X2,X6},N1=3,1={x3,X4,X5},N2=3
和上次聚类结果一样,计算结束。
7、已知二维样本:
X1=(-1,0)t,x2=(0,-1)T,X3=(0,0)T,X4=(2,0)T和X5=(0,2)T,{为区}1
{X3,X4,X5}20试用感知器算法求出分类决策函数,并判断X6=(2,1)t属于哪一类?
答:
将样本符号规范化得:
X1=(-1,0,1)T,X2=(0,-1,1)T,X3=(0,0,-1)T,*4=(-2,0,-1),和*5=(0,-2,-1),
1
0,
w(3)
w
(2)
2
0,
w(4)
w(3)X3(0,1,1)T
1
0,
w(5)
w(4)X4(2,1,0)T
2
0,
w(6)
w(5)X5(2,1,1)T
1
0,
w⑺
w(6)
0,
w(8)
w(7)X2(2,2,0)T
0,
w(9)
w(8)X3(2,2,1)T
1,置迭代步数k=1,则有:
0,w
(2)w
(1)X1(0,1,2)T
50,w(10)w(9)
赋初值w
(1)(1,1,1)T,取增量k=1,XkX1,d(Xk)wT(k)Xk
k=2,XkX2,d(Xk)wT(k)Xk
k=3,XkX3,d(Xk)wT(k)Xk
k=4,XkX4,d(Xk)wT(k)Xk
k=5,XkX5,d(Xk)wT(k)Xk
k=6,XkX1,d(Xk)wT(k)Xk
k=7,XkX2,d(Xk)wT(k)Xk
k=8,XkX3,d(Xk)wT(k)Xk
k=9,XkX4,d(Xk)wT(k)Xk
X5,d(Xk)wT(k)Xk50,
X1,d(Xk)wT(k)Xk10,
X2,d(Xk)wT(k)Xk50,
X3,d(Xk)wT(k)Xk50,
所以,最后收敛于w(2,2,
将X6(2,1),代入决策函数,d(X)
8、两类样本的均值矢量分别为m1=(4,2)T和m2=(-4,-2)T,3142
协方差矩阵分别为:
C1,C2,两类的先验概率相等,
1324
试求一维特征提取矩阵。
特征的选择与提取84页ppt
9、设语言L(G)的正样本集R
{101,111},试推断出余码文法Gc。
句法模式识别ppt32页
填空题
1、模式识别系统的基本构成单元包括:
模式采集、特征选择与提取和模式分类。
2、统计模式识别中描述模式的方法一般使用特征矢量;句法模式识别中模式描述方法一般有_H_、树、
网。
3、影响层次聚类算法结果的主要因素有计算槿式距离的测序、聚类准则、类间距离门限、预定的类别数目。
4、线性判别函数的正负和数值大小的几何意义是正(侦)表示样本点位干判别界面法向量指向的正(侦)半
空间中;绝对值正比于样本点到判别界面的距离。
5、感知器算法1_。
(1)只适用于线性可分的情况;
(2)线性可分、不可分都适用。
6、在统计模式分类问题中,聂曼-皮尔逊判决准则主要用于某一种判决错误较另一种判决错误事为重要情况;
最小最大判别准则主要用于先验概率未知的情况。
7、特征个数越多越有利于分类”这种说法正确吗?
错误。
特征选择的主要目的是从n个特征中选出最有利于分类的的m个特征(m一般在