模式识别考试题资料下载.pdf

上传人:wj 文档编号:5971815 上传时间:2023-05-05 格式:PDF 页数:10 大小:450.46KB
下载 相关 举报
模式识别考试题资料下载.pdf_第1页
第1页 / 共10页
模式识别考试题资料下载.pdf_第2页
第2页 / 共10页
模式识别考试题资料下载.pdf_第3页
第3页 / 共10页
模式识别考试题资料下载.pdf_第4页
第4页 / 共10页
模式识别考试题资料下载.pdf_第5页
第5页 / 共10页
模式识别考试题资料下载.pdf_第6页
第6页 / 共10页
模式识别考试题资料下载.pdf_第7页
第7页 / 共10页
模式识别考试题资料下载.pdf_第8页
第8页 / 共10页
模式识别考试题资料下载.pdf_第9页
第9页 / 共10页
模式识别考试题资料下载.pdf_第10页
第10页 / 共10页
亲,该文档总共10页,全部预览完了,如果喜欢就下载吧!
下载资源
资源描述

模式识别考试题资料下载.pdf

《模式识别考试题资料下载.pdf》由会员分享,可在线阅读,更多相关《模式识别考试题资料下载.pdf(10页珍藏版)》请在冰点文库上搜索。

模式识别考试题资料下载.pdf

二:

聚类分析的基本思想,C-均值动态聚类算法的思想及步骤1.聚类分析是无监督分类:

(1)假设:

对像集客观存在着若干个自然类,每个自然类中个体的属性具有较强的相似性。

(2)原理:

将给定模式分成若干组,每组内的模式是相似的,而组间各模式差别较大。

(3)方法:

a根据带分类的模式属性或特征相似程度进行分类,相似的模式归为一类,不相似的模式划分为不同的类,将带分类的模式集分成若干个不重叠的子集。

b定义适当的准则函数,运用有关的数学工具,或利用有关的统计概念和原理进行分类。

2.C-均值法

(1)条件及约定:

设待分类的模式特征矢量集为1xnx,类的数目C是事先取定的。

(2)算法思想:

该方法取定C个类别和选取C个初始聚类中心,按最小距离原则将各模式分配到C类中的某一类,之后不断的计算类心和调整个模式的类别,最终使各模式到其判属性类别中心的距离平方之和最小。

(3)原理步骤:

a任选C个模式特征矢量作为初始聚类中心:

)0()0

(2)0(1,czzz,令k=0。

b将待分类的模式特征矢量集ix中的模式按最小距离原则分化给C类中的某一类,即:

如果)(kild=jmin)(kijd(i=1,2,3N),则

(1)kilx。

式中)(kijd表示ix和)(jkw的中心)(kjz的距离,上角标表示选代次数。

于是产生新聚类)1(jkw(j=1,2,C)。

c计算重新分类后的各类心,)1(kjz=)1(1kjn)1(kjiwxix,(j=1,2,C),式中)1(kjn为类)1(kjw中所含模式的个数。

d如果)1(kjz=)(kjz,j=1,2,.C,则结束,否则k=k+1,转至b。

三:

说明线性判别函数的正负以及数值大小在分类中的意义并证明。

n维特征空间nx中,两类问题的线性判别界面方程为0wx+1nw=0判别函数为d(x)=0wx+1nw此方程表示一超平面。

它有以下三个性质:

意义:

(1)系数矢量,是该平面的法矢量。

(1)判别函数d(x)的绝对值正比于x到超平面d(x)=0的距离。

(2)判别函数值的正负表示出特征点位于哪个半空间中,即若为正,在超平面的正侧,若为负,在超平面的负侧。

证明:

(1)平面的方程可以写成|00wwx=|01wwn设平面的单位法矢量n=|00ww(等号上有小三角)上式可以写成n*x=|01wwn设p是平面中的任一点,x是特征矢量nx中的任一点点x到平面的距离为差矢量(x-p)在n上投影的绝对值,即:

xd=|n(x-p)|=|n*x-n*p|=|00wwx-|00wwp|=|00wwx+|01wwn|=|10w|d(x)|上式表明,d(x)的值|d(x)|正比于x到超平面d(x)=0的距离xd

(2)两矢量n和(x-p)的数积为n*(x-p)=|n|x-p|cos(n,(x-p)=|010wwxwn当n和(x-p)夹角小于o90时,即x在n指向的那个半空间中,cos(n,(x-p)0;

反之,n和(x-p)夹角大于o90时,x在n背向的那个半空间中cos(n,(x-p)0,故n(x-p)和10nwxw同号;

即x在n指向的半空间中时,010nwxw即x在n背向的半空间中时,10nwxw(22l-12l)P(2w|x)则x21ww其中11l-21l0,22l-12l0.即1121221221)|()|(llllxwPxwP则x21ww决策自然状态1w2w111l=),(11wl12l=),(21wl221l=),(12wl22l=),(22wl由得:

若112122122211)()|()()|(llllwPwxPwPwxP则x21ww即:

若:

112122121221)()()|()|(llllwPwPwxpwxp则x21ww可得最小风险Bayes决策识别规则。

八:

已知某一类训练样本集的每一个样本都是由独立抽样实验采集的,类条件概率密度服从正态分布,以一维情况为例,求最大似然估计对未知参数(均值,方差)的估计过程及结果解:

由题意单变量正态分布的形式为P(x|)=)(21exp212x其中均值和方差2为未知参数,即要估计的参数为TT,221,用于估计的样本是x=Nxx.1则似然函数L()=p(|x)=0)

(1),|.(12211NNxxp最大似然估计是下列方程组的解:

NkkxpH1)|(ln)(=0又从可得:

2122)(212ln21)|(lnkxxp分别对两个未知参数求偏导,得)(2121)

(1)|(ln2122212kkkxxxp因此最大似然估计是以下方程组的解Nkkx1120)(10)(11122212NkNkkx解得:

NkkxN111222)(1kxN九:

最邻近决策和K-近邻决策的思想是什么最邻近决策:

对于一个新样本,把它逐一与已知样本比较,找出距离最新样本最近的已知样本,以该样本的类别作为新样本的类别,这就是最邻近法已知样本集Ns=(1x,1).(Nx,1),其中,ix是样本i的特征向量,i是它对应的类别,设有C个类,即i1,2C。

定义两个样本间的距离度量(ix,jx),比如可采用欧式距离(ix,jx)=|ix-jx|。

对未知样本x,求Ns中与之距离最近的样本,设为x(对应的类别为),即(x,x)=),(min.2,1jNjxx则将x决策为类。

这种决策方法称为最邻近决策最近邻法渐进错误率P,Bayes错误率*P,C类别数,则*P=P=*P(2-*1pcc)即:

P最坏不会超出两倍的*P,最好有可能接近或达到*PK近邻决策选择前若干个离新样本最近的已知样本,用他们的类别投票来决定新样本的类别,习惯把参加投票的近邻样本个数记作k,称作k近邻法设有N个已知样本属于C个类iw,i=1C,考察新样本x在这些样本的前K个近邻,设其中有ik个属于iw类,则iw类的判别函数就是)(xgi=ik,i=1C决策规则是:

若)(xgk=)(max.1xgiCi则xkwk-近邻法仍满足的上界关系但随着k的增加,上界将逐渐降低,当k趋于无穷大时,上界和下界碰到一起,k近邻法就达到了贝叶斯错误率十:

主成分分析方法的基本原理是什么?

推导变换矩阵的组成基本原理1从一组特征中计算出一组按重要性从大到小排列的新特征,他们是原有特征的线性组合,并且相互之间是互不相关的。

2记1xpx为p个原始特征,设新特征i,i=1p是这些原始特征的线性组合i=pjTijijxaxa1为了统一i的尺度要求线性组合系数的模为1,即Tiaia=1则TAx其中是由新特征i组成的向量,A是特征变换矩阵。

要求解的是最优的正交变换A它使新特征i的方差达到极值变换矩阵A的组成1A=(1apa)最优的1a是的最大本征值对应的本征向量,2a第二大变换矩阵A的各个列向量是由的正交归一的本征向量组成的,因此TA=1A,即A是正交矩阵。

2.1a,第一主成分1=pjTjijxaxa11(方差最大,模为1)方差:

var

(1)=E21-E12=11axxaETT-11axExaETT=Ta11a其中是x的协方差矩阵。

E是数学期望要在约束条件Ta11a=1下最大化1的方差,等价于下列拉格朗日函数的极值)(1af=Ta11a-v(Ta11a-1),v是拉格朗日乘子将其对1a求导,并令他等于零,得1a满足1a=v1a这是的特征方程,即1a一定是的本征向量,v是对应的本征值则var

(1)=v3.第二主成分2满足:

与1同样的方差最大,模为1,与1不相关即E21-E2E1=0,代入i=pjjijxa1=Tiax整理得:

Ta21a=0,又1a=v1a且不相关的要求等价于2a和1a正交:

Ta21a=0在Ta21a=0和Ta22a=1的约束条件下最大化2的方差可得2a是的第二大本征值对应的本征向量。

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 解决方案 > 学习计划

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2