应用多元分析期末复习练习题.docx

上传人:b****2 文档编号:11827782 上传时间:2023-06-02 格式:DOCX 页数:21 大小:171.34KB
下载 相关 举报
应用多元分析期末复习练习题.docx_第1页
第1页 / 共21页
应用多元分析期末复习练习题.docx_第2页
第2页 / 共21页
应用多元分析期末复习练习题.docx_第3页
第3页 / 共21页
应用多元分析期末复习练习题.docx_第4页
第4页 / 共21页
应用多元分析期末复习练习题.docx_第5页
第5页 / 共21页
应用多元分析期末复习练习题.docx_第6页
第6页 / 共21页
应用多元分析期末复习练习题.docx_第7页
第7页 / 共21页
应用多元分析期末复习练习题.docx_第8页
第8页 / 共21页
应用多元分析期末复习练习题.docx_第9页
第9页 / 共21页
应用多元分析期末复习练习题.docx_第10页
第10页 / 共21页
应用多元分析期末复习练习题.docx_第11页
第11页 / 共21页
应用多元分析期末复习练习题.docx_第12页
第12页 / 共21页
应用多元分析期末复习练习题.docx_第13页
第13页 / 共21页
应用多元分析期末复习练习题.docx_第14页
第14页 / 共21页
应用多元分析期末复习练习题.docx_第15页
第15页 / 共21页
应用多元分析期末复习练习题.docx_第16页
第16页 / 共21页
应用多元分析期末复习练习题.docx_第17页
第17页 / 共21页
应用多元分析期末复习练习题.docx_第18页
第18页 / 共21页
应用多元分析期末复习练习题.docx_第19页
第19页 / 共21页
应用多元分析期末复习练习题.docx_第20页
第20页 / 共21页
亲,该文档总共21页,到这儿已超出免费预览范围,如果喜欢就下载吧!
下载资源
资源描述

应用多元分析期末复习练习题.docx

《应用多元分析期末复习练习题.docx》由会员分享,可在线阅读,更多相关《应用多元分析期末复习练习题.docx(21页珍藏版)》请在冰点文库上搜索。

应用多元分析期末复习练习题.docx

应用多元分析期末复习练习题

 

多元复习

1、多元统计分析是运用数理统计方法来解决多指标问题的理论和方法。

2、多元分析研究的是多个随机变量及相关关系的统计总体。

3、如果A与B是两个PXP维的方阵,贝UAB与BA有完全相同的特征值。

4、随机向量X的协方差矩阵一定是非负定矩阵。

5、若A为P阶对称矩阵,则存在正交矩阵T与对角矩阵人,则三者的关系有A=TAT'

6、设x是多元向量,服从正太分布即X〜叽農&漏,a为P维常熟向量,则其线性型a'服从一元正态分布,即a'x〜打赢。

7、方差相同的两个随机变量的差与和是不相关关系。

8、协方差和相关系数是变量间离散程度的一种变量,并不能刻画变量间可能存在的关联程度的关系。

9、变量的类型按尺度划分为间隔变量、有序变量、名义变量类型。

10、公共因子方差与特殊因子方差之和为1。

11、聚类分析是建立一种分析方法,它将一批样品或变量按照它们在性质上的亲疏关系进行科学的分类。

12、聚类分析是分析如何对样品或变量进行量化分析,通常分为Q型聚类和R型聚类。

13、聚类分析中Q型聚类是对样品进行聚类,R型聚类是对变量进行聚类。

14、进行判别分析时,通常指定一种判别规则用来判定新样品的归属,常见的判别准则有:

费希尔判别准贝,贝叶斯判别准则。

15、费希尔判别法就是要找P个变量组成的线性判别函数使得各组内点的离差尽可能接近,而不同组间的点尽可能疏远。

16、当X〜澧紺:

直,则加卡斜囂选二門服从卡方分布,即:

玄=产「心二)〜逊

18、霍特林统计量表达式:

秆「代茂-陆】込7

19、两个变量间的平方马氏距离:

沪伕,叭匸弊一疔旷汽更疥;总体的马氏距离:

上:

一1上一A0-1:

o

21、几个变量间服从正态分布,各自独立,样品的均值向量服从正态分布。

22、从代数观点看主成分是P个原始相关变量的线性组合。

23、变量共同度是指因子载荷矩阵中的第i行元素的平方和。

24、因子分析是指把每个原始变量分为两部分因素,一部分是公共因子,另一部分是特殊因子。

1、判别分析的目标。

答:

判别分析的目标有两个:

一是根据已知所属组的样本给出判别函数,并制定判别规则,再依此判断(或

预测)每一新样品应归属的组别。

另一是用图形法或代数法描述各组样品之间的差异性,尽可能地分离开各组。

2、费希尔判别的基本思想、目的、主要方法有哪些?

答:

费希尔判别的基本思想是投影(或降维),用几个费希尔判别函数或典型变量来代替P个原始变量,以

达到降维的目的。

并根据这r个判别函数对样品的归属作出判别或将各组分离。

各个判别函数都具有单

位方差,且彼此不相关。

判别函数的方向并不正交,而作图时仍将它们画成直角坐标系,从直观的几何图上进行判别,区别各组,这是费希尔判别的重要应用。

为作图时的需要,通常取判别函数个数r=2

或3。

3、聚类分析与判别分析的区别与联系。

答:

判别分析和聚类分析都是研究事物分类(或组)的基本方法,但它们却有着不同的分类目的,彼此之间既有本质的区别又有一定的联系。

它们的本质区别在于:

在于判别分析中,组的数目是已知的,我们将样品分配给事先已定义好的组(或

类)之一;而聚类分析中,无论是类的数目还是类的本身在事先都是未知的。

它们的联系在于:

如果组不是已有的,则对组的事先了解和形成有时可以通过聚类分析探索得到;还有,聚类分析的效果往往也可以通过由前两个(或三个)费希尔判别函数得分产生的散点图(或旋转图)从直觉上进行评估。

4、主成分的应用分类。

答:

主成分的应用可分为两类:

(1)在一些应用中,这些主成分本身就是分析的目标,此时需要给(用来

降维的)前几个只成分一个符合实际背景和意义的解释,以明白其大致的含义。

(2)在更多的另一些

应用中,主成分只是要达到目标的一个中间结果(或步骤),而非目标本身。

5、主成分与原始变量间的关系。

(1)主成分保留了原始变量绝大多数信息。

(2)主成分的个数远远少于原始变量的数目。

(3)各个主成分之间互不相关。

(4)每个主成分都是原始变量的线性组合。

6、因子分析与主成分分析的区别与联系。

答:

(1)主成分涉及的只是一般的变量变换,它不能作为一个模型来描述,本质上几乎不需要任何假定;而因子分析需要构造一个因子模型,并伴随有几个关键性的假定。

(2)主成分是原始变量的线性组合;而在因子分析中,原始变量是因子的线性组合,但因子却一般不能表示为原始变量的线性组合。

(3)在主成分分析中,强调的是用少数几个主成分解释总方差;而因子分析中,强调的是用少数几个因子去描述协方差或相关关系。

(4)主成分的解释是唯一的(除非含有相同的特征值或特征向量为相反符号);而因子的解可以有很多,表现的比较灵活(主要体现在因子旋转上)。

这种灵活性使得变量在降维后更易得到解释,这是因子分析比主成分分析更广泛应用的一个重要原因。

(5)主成分不会因其提取个数的改变而变化,但因子分析往往会随模型中因子个数的不同而变化。

1、正交因子模型的不受单位的影响。

证明:

将x的单位做变化,通常是作一变换x*cx,这里的

1,2,p,于是

cdiag(c1,c2,cp),ci0,i

xccAfc

 

***

x**A*f

这个模型能满足假定式的假定,即:

E(f)0

*

E(*)0

V(f)I

**

V(*)D*

cov(f,*)cov(f,)c0

 

因此,单位变换后新的模型仍为正交因子模型。

2、正交因子模型的因子载荷是不唯一的。

证明:

T为任意

mxm正交矩阵,令A

*

AT,f

Tf,则模型x

Af

能表示为

X

*

Af

*

因为

*

:

E(f)

TE(f)

0

*

V(f)

TV(f)

TTTI

CoVf*,

)E(f

*

TE(f,

0

E(f)

0

E)

0

所以仍满足条件:

V(f)

I

V()

D

diag((

2

1,

2

2,・・・

.p)

cov(f,

)E(f,

0

V(Af)

V()

AV(f)AV(

AA

D或xA*f*

都可以看出也

可以分解为AAd

显然,因子载荷矩阵A不是唯一的。

3、性质(7)设X〜Np(,),0,则(X)1(x)〜x2(p)。

1

证明:

令yT(x),于是y〜Np(0,1)

所以yi,y2,y3••…yp独立同分布于n(o,1)

所以由卡方分布的定义知:

12222

(x)(X)yyyiy?

■-y〜x(p)

互相独立。

从而f(X1,,X2)f1(X1)f2(X2),f(X1,,X3)f1(X1)f3(X3),f(X2,X3)f2(X2)f3(X3),

f(X1JX2,X3)f1(Xjf2(X2)f3(X3)

所以X1,X2,x3两两独立但不互相独立。

5、设P维随机向量X的向量和协方差矩阵分别为卩和刀,求证:

(1)E(xx)

(2)

E(xAx)

Etr(xxA)

tr(A)

A

(3)

假设

1,2I

和AI

11

P

E(xAx).

2tr(A)

p1。

证明:

(1)

V(x)E(x

)(x

E(xxx

x

E(xx)

试禾U用

(2)的结果证明

所以:

E(xx)

(2)E(xAx)Etr(xAx)

Etr(xxA)

trE(xxA)trE(xx)A

tr(

)Atr(A)tr(

A)tr(A)

(3)由

(2)知E(xAx)tr(A)A,

11

1(]巨)1

2(11

1111

2(P

所以:

E(xAx)

2

tr(A)

2

tr(2IA)

2

tr(A)tr(I

*)

tr(I)占tr(11)

P-tr(11)P丄PP1

PP

 

6、性质(3)设X〜NP(,),y=cx+b,其中c为rxp维常数矩阵,b为r维常数向量则y〜Nr(b,cc)。

 

从而由性质

(2)的必要性知:

acx是一元正态变量,所以ay是一元正态变量;

再由性质

(2)的充分性知:

y是一个r元正态变量,又由于E(y)cE(x)bcb

V(y)cV(x)ccc

因而:

y〜Nr(b,cc)

7、设X〜NP(,),a为P维常数向量,则ax〜N(a,aa)。

 

E(y)E(ax)aE(x)a

V(y)aV(x)aaa

所以:

ax〜N(a,aa)

 

x1x2(1,1)x服从一

元正态分布。

 

证明:

E(X1

X2)(1,1)

 

V(XiX2)(1,

2

1)1

1

2

1212

211

2

1212

即XiX2〜N1

2

2,1

2

2

212)

3

0

0

9、设X〜N3(,),其中

0

5

1则X2和X3不独立,

x2,x3)独立。

0

1

1

证明:

因为V(x2,x3)

0,所以x

2和X3

不独立;

 

因为VX1,

(X2,X3)

0,所以

x2,x3)独立。

0

1、已知初始距离

D(dij)44

10

要求用最短距离法进行聚类,并画出聚类树形图。

112

0

53

40

X1

X2

1

20

7

2

18

10

3

10

5

4

4

5

5

4

3

2、设抽取5个样品,每个样品观察2个指标:

x1:

您每月大约喝多少啤酒;

x2:

您对“饮酒是人生的快乐这句话的看法如何?

观察数据如表所示:

请用最短距离法进行聚类,并画出聚类树形图。

农£u£:

TyfTJGlrf^xdcHIs十◎—TyJH-

岩H.6•-卜、OL5uF玉、

^"、6.0、^4卩4、

5)G"5>

rJ一

r

r

G5F4Y5gs:

2fa0

o—No

0

oQf/BOe・;Q二0

b.ok

uXAtHFs

8-.rpTbz”2

QGQcso®-一6一2FTrG>s

S-TuMJ7ac-G〔$「护

 

om4$

4@勻、炉却蛋曲4」

 

3、例6.3.1设有五个样品,每个只测量了一个指标,分别是1、2、6、8、11,使用最短距离法将它们分类。

解:

记G={1},G2={2},G3={6},G4={8},G5={11},样品间采用绝对值距离。

D(o)

G1

G2

G3

G4

G5

G1

0

G2

1

0

G3

5

4

0

G4

7

6

2

0

G5

10

9

5

3

0

D⑴

 

G6

G3

G4

G5

G6

0

G3

4

0

G4

6

2

0

G5

9

5

3

0

其中G6=G1UG2

D

(2)

G6

G7

G5

G6

0

G7

4

0

G5

9

3

0

其中G7=G3UG4

D(3)

G6

G8

G6

0

G8

4

0

其中G6=G1UG2

G严{1}

G计⑵——

G产{创GtG9

G产⑻G8

G产{11}

!

]扌]〈

01234D

最短距离法树形图

4、为了研究辽宁省等5省区某年城镇居民生活消费的分布规律,根据调查资料做类型划分

省份

X1

X2

X3

X4

X5

X6

X7

X8

辽宁

7.90

39.77

8.49

12.94

19.27

11.05

2.04

13.29

浙江

7.68

50.37

11.35

13.30

19.25

14.59

2.75

14.87

河南

9.42

27.93

8.20

8.14

16.17

9.42

1.55

9.76

甘肃

9.16

27.98

9.01

9.32

15.99

9.10

1.82

11.35

青海

10.06

28.64

10.52

10.05

16.18

8.39

1.96

10.81

解:

(?

尸{辽宁}■。

尸{浙江{河南“G円甘弗},GH青海}采用欧氏距离:

rfu=1(7.9-7.68+<39-77-5037)2+<8.49-1135)^(12,94-

13J)z4(19.27-1^25):

+(11.05-14-59)2+(2.04-2.75):

-H13.29"

14.87)2]05=11.67

al3-13.80tf|4-13J2tft5-L2.80血*一24.63鸟厂2上06(/:

5~23.54鸟斗=2*2褂羽=3・51rf45=2,21

12345

 

11.67

0

1S.80

24.63

0

612

24.06

2.20

Q

12,80

23.54

3.51

2.2L

0

丿

河南与甘肃的距离最近.先将一番d和心合为一类G6=[G^GJ

 

“62之(3/)2=min{d23』24}=24.06

d65=〃(3,)5=miu{d35045}=2・21

6125

6

r0

D&=1

13.120

2

24.0611.670

5

2.2112.8023.540,

d6i=%i)l=miu{di3』ij}=13・12

河南.甘肃与青海并为一新类

Gt={Gs・GJ={G)・g49Gs}

 

〃7i=d(3,s=miii{Wi30i44i5}=12・8O

d72=d(3A5)2=min{〃2302M25}=23・54

 

D3=7

1

0

12.80

G3={GyG2}

223.54

0

11.670

ll

 

 

tf78=min{tf71,tf72}=12.80

78

厂*1

D尸70

812.80

J丿

河南3

甘肃4

青海5

辽宁1

浙江2

5、例1对某地区农村的6名2周岁男婴的身高、胸围、上半臂围进行测量得样本数据如表1所示。

据以往资料该地区城市2岁男婴的这三个指标的均值^=(90,58,16),现欲在多元正态性假定下检验该地区

农村男婴是否与城市男婴有相同的均值。

这是假设检验问题:

Ho:

尸叽Hi:

表1某地区农村男婴的体格测量数据

编号

身高(cm)

胸围(cm)

上半臂围(cm)

1

78

60.6

16.5

2

76

58.1

12.5

3

92

63.2

14.5

4

81

59.0

14.0

5

81

60.8

15.5

6

84

59.5

14.0

解:

82.0

8.0

31.600

8.0400.500

X60.2,X比

2.2,S

8.040

3.仃21.310

14.5

1.5

0.500

1.3101.900

11

S123.13848

4.3107

14.6210

8.9464

14.6210

59.7900

37.3760

8.9464

37.3760

35.5936

T2nX心S1

X心

670.0741

420.445

查表得F°.01(3,3)=29.5,于是

235

T°2°1F

0.013,3

147.5

故在显著性水平a=0.01下,拒绝原假设Ho,即认为农村与城市的2周岁

男婴上述三个指标的均值有显著差异(p=0.002)。

120

6、例7.2.1设x=(xi,x2,x3)的协方差矩阵为艺250

0

0

其特征值为:

7=5.83,7=2.00,

7=0.17

相应的特征向量为

:

0.383

0

0.924

ti

0.924,t2

0,

t3

0.383

0.000

1

0.000

若只取一个主成分,则贡献率为:

5.83/(5.83+2.00+0.17)=0.72875=72.875%

yi及(yi,y2)对每个原始变量的贡献率:

i

Aa

1

0.925

0.855

0.000

0.855

2

-C.998

0.996

0.000

0.996

3

nnon

EJ.*.:

■<~~—

0.000

■■t_<-lr—I

1.000

1.000

可见,yi对第三个变量的贡献率为零,这是因为X3与xi和x2都不相关,在yi中

未包含一点有关x3的信息,这时仅取一个主成分就显得不够了,故应再取y2,

此时累计贡献率为

(5.83+2.00)/8=97.875%

I6230

7、例7.2.2设x=(xi,x2,X3)的协方差矩阵为艺2I4

304I00

经计算,工的特征值及特征向量为:

入1=109.793,冶6.469,73=0.738

0.3050.9440.127

ti0.041,t20.120,t30.992

0.9510.3080.002

相应的主成分分别为:

yi=0.305xi+0.041X2+0.951X3

y2=0.944xi+0.120x2-0.308x3y3=-0.127xi+0.992x2-0.002x3

可见,方差大的原始变量X3在很大程度上控制了第一主成分yi,方差小的原始变量X2

几乎完全控制了第三主成分y3,方差介于中间的X1则基本控制了第二主成分y2。

yi

的贡献率为:

117

坦至0.938

12

这么高的贡献率首先归因于X3的方差比X1和X2的方差大得多,其次是X1,X2,X3相互之间存

在着一定的相关性。

y3的特征值相对很小,表明X1,X2,X3之间有这样一个线性依赖关系:

-0.127x1+0.992x2-0.002x3弋

前两个主成分的累积贡献率:

x2x3

解:

令y1(23),y2x1

x1

y1

0

1

1

1

2

E

1

0

0

0

1

y2

1

0

2

2

3

Vy1

0

1

1

16

4

2

0

1

1

10

6

16

1

0

0

4

4

1

1

0

0

6

16

20

0

y2

1

0

2

2

1

4

1

0

2

16

20

40

1x1

0x2

2x3

x2x3所以由性质(6)知x12x3与,(23)不独立。

x1

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 解决方案 > 学习计划

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2