厦门大学《应用多元统计分析》试题B答案资料下载.pdf
《厦门大学《应用多元统计分析》试题B答案资料下载.pdf》由会员分享,可在线阅读,更多相关《厦门大学《应用多元统计分析》试题B答案资料下载.pdf(4页珍藏版)》请在冰点文库上搜索。
2)独立同分布于,nXX?
1(,)pN()()()()()()=ccXXXZniiniiiniiiniiicDccDcDD020200,且由()中结论可知()E=Z所以,其中成立。
Z(,)pNcc1(,)ncc=c?
三、简答题1.最短距离法为类与之间的距离为两类最近样品的距离;
最长距离法为类与之间的距离为两类最远样品的距离;
中间距离法用介于最长与最短两者之间的距离;
重心法定义类间距离为两类重心(各类样品的均值)的距离;
类平均法定义类间距离平方为这两类元素两两之间距离平方的平均数;
可变类平均法将G和合并为新类,反映出和之间的距离的影响;
如果中间法的前两项的系数也依赖于iGrGjGiGpjGqGpGqGpqD,那么用可变法如果将和合并为新类;
离差平方和法则是先将个样品各自成一类,然后每次缩小一类,每缩小一类,离差平方和就要增大,选择使方差增加最小的两类合并,直到所有的样品归为一类为止pGqGrGn2.主成分分析与因子分析的相同点:
两者都是一种降维,简化数据的技术;
两种方法的求解过程是类似的,都是从协方差出发,利用特征值、特征向量求解。
不同点:
主成分分析的数学模型本质上是一种线形变换,将原始坐标变换到变异程度最大的方向上,突出数据变异的方向,归纳重要信息。
而因子分析是从现在变量去提取潜在因子的过程。
3.相应分析指受制于某个载体总体的两个因素为A和B,其中因素A包含个水平,r即;
因素12,rAAA?
B包含c个水平,即12,cBBB?
()ijrck。
对这两组因素作随机抽样调查,得到一个的二维列联表,记为rc=K,主要目的是寻求列联表行因素A和列因素B的基本分析特征和它们的最优联立表示。
基本思想为通过列联表的转换,使得因素A和列因素B具有对等性,这样就可以用相同的因子轴同时描述两个因素各个水平的情况,把两个因素的各个水平的状况同时反映到具有相同坐标轴的因子平面上,直观地描述两个因素A和因素B以及各个水平之间的相关关系。
4.典型相关分析是研究两组变量之间相关关系的一种多元统计方法,目的为识别并量化两组变量之间的联系,将两组变量相关关系的分析,转化为一组变量的线性组合与另一组变量线性组合之间的相关关系分析。
基本思想为:
设()()()()()=2111,XX1pX1?
X,()()()()(=212X222,qXX?
X是两个相互关联的随机向量,分别在两组变量中选取若干有代表性的综合变量Ui、Vi,使得每一个综合变量是原变量的线性组合,即()()()()()ipipiixaxa+?
22()iiixaU=11,()()()()()()ip
(1)
(1)()DD
(1)
(2)()1ipxiix2iiibxb+=211bV+aX
(1)=bX+?
=。
在的条件下,使得达到最大,
(1)(aX1)(1(,b)(X2)
(1)aX
(1)bX)、是
(2)
(1)X、
(2)X的第一对典型相关变量。
可以类似的求出各对之间互不相关的第二对、第三对等典型相关变量,至两组变量间的相关性被提取完毕。
这些典型相关变量就反映了
(1)X,
(2)X之间的线性相关情况。
四、计算题1解:
比较样品到两总体的马氏距离的大小:
X()()()()()()05150012-3212-32,2(XX198432255-051112-1243225505-04321510(D,D12=,)XX2211G5-020775-20775511)(X2118121812-21G510(X所以X属于正态总体。
1G2解:
由题意得:
G1G2G3G4G5G10G240G3690G417100G563580D(0)中最小的元素是D14=1,将G1和G4合并成G6,用最长距离法计算新类与其他类之间的距离,得到新的距离矩阵D
(1):
G6G2G3G5G60G270G31090G58350D
(1)中最小的元素是D25=3,将G2和G5合并成G7,用最长距离法计算新类与其他类之间的距离,得到新的距离矩阵D
(2):
G6G7G3G60G780G31090然后将G6和G7合并成G8,最后将G8和G3合并成G9,五个样品聚为一类。
谱系聚类图:
G1G6G4G8G2G7G9G5G3解:
先求三元总体的协方差阵X的特征根,3()()022004222422222222=+=E()()23222121,21=+=解得:
()2121+=对应的单位特征根为=21,22,211T;
22=对应的单位特征根为=22,0,222T;
()2321=对应的单位特征根为=21,22,213T,因此,总体的主成分为:
32133123211X21X22X21Y,X22X22Y,X21X22X21Y+=+=。
4解:
()=1059.06951.07111.03812.04048.08312.04479.01802.08757.03572.06795.09633.11772.08432.05075.06379.04911.05932.07494.00.21866250.0321321l,l,lA建立因子模型:
3213321232111059.06951.07111.03812.04048.08312.04479.01802.08757.0FFFXFFFXFFFX=+=计算共因子的方差贡献得:
3572.0;
6795.0;
9633.12322121=ggg,分别为公共因子对的贡献,是衡量每个公共因子的相对重要性的尺度。
FFF,21X