matlab及多元统计分析Word文档下载推荐.docx
《matlab及多元统计分析Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《matlab及多元统计分析Word文档下载推荐.docx(43页珍藏版)》请在冰点文库上搜索。
,k)'
);
*junzhi=*junzhi'
S=((n-1)^(-1))*A
输出结果*junzhi=
82.0000
60.2000
14.5000
S=
31.60008.04000.5000
8.04003.17201.3100
0.50001.31001.900
然后u=[90;
58;
16];
t2=n*(*junzhi-u)'
*(S^(-1))*(*junzhi-u)
f=((n-p)/(p*(n-1)))*t2
输出结果t2=
420.4447
f=
84.0889
所以
=420.4447
=84.0889
查表得F3,3(0.05)=9.28<
84.0889F3,3(0.01)=29.5<
84.0889
因此在a=0.05或a=0.01时拒绝
假设
3.2相应于表3.1再给出该地区9名2周岁女婴的三项指标的测量数据如表3.2所示。
假设女婴的测量数据Y(a)(a=1,…,9)来自正态总体N3(,∑)的随机样本。
试检验2周岁男婴与女婴的均值是有无显著差异
表3.2*地区农村2周岁女婴体格测量数据
女婴
80
58.4
75
59.2
15
60.3
57.4
13
79
7
58
8
64
55.5
11
9
1.预备知识
有共同未知协方差阵
时
在
成立的情况下且两样本独立
给定检验水平
,查
分布表,使
,可确定出临界值
,再用样本值计算出
,若
,则否定
,否则接受
。
由上一题知道
*junzhi=
S*=
31.60008.04000.5000
类似程序
*junzhi=[82;
60.2;
14.5];
S*=[31.68.040.5;
8.043.17201.3100;
0.51.311.9];
n=6;
y=[80.058.414.0;
75.059.215;
7860.315;
75.057.413.0;
7959.514.0;
7858.114.5;
7558.012.5;
6455.511.0;
8059.212.5];
[m,p]=size(y);
m;
yjunzhi=(1/m)*sum(y(i,:
z=rand(p,m);
m
z(:
j)=y(j,:
-yjunzhi'
z=z;
B=zeros(p,p);
B=B+(z(:
k)*z(:
Sy=((m-1)^(-1))*B;
yjunzhi=yjunzhi'
S=(1/(n+m-2))*((n-1)*S*+(m-1)*Sy)
得到结果yjunzhi=
76.0000
58.4000
13.5000
27.23086.56152.8462
6.56152.43231.4000
2.84621.40001.8462
然后
t=((n*m)/(n+m))*((*junzhi-yjunzhi)'
)*(S^(-1))*(*junzhi-yjunzhi)
F=((n+m-p-1)/(p*(n+m-2)))*t
输出结果t=5.3117
F=1.4982
查表得F0.05(3,11)=3.59>
1.4982F0.01(3,11)=6.22>
1.4982
因此在a=0.05或a=0.01时接受
第四章习题
4.1下表列举*年级任取12名学生的5门主课的期末考试成绩,试绘制学生序号为1、2、11、12的轮廓图、雷达图。
表4.1学生学习成绩
序号
政治
语文
外语
数学
物理
99
94
93
100
88
96
97
98
91
72
90
82
73
89
83
68
87
60
10
95
62
39
43
67
12
85
50
34
37
解我们只需要数据如下
1利用matlab画轮廓图
程序*=1:
5;
y1=[999493100100];
y2=[9988969997];
y3=[7672436778];
y4=[8575503437];
plot(*,y1,'
k-o'
'
linewidth'
1);
holdon;
plot(*,y2,'
r--*'
2);
plot(*,y3,'
b-.p'
holdon
plot(*,y4,'
k--o'
*label('
学科'
ylabel('
分数'
legend('
1'
2'
11'
12'
set(gca,'
*tick'
[12345])
*ticklabel'
{'
政治'
语文'
外语'
数学'
物理'
})
输出结果
2利用matlab画雷达图
此图用matlab画起来比较复杂
首先我们修改polar函数
在命令窗口输入editpolar结果会出现polar函数的程序
其中我们把
%plotspokes
th=(1:
6)*2*pi/12;
cst=cos(th);
snt=sin(th);
cs=[-cst;
cst];
sn=[-snt;
snt];
line(rma**cs,rma**sn,'
linestyle'
ls,'
color'
tc,'
1,...
'
handlevisibility'
off'
parent'
ca*)
修改为
3)*2*pi/6;
再将后面的所有程序中的30改为72
然后另存为work中并命名为mypolar.m
然后输入程序
*=[0:
pi/2.5:
2*pi];
y1=[99949310010099];
y2=[998896999799];
y3=[767243677876];
y4=[857550343785];
mypolar(*,y1,'
b'
mypolar(*,y2,'
m'
mypolar(*,y3,'
g'
mypolar(*,y4,'
y'
)
第五章聚类分析
习题5.3.下表给出我国历年职工人数(单位:
万人),请用有序样品的fisher法聚类。
年份
全民所有制
集体所有制
1952
1580
23
1954
1881
121
1956
2423
554
1958
4532
662
1960
5044
925
1962
3303
1012
1964
3465
1136
1966
3939
1264
1968
4170
1334
1970
4792
1424
1972
5610
1524
1974
6007
1644
1976
6860
1813
1978
7451
2048
1980
8019
2425
解第一步数据标准化后计算直径D
程序:
*=[158023;
1881121;
2423554;
4532662;
5044925;
33031012;
34651136;
...
39391264;
41701334;
47921424;
56101524;
60071644;
68601813;
74512048;
80192425];
stdr=std(*);
[n,m]=size(*);
*=*./stdr(ones(n,1),:
[np]=size(*);
D=zeros(n,n);
fori=1:
forj=1:
ifi<
j
t=i:
j;
*gjunzhi=(1/(j-i+1))*sum(*(t,:
y=zeros(1,j-i+1);
fors=i:
y(s)=(*(s,:
)-*gjunzhi)*(*(s,:
)-*gjunzhi)'
end
s=i:
D(i,j)=sum(y);
else
D(i,j)=0;
D=D'
输出结果矩阵太大,所以用e*cel处理了一下
D=
0.022567
0.44898
0.24578
2.0632
1.3981
0.60024
3.9256
2.651
1.1802
0.11098
4.5022
3.0091
1.4238
0.56953
0.40862
5.179
3.4353
1.6648
0.82576
0.53831
0.02044
6.0823
4.021
1.976
1.023
0.63343
0.12781
0.047757
7.0311
4.6502
2.3255
1.2313
0.755
0.26341
0.11275
0.012456
8.3322
5.5762
2.9094
1.6045
1.0531
0.60619
0.33881
0.13122
0.060032
10.312
7.1034
4.0117
2.4126
1.7772
1.3793
0.92314
0.52664
0.31541
0.099401
12.696
8.9972
5.4422
3.5114
2.7548
2.3553
1.669
1.0457
0.65496
0.25632
0.03671
16.291
11.998
7.8688
5.5038
4.5686
4.1193
3.1032
2.1468
1.4707
0.77122
0.30858
0.12762
21.117
16.128
11.321
8.4298
7.2316
6.6487
5.2116
3.8312
2.7793
1.6877
0.8881
0.46016
0.10709
28
22.167
16.528
12.978
11.386
10.546
8.5596
6.627
5.0716
3.4539
2.1748
1.3443
0.59832
0.19951
我们只看下三角所有元素,其它元素理解为空
第二步我们计算损失函数矩阵L
%设计一个把样品分为两类的程序,以及对应最后一类分割点
L=zeros(n-1,n-1);
alp=zeros(n-1,n-1);
form=2:
s=zeros(1,m-1);
forj=2:
s(1,j-1)=D(1,j-1)+D(j,m);
L(m-1,1)=min(s(1,1:
m-1));
m-1
ifL(m-1,1)==s(1,j);
alp(m-1,1)=j+1;
%分为k类
fork=3:
form=k:
s=zeros(1,m-k+1);
forj=k:
s(1,j-k+1)=L(j-2,k-2)+D(j,m);
L(m-1,k-1)=min(s(1,1:
m-k+1));
m-k+1
ifL(m-1,k-1)==s(1,j);
alp(m-1,k-1)=j+k-1;
输出结果这里由于表太大,用e*cel处理一下
L=
0.55996
0.13355
1.0185
1.2747
0.5804
0.15399
0.043007
1.472
0.68777
0.26136
0.15038
1.6803
0.82337
0.39696
0.16644
0.055464
0.032897
2.0535
1.1662
0.71162
0.28521
2.8616
1.7797
0.92277
0.49636
0.26584
0.15486
3.9604
1.9366
1.0797
0.65328
0.32192
0.20315
0.092174
0.01246
5.9528
2.3621
1.4747
1.0202
0.59379
0.0329
8.7188
2.9416
2.0437
1.1868
0.76037
0.42901
0.31024
0.19927
0.05546
alp=
在这里解释一下这两个矩阵行表示分为k类,k从2到15;
列表示样本数m,m从2到15
我们只看下三角所有元素,其它元素理解为空,接下来我们根据结果分析
如果我们要把样品分为三类,则第一个分割点为11,然后第二个分割点为6
得到
第一类:
{1952,1954,1956,1958,1960}
第二类:
{1962,1964,1966,1968,1970}
第三类:
{1972,1974,1976,1978,1980}
第六章判别分析
例6.6对全国30个省市自治区1994年影响各地区经济增长差异的制度变量*1—经济增长率,*2—非国有化水平,*3—开放度,*4—市场化程度作贝叶斯判别分析。
类别
地区
*1
*2
*3
*4
第一组
11.2
57.25
13.47
73.41
14.9
67.19
7.89
73.09
**
14.3
64.74
19.41
72.33
13.5
55.63
20.59
77.33
16.2
75.51
11.06
72.08
57.63
22.51
77.35
20
83.4
15.99
89.5
21.8
68.03
39.42
71.9
19
78.31
83.03
80.75
16
57.11
12.57
60.91
11.9
49.97
30.7
69.2
第二组
8.7
30.72
15.41
60.25
37.65
12.95
66.42
10.1
34.63
7.68
62.96
9.1
56.33
10.3
66.01
13.8
65.23
4.69
64.24
17
15.3
55.62
6.06
54.74
18
55.55
8.02
67.47
62.85
6.4
58.83
10.4
30.01
4.61
60.26
21
8.2
29.28
6.11
50.71
22
11.4
62.88
5.31
61.49
11.6
28.57
9.08
68.47
24
30.23
6.03
25
15.96
8.04
40.26
26
10.9
24.75
8.34
46.01
27
15.6
21.44
28.62
待判样品
80.05
8.81
73.04
29
20.6
81.24
5.37
60.43
30
8.6
42.06
8.88
56.37