统计专业实验实验3多元正态总体检验3Word格式.docx
《统计专业实验实验3多元正态总体检验3Word格式.docx》由会员分享,可在线阅读,更多相关《统计专业实验实验3多元正态总体检验3Word格式.docx(25页珍藏版)》请在冰点文库上搜索。
实验运行程序、基本步骤及运行结果:
实验1
假设检验问题是:
H0:
西部9个省区城镇居民大类消费与全国平均水平有显著差异
H1:
西部9个省区城镇居民大类消费与全国平均水平无显著差异
首先在所给的表格中选取食品、衣着等8个总体指标,将其他不是西部的城市删掉,
食品
衣着
居住
家庭设备用品及服务
医疗保健
交通和通信
教育文化娱乐服务
杂项商品和服务
重庆
4418
1294.3
1096.82
842.09
878.25
1044.4
1267
305.6
四川
4255
1042.5
819.28
590.51
564.93
1121.5
947.01
338.03
贵州
3598
851.5
836.54
525.7
471.39
871.15
934.73
260.27
云南
4272
1026.5
739.2
331.94
606.86
1216.5
732.95
150.42
西藏
4263
1011.8
634.94
310.22
317.08
966.74
419.59
400.38
陕西
3586
1047.6
1007.68
618.16
862.7
967.52
1281.6
400.68
甘肃
3184
1022.6
846.26
546.23
654.82
817.17
936.33
301.4
青海
3316
945.14
802.73
538.54
610.02
787.63
880.86
311.72
宁夏
3353
1178.9
1069.15
596.81
816.87
1096.3
1043.7
403.71
新疆
3236
1245
781.9
535.31
643.48
1003.9
812.36
411.63
计算出西部的地区各个指标的平均值和西部个指标与全国水平的差值,就得到一张关于西部地区在这8个指标上的具体数据,然后用公式s=MMULT(TRANSPOSE(X-Z),X-Z),就可以求得离差阵s,得到数据如下:
用公式s^-1==MINVERSE(S)便得到离差阵的逆矩阵,得到:
接着计算出T平方统计量,公式:
T^2==n*(n-1)*MMULT(MMULT(Z_Z0,S_1),TRANSPOSE(Z_Z0)),用公式将T平方统计量转化为F统计量F==(n-p)/((n-1)*p)*G15得F=39.364444,最后通过查表得到F的临界值
,在0.05的显著水平下,F统计量大于F0.05临界值,拒绝原假设,即西部9个省区城镇居民大类消费情况与全国平均水平二者之间有明显差异;
但在在0.01的显著水平下,F统计量远小于F0.01临界值,无法拒绝原假设,即西部9个省区城镇居民大类消费情况与全国平均水平二者之间没有显著差异。
实验2
n=13,m=15,n不等于m,设两组样本来自正态总体X和Y,且两组样本相互独立,协差阵相等但未知。
假设检验问题:
由于有共同未知协差阵,故检验统计量为
其中:
1、分析资料对应的n=11,m=15,p=4。
2、利用函数AVERAGE计算X的各指标的平均值,即得到X的平均值向量转置矩阵
=Mx,=;
同理计算Y的平均值,既得Y的平均值向量转置矩阵
=My;
计算差值阵
,得:
3计算X的离差阵
,输入公式=MMULT(TRANSPOSE(X-Mx),X-Mx),计算Y的离差阵
,输入公式=MMULT(TRANSPOSE(Y-My),Y-My)计算
4计算S的逆矩阵,输入公式=MINVERSE(S)
5计算统计量T2=(n+m-2)*(n*m)/(n+m)*MMULT(MMULT(d,S_1),TRANSPOSE(d),计算统计量F=((n+m-2)-p+1)/((n+m-2)*p)*I6;
6计算临界值(取显著水平a=0.05)F0.05=FINV(0.05,p,n+m-p+1)。
数据如下:
行业
公司
净资产收益率
总资产报酬率
资产负债率
总资产周转率
1
深能源A
16.85
12.35
42.32
0.37
深南电A
22
15.3
46.51
0.76
富龙热力
8.97
7.98
30.36
0.17
穗恒运A
10.25
8.99
40.44
0.46
粤电力A
20.81
20
35.87
0.43
韶能股份
8.86
7.52
27.89
0.24
惠天热电
10.98
7.94
49.3
0.36
原水股份
8.85
8.88
36.2
0.13
大连热电
9.03
7.41
46.89
0.28
龙电股份
12.07
8.7
16.81
华银电力
6.85
6.12
41.93
2
长春经开
9.85
10.5
31.23
0.34
兴业房产
1.07
1.52
66.91
0.21
金丰投资
19.44
7.01
73.34
0.26
新黄埔
7.61
5.92
39.64
0.16
浦东金桥
4.24
3.99
37.3
0.2
外高桥
1.673
1.92
49.05
0.03
中华企业
8.78
6.28
57.42
渝开发A
2.24
63.4
0.09
辽房天
8.12
3.98
69.1
0.1
粤宏远A
0.42
1.16
37.42
ST中福
5.17
6.62
65.48
检验过程
n
11
m
p
4
T2
21.76315564
F
4.624670573
F0.05
2.895107308
F0.01
4.500257699
7、分析:
由上可知,F统计量大于F0.05临界值,所以拒绝原假设,即我国上市公司电力、煤气及水生产供应行业和房地产行业在经营绩效(净资产收益率、总资产报酬率、资产负债率和总资产周转率)方面存在明显差异。
实验3:
思路:
提出零假设―选择检验统计量―计算检验统计量的观测值及概率p值―给出显著性水平做出假设,假设检验问题:
H0:
不同温度和时间对产品产出率没有显著影响;
不同度和时间对产品产出率有显著影响;
(1)温度和时间对总体产出率的影响。
操作:
选择菜单Analyze-GeneralLinearModel-Univariate;
再分别选择“总产出率”到随机变量框中,选择“温度”“时间”到控制变量框中,得到结果如下:
TestsofBetween-SubjectsEffects
DependentVariable:
三种产品和
Source
TypeIIISumofSquares
df
MeanSquare
Sig.
CorrectedModel
1891.703a
8
236.463
2.194E3
.000
Intercept
53314.186
4.948E5
温度
480.686
240.343
2.230E3
时间
328.868
164.434
1.526E3
温度*时间
1082.150
270.537
2.511E3
Error
.970
9
.108
Total
55206.859
18
CorrectedTotal
1892.673
17
a.RSquared=.999(AdjustedRSquared=.999)
可以看出,观测变量的总变差为1892.673,它被分解为四个部分,分别由温度不同引起的变差480.686和时间引起的变差328.868,由不同温度和时间交互作用引起的变差1082.150,由随机因素引起的变差0.97。
这些变差除以各自的自由度后,得到各自的均方,F统计量以及对应的p值。
显然,温度,时间,温度*时间的F值对应的概率p值都为0,都小于0.05,所以拒绝原假设,即不同温度和不同时间对产品总产率都有显著影响。
(2)温度和时间对产品1的影响:
基本操作:
再分别选择“产品1”到随机变量框中,选择“温度”“时间”到控制变量框中,其结果如下:
丹参素(mg/g)
78.381a
9.798
4.120E3
420.113
1.767E5
26.824
13.412
5.640E3
28.478
14.239
5.988E3
23.079
5.770
2.427E3
.021
.002
498.515
78.402
a.RSquared=1.000(AdjustedRSquared=.999)
可以看出,观测变量的总变差为78.402,它被分解为四个部分,分别由温度不同引起的变差26.824和时间引起的变差28.478,由不同温度和时间交互作用引起的变差23.079,由随机因素引起的变差.021。
(3)温度和时间对产品2的影响:
再分别选择“产品2”到随机变量框中,选择“温度”“时间”到控制变量框中,结果如下:
原儿茶醛(mg/g)
3.092a
.387
828.262
10.982
2.353E4
1.470
.735
1.575E3
1.059
.529
1.135E3
.563
.141
301.619
.004
14.079
3.096
a.RSquared=.999(AdjustedRSquared=.997)
由上可以看出,观测变量的总变差为3.096,它被分解为四个部分,分别由温度不同引起的变差1.470和时间引起的变差1.059,由不同温度和时间交互作用引起的变差.563,由随机因素引起的变差0.004。
(4)温度和时间对产品3的影响:
再分别选择“产品3”到随机变量框中,选择“温度”“时间”到控制变量框中,结果如下:
没育得碱产出率%
1219.538a
152.442
1.294E3
42885.442
3.641E5
251.858
125.929
1.069E3
138.791
69.396
589.208
828.889
207.222
1.759E3
1.060
.118
44106.040
1220.598
a.RSquared=.999(AdjustedRSquared=.998)
可以看出,观测变量的总变差为1220.598,它被分解为四个部分,分别由温度不同引起的变差251.858和时间引起的变差138.791,由不同温度和时间交互作用引起的变差828.889,由随机因素引起的变差1.060。
显然,温度,时间,温度*时间的F值对应的概率p值都为0,都小于0.05,所以拒绝原假设,即不同温度和不同时间对产品总产率都有显著影响.
继续阅读