多元统计方差分析汇编.docx
《多元统计方差分析汇编.docx》由会员分享,可在线阅读,更多相关《多元统计方差分析汇编.docx(12页珍藏版)》请在冰点文库上搜索。
![多元统计方差分析汇编.docx](https://file1.bingdoc.com/fileroot1/2023-7/13/a47afa00-b32f-4478-b34b-16896fb7695e/a47afa00-b32f-4478-b34b-16896fb7695e1.gif)
多元统计方差分析汇编
合肥学院
2015-2016第二学期
《多元统计分析》课程论文
论文题目方差分析
姓名郑宁
学号1307021001
专业数学与应用数学
(1)
成绩
2016.4
方差分析
——以南极的1951-1980的3、6、9、12月的各温度的相关数据为基础,建立方差分析模型进行分析。
摘要:
单因素方差分析(ANOVA)是用来研究一个分类型自变量的不同水平对一个数值型因变量的影响。
方差分析不仅可以提高检验的效率,而且可以提高检验的可靠性。
本论文为了研究南极的1951-1980的3、6、9、12月的各温度有无显著性变化。
根据假设检验的原理,运用SAS软件,以南极的3、6、9、12月各温度作为实验因素,建立方差分析模型,最后在给定的显著性水平下,判断出各实验因素之间有无显著性差异,从而得出实验因素之间的方差分析模型,即确定了南极的1951-1980的3、6、9、12月的温度之间有没有显著性变化。
关键词:
方差分析模型SAS软件
一、问题提出与分析
现有南极的1951-1980的3、6、9、12月各温度的相关数据,请用方差分析研究南极的3、6、9、12月的各温度有没有显著性差异。
数据资料如表1所示,其中,各指标含义如下:
实验因素:
a(表示3月)、b(表示6月)、c(表示9月)、d(表示12月)。
表1南极的1951-1980的3、6、9、12月的各温度数据
1951
a
9
b
4.9
c
4.9
d
8.3
1952
a
7.3
b
4
c
6.6
d
9.5
1953
a
8
b
4.6
c
4.8
d
8.6
1954
a
9.9
b
4.4
c
5.1
d
8.2
1955
a
7.9
b
3.4
c
5.3
d
9.6
1956
a
7.6
b
5.5
c
5.6
d
10
1957
a
10.2
b
4.4
c
6.1
d
8.3
1958
a
8.4
b
4.9
c
6
d
8.7
1959
a
8.3
b
5.1
c
5.6
d
8.4
1960
a
8.6
b
5.4
c
5.7
d
7.9
1961
a
7.5
b
4.8
c
4.9
d
9.3
1962
a
9.2
b
6
c
6
d
9.5
1963
a
8.2
b
4.6
c
5.3
d
7
1964
a
7.9
b
4.8
c
5.6
d
9.4
1965
a
9.4
b
5
c
5.7
d
7.3
1966
a
8.4
b
4.7
c
5.7
d
7.8
1967
a
8.9
b
5.3
c
5
d
8.4
1968
a
8.8
b
5.4
c
5.2
d
9.3
1969
a
7.5
b
4.1
c
6.4
d
9.5
1970
a
8.6
b
5.7
c
4.3
d
11.9
1971
a
9.1
b
4.9
c
4.8
d
9.1
1972
a
8.7
b
3
c
5.1
d
7.9
1973
a
9.2
b
5.5
c
6.1
d
8.5
1974
a
8.4
b
4.3
c
6.5
d
10.2
1975
a
9.8
b
4.8
c
5.6
d
7.1
1976
a
8.5
b
4
c
5.8
d
9.8
1977
a
8.7
b
4.2
c
5.6
d
9.4
1978
a
8.5
b
4.6
c
6.5
d
8.7
1979
a
8.6
b
6.7
c
5.7
d
9.2
1980
a
9.6
b
5.5
c
6.4
d
8.1
1951
a
9
b
4.9
c
4.9
d
8.3
1952
a
7.3
b
4
c
6.6
d
9.5
1953
a
8
b
4.6
c
4.8
d
8.6
1954
a
9.9
b
4.4
c
5.1
d
8.2
1955
a
7.9
b
3.4
c
5.3
d
9.6
1956
a
7.6
b
5.5
c
5.6
d
10
要求:
(1)会对实际问题建立有效的方差回归模型;
(2)学会利用SAS输出结果对模型作出结论式的分析,能对方差模型进行运用,对实际问题的各因素进行有无显著性差异的判断。
二、模型建立
1.单因素试验的方差分析模型
设因素A有s个水平
,在水平
下,进行
次独立实验,得到如下结果:
观察结果
A1
A2
…
As
X11
X21
...
Xn11
X21
X22
...
Xn22
···
···
···
···
X1s
X2s
...
Xnss
我们假设:
(1)各个水平
下的样本X1j,X2j,···,Xnjj是来自具有相同方差
;
(2)均值分别为
的正态分布
,其中
未知;
(3)设不同水平
下的样本之间相互独立;
由于
,故
可看成是随机误差。
记
,则得到:
其中
与
均为未知参数。
方差分析有两个任务:
对上述模型检验个
总体的均值是否相等核对未知参数
。
即检验如下假设问题:
三、模型的检验与分析
dataa;
inputmonth$tempreture@@;
cards;
a9b4.9c4.9d8.3
a7.3b4c6.6d9.5
a8b4.6c4.8d8.6
a9.9b4.4c5.1d8.2
a7.9b3.4c5.3d9.6
a7.6b5.5c5.6d10
a10.2b4.4c6.1d8.3
a8.4b4.9c6d8.7
a8.3b5.1c5.6d8.4
a8.6b5.4c5.7d7.9
a7.5b4.8c4.9d9.3
a9.2b6c6d9.5
a8.2b4.6c5.3d7
a7.9b4.8c5.6d9.4
a9.4b5c5.7d7.3
a8.4b4.7c5.7d7.8
a8.9b5.3c5d8.4
a8.8b5.4c5.2d9.3
a7.5b4.1c6.4d9.5
a8.6b5.7c4.3d11.9
a9.1b4.9c4.8d9.1
a8.7b3c5.1d7.9
a9.2b5.5c6.1d8.5
a8.4b4.3c6.5d10.2
a9.8b4.8c5.6d7.1
a8.5b4c5.8d9.8
a8.7b4.2c5.6d9.4
a8.5b4.6c6.5d8.7
a8.6b6.7c5.7d9.2
a9.6b5.5c6.4d8.1;
procanovadata=a;
classmonth;
modeltempreture=month;
run;
SAS系统2016年04月29日星期五上午10时38分35秒1
TheANOVAProcedure
ClassLevelInformation
ClassLevelsValues
month4abcd
NumberofObservationsRead120
NumberofObservationsUsed120
TheANOVAProcedure
DependentVariable:
tempreture
Sumof
SourceDFSquaresMeanSquareFValuePr>F
Model3381.4786667127.1595556204.16<.0001
Error11672.24800000.6228276
CorrectedTotal119453.7266667
R-SquareCoeffVarRootMSEtempretureMean
0.84076811.328150.7891946.966667
SourceDFAnovaSSMeanSquareFValuePr>F
month3381.4786667127.1595556204.16<.0001
TheANOVAProcedure
tTests(LSD)fortempreture
NOTE:
ThistestcontrolstheTypeIcomparisonwiseerrorrate,nottheexperimentwiseerrorrate.
Alpha0.05
ErrorDegreesofFreedom116
ErrorMeanSquare0.622828
CriticalValueoft1.98063
LeastSignificantDifference0.4036
Meanswiththesameletterarenotsignificantlydifferent.
tGroupingMeanNmonth
A8.830030d
A
A8.623330a
B5.596730c
C4.816730b
该SAS程序运行给出了南极的温度方差分析结果,容易看出效应平方和为381.4786667,误差平方和为72.2480000,总偏差平方和453.7266667,效应、误差和总偏差的自由度分别s-1=3,n-s=116,n-1=119,由最后一行可知F值为204.16,相应的P值(
)为
,可以得出南极不同月份的温度是有显著性差异
2,
dataa;
inputmonth$tempreture@@;
cards;
a9b4.9c4.9d8.3
a7.3b4c6.6d9.5
a8b4.6c4.8d8.6
a9.9b4.4c5.1d8.2
a7.9b3.4c5.3d9.6
a7.6b5.5c5.6d10
a10.2b4.4c6.1d8.3
a8.4b4.9c6d8.7
a8.3b5.1c5.6d8.4
a8.6b5.4c5.7d7.9
a7.5b4.8c4.9d9.3
a9.2b6c6d9.5
a8.2b4.6c5.3d7
a7.9b4.8c5.6d9.4
a9.4b5c5.7d7.3
a8.4b4.7c5.7d7.8
a8.9b5.3c5d8.4
a8.8b5.4c5.2d9.3
a7.5b4.1c6.4d9.5
a8.6b5.7c4.3d11.9
a9.1b4.9c4.8d9.1
a8.7b3c5.1d7.9
a9.2b5.5c6.1d8.5
a8.4b4.3c6.5d10.2
a9.8b4.8c5.6d7.1
a8.5b4c5.8d9.8
a8.7b4.2c5.6d9.4
a8.5b4.6c6.5d8.7
a8.6b6.7c5.7d9.2
a9.6b5.5c6.4d8.1
;
procanovadata=a;
classmonth;
modeltempreture=month;
meansmonth/t;
run;
TheANOVAProcedure
ClassLevelInformation
ClassLevelsValues
month4abcd
NumberofObservationsRead120
NumberofObservationsUsed120
TheANOVAProcedure
DependentVariable:
tempreture
Sumof
SourceDFSquaresMeanSquareFValuePr>F
Model3381.4786667127.1595556204.16<.0001
Error11672.24800000.6228276
CorrectedTotal119453.7266667
R-SquareCoeffVarRootMSEtempretureMean
0.84076811.328150.7891946.966667
SourceDFAnovaSSMeanSquareFValuePr>F
month3381.4786667127.1595556204.16<.0001
TheANOVAProcedure
tTests(LSD)fortempreture
NOTE:
ThistestcontrolstheTypeIcomparisonwiseerrorrate,nottheexperimentwiseerrorrate.
Alpha0.05
ErrorDegreesofFreedom116
ErrorMeanSquare0.622828
CriticalValueoft1.98063
LeastSignificantDifference0.4036
Meanswiththesameletterarenotsignificantlydifferent.
tGroupingMeanNmonth
A8.830030d
A
A8.623330a
B5.596730c
C4.816730b
结果分析:
该SAS程序运行给出了南极的温度数据多重比较检验结果。
对输出的结果说明如下:
Alpha=给出检验的alpha水平。
缺省的错误率为0.005,即100次中有5次犯错机会。
Df=给出检验的自由度。
对均衡的样本,自由度应为组数与样本量减1的乘积。
检验的自由度为20。
CriticalValueofT=列出检验使用的均方误差和临界值。
均方误差为0.622828,临界值为1.98063。
LeastsignificantDifference=给出在由Alpha=指定的水平下两均值间有显著性差异时的最小可能差值。
最小可能差值水平是在0.4036。
四、总结
方差分析就是要判断试验中是否存在系统性变异,即试验因素的水平对试验指标是否产生显著性影响。
用于检验变量间是否有显著性差异的F值由最后一行可知F值为204.16,相应的P值(
)为
,,相应的P值(
)为
,效应平方和为381.4786667,误差平方和为72.2480000,总偏差平方和453.7266667,效应、误差和总偏差的自由度分别s-1=3,n-s=116,n-1=119,均方误差为0.622828,临界值为1.98063。
Alpha=指定的水平下两均值间有显著性差异时的最小可能差值为0.05。
因此可以得出南极1951-1980年份的不同月份的温度是没有显著性差异。