多元统计方差分析.docx
《多元统计方差分析.docx》由会员分享,可在线阅读,更多相关《多元统计方差分析.docx(12页珍藏版)》请在冰点文库上搜索。
多元统计方差分析
Documentnumber:
BGCG-0857-BTDO-0089-2022
多元统计方差分析
合肥学院
2015-2016第二学期
《多元统计分析》课程论文
论文题目方差分析
姓名郑宁
学号01
专业数学与应用数学
(1)
成绩
方差分析
——以南极的1951-1980的3、6、9、12月的各温度的相关数据为基础,建立方差分析模型进行分析。
摘要:
单因素方差分析(ANOVA)是用来研究一个分类型自变量的不同水平对一个数值型因变量的影响。
方差分析不仅可以提高检验的效率,而且可以提高检验的可靠性。
本论文为了研究南极的1951-1980的3、6、9、12月的各温度有无显着性变化。
根据假设检验的原理,运用SAS软件,以南极的3、6、9、12月各温度作为实验因素,建立方差分析模型,最后在给定的显着性水平下,判断出各实验因素之间有无显着性差异,从而得出实验因素之间的方差分析模型,即确定了南极的1951-1980的3、6、9、12月的温度之间有没有显着性变化。
关键词:
方差分析模型SAS软件
一、问题提出与分析
现有南极的1951-1980的3、6、9、12月各温度的相关数据,请用方差分析研究南极的3、6、9、12月的各温度有没有显着性差异。
数据资料如表1所示,其中,各指标含义如下:
实验因素:
a(表示3月)、b(表示6月)、c(表示9月)、d(表示12月)。
表1南极的1951-1980的3、6、9、12月的各温度数据
1951
a
9
b
c
d
1952
a
b
4
c
d
1953
a
8
b
c
d
1954
a
b
c
d
1955
a
b
c
d
1956
a
b
c
d
10
1957
a
b
c
d
1958
a
b
c
6
d
1959
a
b
c
d
1960
a
b
c
d
1961
a
b
c
d
1962
a
b
6
c
6
d
1963
a
b
c
d
7
1964
a
b
c
d
1965
a
b
5
c
d
1966
a
b
c
d
1967
a
b
c
5
d
1968
a
b
c
d
1969
a
b
c
d
1970
a
b
c
d
1971
a
b
c
d
1972
a
b
3
c
d
1973
a
b
c
d
1974
a
b
c
d
1975
a
b
c
d
1976
a
b
4
c
d
1977
a
b
c
d
1978
a
b
c
d
1979
a
b
c
d
1980
a
b
c
d
1951
a
9
b
c
d
1952
a
b
4
c
d
1953
a
8
b
c
d
1954
a
b
c
d
1955
a
b
c
d
1956
a
b
c
d
10
要求:
(1)会对实际问题建立有效的方差回归模型;
(2)学会利用SAS输出结果对模型作出结论式的分析,能对方差模型进行运用,对实际问题的各因素进行有无显着性差异的判断。
二、模型建立
1.单因素试验的方差分析模型
设因素A有s个水平
,在水平
下,进行
次独立实验,得到如下结果:
观察结果
A1
A2
…
As
X11
X21
...
Xn11
X21
X22
...
Xn22
···
···
···
···
X1s
X2s
...
Xnss
我们假设:
(1)各个水平
下的样本X1j,X2j,···,Xnjj是来自具有相同方差
;
(2)均值分别为
的正态分布
,其中
未知;
(3)设不同水平
下的样本之间相互独立;
由于
,故
可看成是随机误差。
记
,则得到:
其中
与
均为未知参数。
方差分析有两个任务:
对上述模型检验个
总体的均值是否相等核对未知参数
。
即检验如下假设问题:
三、模型的检验与分析
dataa;
inputmonth$tempreture@@;
cards;
a9bcd
ab4cd
a8bcd
abcd
abcd
abcd10
abcd
abc6d
abcd
abcd
abcd
ab6c6d
abcd7
abcd
ab5cd
abcd
abc5d
abcd
abcd
abcd
abcd
ab3cd
abcd
abcd
abcd
ab4cd
abcd
abcd
abcd
abcd;
procanovadata=a;
classmonth;
modeltempreture=month;
run;
SAS系统2016年04月29日星期五上午10时38分35秒1
TheANOVAProcedure
ClassLevelInformation
ClassLevelsValues
month4abcd
NumberofObservationsRead120
NumberofObservationsUsed120
TheANOVAProcedure
DependentVariable:
tempreture
Sumof
SourceDFSquaresMeanSquareFValuePr>F
Model3<.0001
Error116
CorrectedTotal119
R-SquareCoeffVarRootMSEtempretureMean
SourceDFAnovaSSMeanSquareFValuePr>F
month3<.0001
TheANOVAProcedure
tTests(LSD)fortempreture
NOTE:
ThistestcontrolstheTypeIcomparisonwiseerrorrate,nottheexperimentwiseerrorrate.
Alpha
ErrorDegreesofFreedom116
ErrorMeanSquare
CriticalValueoft
LeastSignificantDifference
Meanswiththesameletterarenotsignificantlydifferent.
tGroupingMeanNmonth
A30d
A
A30a
B30c
C30b
该SAS程序运行给出了南极的温度方差分析结果,容易看出效应平方和为,误差平方和为,总偏差平方和,效应、误差和总偏差的自由度分别s-1=3,n-s=116,n-1=119,由最后一行可知F值为,相应的P值(
)为
,可以得出南极不同月份的温度是有显着性差异
2,
dataa;
inputmonth$tempreture@@;
cards;
a9bcd
ab4cd
a8bcd
abcd
abcd
abcd10
abcd
abc6d
abcd
abcd
abcd
ab6c6d
abcd7
abcd
ab5cd
abcd
abc5d
abcd
abcd
abcd
abcd
ab3cd
abcd
abcd
abcd
ab4cd
abcd
abcd
abcd
abcd
;
procanovadata=a;
classmonth;
modeltempreture=month;
meansmonth/t;
run;
TheANOVAProcedure
ClassLevelInformation
ClassLevelsValues
month4abcd
NumberofObservationsRead120
NumberofObservationsUsed120
TheANOVAProcedure
DependentVariable:
tempreture
Sumof
SourceDFSquaresMeanSquareFValuePr>F
Model3<.0001
Error116
CorrectedTotal119
R-SquareCoeffVarRootMSEtempretureMean
SourceDFAnovaSSMeanSquareFValuePr>F
month3<.0001
TheANOVAProcedure
tTests(LSD)fortempreture
NOTE:
ThistestcontrolstheTypeIcomparisonwiseerrorrate,nottheexperimentwiseerrorrate.
Alpha
ErrorDegreesofFreedom116
ErrorMeanSquare
CriticalValueoft
LeastSignificantDifference
Meanswiththesameletterarenotsignificantlydifferent.
tGroupingMeanNmonth
A30d
A
A30a
B30c
C30b
结果分析:
该SAS程序运行给出了南极的温度数据多重比较检验结果。
对输出的结果说明如下:
Alpha=给出检验的alpha水平。
缺省的错误率为,即100次中有5次犯错机会。
Df=给出检验的自由度。
对均衡的样本,自由度应为组数与样本量减1的乘积。
检验的自由度为20。
CriticalValueofT=列出检验使用的均方误差和临界值。
均方误差为,临界值为。
LeastsignificantDifference=给出在由Alpha=指定的水平下两均值间有显着性差异时的最小可能差值。
最小可能差值水平是在。
四、总结
方差分析就是要判断试验中是否存在系统性变异,即试验因素的水平对试验指标是否产生显着性影响。
用于检验变量间是否有显着性差异的F值由最后一行可知F值为,相应的P值(
)为
,,相应的P值(
)为
,效应平方和为,误差平方和为,总偏差平方和,效应、误差和总偏差的自由度分别s-1=3,n-s=116,n-1=119,均方误差为,临界值为。
Alpha=指定的水平下两均值间有显着性差异时的最小可能差值为。
因此可以得出南极1951-1980年份的不同月份的温度是没有显着性差异。