综合实验一数据的统计描述和分析.docx
《综合实验一数据的统计描述和分析.docx》由会员分享,可在线阅读,更多相关《综合实验一数据的统计描述和分析.docx(9页珍藏版)》请在冰点文库上搜索。
综合实验一数据的统计描述和分析
综合实验一数据的统计描述和分析
综合实验一数据的统计描述和分析
一、实验目的
1(掌握数据的统计描述、参数估计、假设检验和回归分析的基本概念与原理,
及用MINITAB实现的方法;
2(练习综合运用数理统计知识解决一些实际问题。
二、实验内容
从某个寄宿制中学高三学生中随机抽取32名男生的身高、体重和体育课的成绩如下表
身高体重成绩身高体重成绩身高体重成绩
167508517261831695080
179639317058841666674
168547817767791636691
187799117262871756986
173626816653811736483
176708617462831695981
170578114163631675683
170577616956761635166
162537116764851584470
177676716964711756969
17968751675379
(1)给出这些数据的直观的图形描述.
(2)根据这些数据对全校的学生的平均身高和体重做出估计.(3)若普通中学的同龄男生的平均身高为168.3cm,平均体重为56.2kg,你能否认为该中学学生的身高、体重与普通中学相比有显著性区别。
(,,0.05)(4)身高和体重对体育成绩有何影响?
三、实验思路分析:
1(首先要对这些数据进行直观的图形描述,用MINITAB来进行统计描述,可以以身高,体重,成绩为三个变量,分别做三个频率直方图,按照基本实验的做法,先将数据分组,然后计算好各自的频数,频率,最后用软件画图;2(根据数据来对平均身高和体重做估计,涉及到参数估计,由于样本空间的方差未知,即正态总体方差未知,对均值的区间估计,用1-SampleT来进行;3.由提示可知这两个正态总体(身高,体重)的均值,可是方差未知,这里是对两个正态分布的参数分别进行比较,即分别对两个正态总体所进行的单边假设检验,由于选取的统计量为T统计量,故运用的是t检验法,其中用到的是1-SampleT来进行;
4.
(1)由于身高和体重是两个变量因素,因此这里是对双因素试验的方差分析.又由于这两个因素对试验指标起作用,且各因素不同水平的搭配也对试验指标起作用,因此这里是对有交互作用的双因素试验的方差分析,可仿照例题,运用Stat>ANOVA>BalancedANOVA来试验。
(2)也可以用回归分析的方法来试验,参照例题,用Stat>Regression>
Regression。
四、实验步骤:
(1)绘图:
1.编写MINITAB程序
首先是对身高的图形描述,编写如下:
MTB>setc1
DATA>输入身高的原始数据
DATA>end
因为身高数据中最高身高为187,最低身高为141,故可以分为5组。
MTB>code(140:
149.9)145(150:
159.9)155(160:
169.9)165(170:
179.9)175
(180:
189.9)185c1c2
MTB>tallyc2;
SUBC>all.
结果显示:
TallyforDiscreteVariables:
C2
C2CountCumCntPercentCumPct145113.133.13155123.136.25165141643.7550.00175153146.8896.881851323.13100.00
N=32
接着选择命令Graph中的Histogram,选择其中的simple式样,在Graph栏中键入C1,点击OK,有图:
HistogramofC1
10
8
6
Frequency4
2
0140150160170180C1
其中C1C2的表格分布为
C1167179168187173176170170C2165175165185175175175175C1162177179172170177172166C2165175175175175175175165C1174141169167169167169166C2175145165165165165165165C1163175173169167163158175C2165175175165165165155175
再重复一次以上步骤,在Graph栏中键入C2,有图:
HistogramofC2
16
14
12
10
8
Frequency6
4
2
0150160170180C2
2.按照以上步骤,依次给体重,成绩两因素的数据作图形描述;对体重的图形描述:
MTB>setc3
DATA>输入数据
DATA>end
MTB>code(40:
44.9)42.5(45:
49.9)47.5(50:
54.9)52.5(55:
59.9)57.5
(60:
64.9)62.5(65:
69.9)67.5(70:
74.9)72.5(75:
79.9)77.5c3c4
MTB>tallyc4;
SUBC>all.
结果显示:
TallyforDiscreteVariables:
C4
C4CountCumCntPercentCumPct42.5113.133.1352.57821.8825.0057.561418.7543.7562.592328.1371.8867.573021.8893.7572.51313.1396.8877.51323.13100.00
N=32
接着选择命令Graph中的Histogram,选择其中的simple式样,在Graph栏中键入C3,C4,点击OK,有图:
HistogramofC3
9
8
7
6
5
4Frequency3
2
1
04550556065707580C3
HistogramofC4
9
8
7
6
5
4Frequency
3
2
1
04550556065707580C4
3(对成绩的描述:
MTB>setc5
DATA>输入数据
DATA>end
MTB>code(60:
64.9)62.5(65:
69.9)67.5(70:
74.9)72.5(75:
79.9)77.5
(80:
84.9)82.5(85:
89.9)87.5(90:
94.9)92.5c5c6
MTB>tallyc6;
SUBC>all.
TallyforDiscreteVariables:
C6
C6CountCumCntPercentCumPct62.5113.133.1367.54512.5015.6372.54912.5028.1377.561518.7546.8882.592428.1375.0087.552915.6390.6392.53329.38100.00
N=32
接着选择命令Graph中的Histogram,选择其中的simple式样,在Graph栏中键入C5,C6,点击OK,有图:
HistogramofC5
7
6
5
4
3Frequency
2
1
06468727680848892C5
HistogramofC6
9
8
7
6
5
4Frequency3
2
1
06468727680848892C6
(2)对全校学生进行平均身高和体重的区间估计:
1.对平均身高的估计:
先输入原始数据,并把数据列命名为C1;选择Stat>BasicStatistics>1-samplet;
在Variables栏中,键入C1;Clickok
结果显示:
One-SampleT:
C1VariableNMeanStDevSEMean95%CI
C132169.6887.8221.383(166.867,172.508)
2.对体重的估计:
同理可求体重的区间范围,以同样的步骤得结果显示:
One-SampleT:
C1
VariableNMeanStDevSEMean95%CIC13260.53137.40961.3098(57.8598,63.2027)
(3)已知平均身高为168.3CM,平均体重为56.2KG,分别运用1-SampleT来进行单
边检验;
程序如下:
1.先输入身高的原始数据,并把数据列命名为C1;
2.选择Stat>BasicStatistics>1-samplet;3.在Variables栏中,键入C1;
4.在Testmean栏中键入168.3;
5.单击Options,在Confidencelevel栏中,键入95.0,在Alternative栏中选
greaterthan;
6.Clickok
结果显示:
Testofmu=168.3vs>168.3
95%
LowerVariableNMeanStDevSEMeanBoundTPC132169.6887.8221.383167.3431.000.162
对体重的单边检验:
7.先输入体重的原始数据,并把数据列命名为C2;
8.选择Stat>BasicStatistics>1-samplet;9.在Variables栏中,键入C2;
10.在Testmean栏中键入56.2;
11.单击Options,在Confidencelevel栏中,键入95.0,在Alternative栏中选
greaterthan;
12.Clickok
Testofmu=56.2vs>56.2
95%
LowerVariableNMeanStDevSEMeanBoundTPC23260.53137.40961.309858.31043.310.001
(4)身高和体重对体育成绩的影响:
1(先用双因素试验的方差分析来进行实验:
步骤如下:
2.用回归分析的方法来实验:
步骤如下:
输入原始数据;(C1——身高,C2——体重,C3——成绩)
选择Stat>Regression>Regression;在Response栏中,键入C3;
在Predictors栏中,键入C1C2;
点击,,
结果显示:
RegressionAnalysis:
C3versusC1,C2Theregressionequationis
C3=0.6+0.465C1-0.010C2
PredictorCoefSECoefTPConstant0.6328.350.020.982C10.46480.19452.390.024C2-0.01000.2053-0.050.961S=7.13824R-Sq=21.3%R-Sq(adj)=15.9%AnalysisofVariance
SourceDFSSMSFPRegression2401.04200.523.940.031ResidualError291477.6850.95Total311878.72
SourceDFSeqSS
C11400.92
C210.12
五.实验结果分析:
1.绘出的直方图如上;
2.根据数据对全校的学生的身高和体重的估计为:
全校的学生的平均身高的区间估计是(166.867,172.508)而平均体重区间估计是(57.8598,63.2027);
3.通过实验检验得,该中学学生的身高和体重与普通中学相比,对于身高,其P=0.162>a=0.05,故接受原假设,可认为该中学学生的身高与普通中学相比没有显著性区别;而对于体重,其P=0.001<0.05,拒绝原假设,故可认为该中学学生的体重与普通中学相比有显著性区别;
4.以C1为身高,C2为体重,C3为成绩得,实验所得的回归方程为C3=0.6+0.465C1-0.010C2,由于,,,.,,,大于,.,,,由回归方程统计检验知线性方程很大程度上无效(
完成者:
杨栋陈洪璋冼玉钧
专业、班级:
2007生物科学二班
学号:
200730710201,200730710226200730710227