沈阳建筑大学统计学实验报告文档格式.docx
《沈阳建筑大学统计学实验报告文档格式.docx》由会员分享,可在线阅读,更多相关《沈阳建筑大学统计学实验报告文档格式.docx(19页珍藏版)》请在冰点文库上搜索。
频率
A
14
14%
B
21
21%
C
32
32%
D
18
18%
E
15
15%
总计
100
1
(2)制作一张条形图,反映评价等级的分布。
(4)制作一张饼图,反映评价等级的构成。
2.2为确定灯泡的使用寿命(单位:
小时),在一批灯泡中随机抽取100只进行测试,所得数据如下:
(1)以组距为10进行分组,整理成频数分布表。
灯泡使用寿命频数分布表
按销售额分组(万元)
650-660
2
0.02
660-670
5
0.05
670-680
6
0.06
680-690
0.14
690-700
26
0.26
700-710
0.18
710-720
13
0.13
720-730
10
0.10
730-740
3
0.03
740-750
合计
1.00
从直方图可以直观地看出,灯泡使用寿命的分布基本上是对称的,右边的尾部稍长一些,灯泡使用寿命接近正态分布。
(3)制作茎叶图,并与直方图作比较。
使用寿命Stem-and-LeafPlot
FrequencyStem&
Leaf
1.00Extremes(=<
651)
1.0065.8
2.0066.14
3.0066.568
3.0067.134
3.0067.679
7.0068.1123334
7.0068.5558899
13.0069.44
13.0069.5566677888899
8.0070.00112234
10.0070.5666778889
6.0071.002233
7.0071.5677889
4.0072.0122
6.0072.567899
1.0073.3
2.0073.56
1.0074.1
1.0074.7
1.00Extremes(>
=749)
Stemwidth:
10
Eachleaf:
1case(s)
比较直方图与茎叶图:
直方图的数据分布很方便,但原始数据看不到了,茎叶图则不同,不仅可以看出数据的分布,还能保留原始数据的信息。
2.3甲、乙两班有40名学生,期末统计学考试成绩的分布如下:
(1)画出两个班考试成绩的环形图,比较它们的构成。
(2)画出雷达图,比较两个班考试成绩的分布是否相似。
从图中可以看出甲、乙两班的成绩分布不相似,没有相似性。
2.4下表是我国10个城市2006年各月份的气温(°
C)数据:
绘制各城市月气温的箱线图,并比较各城市气温分布的特点
从箱线图可看出,这10个城市的月气温存在较大差异,离散程度高的城市为沈阳、北京、郑州、武汉;
离散程度低的为海口、昆明、广州。
月气温较高的城市主要为中位数较大的海口、广州,月气温较低的为城市中位数较小的沈阳;
月气温分布较对称的城市主要有北京、沈阳;
月气温分布不对称的城市主要有:
有海口;
月气温存在极值的城市有沈阳、北京、重庆。
实验二:
用统计量描述数据;
概率分布;
参数估计
2014年11月日
第十四教学周
利用Spss、Excel软件对数据进行概括性度量、计算概率分布的概率及概率值,进行参数估计。
练习题3.5、4.4、5.3、5.7
本次实验成绩
练习题
出勤和实验纪律
3.5一种产品需要人工组装,现有3种可供选择的组装方法。
为检验哪种方法更好,随机抽取15个工人,让他们分别用3种方法组装。
列1
列2
列3
平均
165.6
128.7333
125.5333
标准误差
0.550325
0.452155
0.716251
中位数
165
129
126
众数
164
128
标准差
2.131398
1.75119
2.774029
方差
4.542857
3.066667
7.695238
峰度
-0.1345
0.454621
11.66308
偏度
0.351371
-0.17448
-3.23793
区域
8
7
12
最小值
162
125
116
最大值
170
132
求和
2484
1931
1883
观测数
4.4由30辆汽车构成的一个随机样本,绘制正态概率图
5.3某大学为了解学生每天上网的时间,在全校学生中随机抽取36人,调查他们每天上网的时间(单位:
小时),得到数据如下:
求该校大学生平均上网时间的置信区间,置信水平分别为90%,95%和99%。
One-SampleStatistics
N
Mean
Std.Deviation
Std.ErrorMean
加班时间
13.56
7.801
1.839
One-SampleTest
TestValue=0
t
df
Sig.(2-tailed)
MeanDifference
95%ConfidenceIntervaloftheDifference
Lower
Upper
7.373
17
.000
13.556
9.68
17.43
平均数
置信水平
置信下限
置信上限
3.32
2.59
1.61
90%
2.88
3.76
95%
2.79
3.84
99%
2.63
4.01
5.7一家人才测评机构对随机抽取的10名小企业的经理人用两种方法进行自信心测试,得到自信心测试分数如下:
构建两种方法平均自信心得分之差μd=μ1-μ2的95%的置信区间。
PairedSamplesStatistics
Pair1
方法1
72.60
14.073
4.450
方法2
61.60
14.759
4.667
PairedSamplesCorrelations
Correlation
Sig.
方法1&
方法2
.898
PairedSamplesTest
PairedDifferences
方法1-方法2
11.000
6.532
2.066
6.327
15.673
5.325
9
两种方法平均自信心得分之差μd=μ1-μ2的95%的置信区间为(6.327,15.673)
实验三:
假设检验;
分类变量的推断;
方差分析与实验设计
2014年11月日
第十五教学周
利用Spss、Excel软件对数据进行假设检验、分类变量的推断、方差分析与实验设计。
练习题6.9、7.2、7.4、8.3、8.6
6.9为比较新旧两种肥料对产量的影响,以便决定是否采用新肥料。
研究者选择了面积、土壤等条件相同的40块田地,分别施用新旧两种肥料,得到的产量数据如下:
(数据略)去显著性水平α=0.05,检验:
(1)新肥料获得的平均产量是否显著地高于旧肥料?
假设条件为:
1)两种肥料产量的方差未知但相等,即σ1²
=σ2²
。
2)两种肥料产量的方差未知且不相等,即σ1²
≠σ2²
解:
设μ1=新肥料,μ2=旧肥料。
H0:
μ1-μ2≥0;
H1:
μ1-μ2<
0。
t-检验:
双样本等方差假设
变量1
变量2
100.7
109.9
24.11578947
33.35789474
观测值
20
合并方差
28.73684211
假设平均差
38
tStat
-5.427106029
P(T<
=t)单尾
1.73712E-06
t单尾临界
1.68595446
=t)双尾
3.47424E-06
t双尾临界
2.024394164
1)t=-5.427,P=1.73712E-06,拒绝原假设,新肥料获得的平均产量显著地高于旧肥料。
双样本异方差假设
37
1.87355E-06
1.68709362
3.74709E-06
2.026192463
2)P=1.87355E-06,拒绝原假设,新肥料获得的平均产量显著地高于旧肥料
F-检验双样本方差分析
19
F
0.722940991
P(F<
=f)单尾
0.243109655
F单尾临界
0.461201089
7.2一家电视台为了解观众对某档娱乐节目的喜欢程度,对不同年龄段的男女观众进行了调查。
男性
ObservedN
ExpectedN
Residual
7.0
-2.0
28.1
-22.1
13.2
-1.2
16
10.5
5.5
25
5.3
19.7
Total
64
TestStatistics
Chi-Square
94.942a
4
Asymp.Sig.
a.0cells(.0%)haveexpectedfrequencieslessthan5.Theminimumexpectedcellfrequencyis5.3.
7.4为分析不同地区的消费者与所购买的汽车价格是否有关,一家汽车企业的销售部门对东部地区、中部地区和西部地区的四百个消费者做抽样调查,检查地区与所购买的汽车价格是否有关。
CaseProcessingSummary
Cases
Valid
Missing
Percent
汽车价格*地区
400
100.0%
.0%
Value
Asymp.Sig.(2-sided)
PearsonChi-Square
29.991a
LikelihoodRatio
30.683
NofValidCases
a.0cells(.0%)haveexpectedcountlessthan5.Theminimumexpectedcountis21.00.
汽车价格*地区Crosstabulation
地区
东部地区
西部地区
中部地区
汽车价格
10—20万元
Count
50
60
160
ExpectedCount
56.0
48.0
160.0
10万元以下
40
35.0
30.0
100.0
20—30万元
30
70
24.5
21.0
70.0
30万元以上
140
120
140.0
120.0
400.0
8.3
8.6城市道路交通管理部门为研究不同的路段和不同的时段对行车时间的影响,让一名交通警察分别在3个路段的高峰期与非高峰期亲自驾车进行试验,通过试验共获得30个行车时间的数据单位:
分。
试分析路段、时段以及路段和时段的交互作用对行车时间的影响α=0.05。
Exel:
方差分析:
可重复双因素分析
SUMMARY
路段1
路段2
路段3
高峰期
181.4
151.8
172.2
505.4
36.28
30.36
34.44
33.69333
2.267
2.518
2.723
8.702095
非高峰期
150
121
141.4
412.4
24.2
28.28
27.49333
5.265
6.025
5.797
11.22067
331.4
272.8
313.6
33.14
27.28
31.36
14.30267
14.33733
14.32711
Spass:
Between-SubjectsFactors
时段
路段
TestsofBetween-SubjectsEffects
DependentVariable:
行车时间
Source
TypeIIISumofSquares
MeanSquare
CorrectedModel
468.815a
156.272
41.290
Intercept
28078.561
7418.830
288.300
76.174
180.515
90.257
23.848
Error
98.404
3.785
28645.780
CorrectedTotal
567.219
29
a.RSquared=.827(AdjustedRSquared=.806)
实验四:
一元线性回归;
多元线性回归;
时间序列预测及对实际数据进行分析
第十六教学周
利用Spss、Excel软件进行一元线性回归、多元线性回归、时间序列预测及对实际数据进行综合分析。
练习题9.2、9.3、11.1、11.3
11.1