统计学实验报告.docx
《统计学实验报告.docx》由会员分享,可在线阅读,更多相关《统计学实验报告.docx(34页珍藏版)》请在冰点文库上搜索。
统计学实验报告
统计实验一:
数据的整理与显示
一、实验目的及要求
(一)目的
⑴掌握EXCEL用于数据预处理的基本菜单操作及命令;
⑵掌握EXCEL用于整理与显示的基本菜单操作及命令。
⑶能够根据实际中的数据特点选择最优的图形进行数据的展示.
(二)内容及要求
1为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本.服务质量的等级分别表示为:
A.好;B。
较好;C.一般;D。
差;E。
较差。
调查结果见book3。
01。
要求:
1)指出上面的数据属于什么类型?
2)用Excel制作一张频数分布表;
3)绘制一张条形图,反映评价等级的分布。
B
E
C
C
A
D
C
B
A
E
D
A
C
B
C
D
E
C
E
E
A
D
B
C
C
A
E
D
C
B
B
A
C
D
E
A
B
D
D
C
C
B
C
E
D
B
C
C
B
C
D
A
C
B
C
D
E
C
E
B
B
E
C
C
A
D
C
B
A
E
B
A
C
D
E
A
B
D
D
C
A
D
B
C
C
A
E
D
C
B
C
B
C
E
D
B
C
C
B
C
21978~2009年我国的国内生产总值数据如下(按当年价格计算,单位:
亿元)见3。
11。
1)制第一、二、三产业国内生产总值的线图;
2)根据2009年的国内生产总值及其构成数据制图分析其构成状况.
本表按当年价格计算。
单位:
亿元
年份
国民
国内生产
人均国内
总收入
总值
第一产业
第二产业
第三产业
生产总值
工业
建筑业
(元)
1978
3645.2
3645.2
1027。
5
1745。
2
1607.0
138。
2
872。
5
381
1979
4062。
6
4062.6
1270.2
1913.5
1769。
7
143。
8
878。
9
419
1980
4545。
6
4545.6
1371.6
2192。
0
1996。
5
195。
5
982。
0
463
1981
4889。
5
4891.6
1559。
5
2255.5
2048。
4
207。
1
1076.6
492
1982
5330。
5
5323。
4
1777。
4
2383。
0
2162.3
220.7
1163.0
528
1983
5985.6
5962.7
1978。
4
2646。
2
2375。
6
270。
6
1338。
1
583
1984
7243.8
7208。
1
2316.1
3105。
7
2789。
0
316.7
1786。
3
695
1985
9040.7
9016。
0
2564。
4
3866。
6
3448。
7
417.9
2585.0
858
1986
10274。
4
10275.2
2788。
7
4492.7
3967。
0
525。
7
2993.8
963
1987
12050。
6
12058。
6
3233。
0
5251。
6
4585。
8
665.8
3574。
0
1112
1988
15036。
8
15042.8
3865。
4
6587.2
5777。
2
810。
0
4590。
3
1366
1989
17000.9
16992。
3
4265。
9
7278.0
6484。
0
794。
0
5448。
4
1519
1990
18718.3
18667。
8
5062。
0
7717.4
6858。
0
859。
4
5888。
4
1644
1991
21826。
2
21781。
5
5342.2
9102。
2
8087。
1
1015。
1
7337.1
1893
1992
26937.3
26923。
5
5866。
6
11699。
5
10284。
5
1415.0
9357。
4
2311
1993
35260.0
35333.9
6963。
8
16454。
4
14188.0
2266。
5
11915.7
2998
1994
48108.5
48197.9
9572.7
22445。
4
19480.7
2964。
7
16179.8
4044
1995
59810。
5
60793。
7
12135。
8
28679。
5
24950.6
3728。
8
19978.5
5046
1996
70142。
5
71176。
6
14015.4
33835。
0
29447.6
4387.4
23326。
2
5846
1997
78060。
8
78973。
0
14441。
9
37543.0
32921。
4
4621。
6
26988。
1
6420
1998
83024.3
84402。
3
14817。
6
39004。
2
34018.4
4985.8
30580。
5
6796
1999
88479。
2
89677.1
14770。
0
41033。
6
35861。
5
5172.1
33873。
4
7159
2000
98000.5
99214。
6
14944。
7
45555.9
40033.6
5522。
3
38714。
0
7858
2001
108068。
2
109655。
2
15781。
3
49512。
3
43580。
6
5931.7
44361。
6
8622
2002
119095.7
120332。
7
16537。
0
53896。
8
47431.3
6465。
5
49898。
9
9398
2003
135174.0
135822.8
17381.7
62436。
3
54945。
5
7490。
8
56004.7
10542
2004
159586.7
159878。
3
21412.7
73904。
3
65210。
0
8694。
3
64561。
3
12336
2005
185808。
6
184937。
4
22420。
0
87598。
1
77230。
8
10367。
3
74919。
3
14185
2006
217522。
7
216314。
4
24040。
0
103719。
5
91310。
9
12408.6
88554.9
16500
2007
267763。
7
265810。
3
28627。
0
125831.4
110534。
9
15296。
5
111351.9
20169
2008
316228。
8
314045。
4
33702.0
149003。
4
130260。
2
18743.2
131340。
0
23708
2009
343464.7
340506.9
35226。
0
157638。
8
135239。
9
22398.8
147642.1
25575
3。
表格数据为一公司在英美两国分公司销售人员获得的全年订单情况,见book3。
12。
要求:
根据数据进行适当的整理,编制报表.每张报表反映一个国家销售人员每季度获得订单情况
4。
自1991年始,美国教育部开始对学生贷款拖欠率很高的一些学院和大学采取一些矫正性和惩罚性措施:
凡拖欠率超过60%的学校,将中止执行行政的大规模学生贷款计划;对于拖欠率在40%—60%之间的学校,将责令校方每年设法降低5%的拖欠率,否则将面临类似的惩罚。
图表(略)要求:
(1)用12个类绘制这些数据的相对频数直方图
(2)用3个类绘制这些数据的相对频数直方图
(3)用25个类绘制这些数据的相对频数直方图
二、仪器用具
Excel2003
三、实验原理
应用EXCEL的基本原理,根据不同数据的特征选择合适的数据处理方法对数据进行基本的整理和图形的展示。
四、实验方法与步骤
⑴数据的EXCEL预处理
①利用EXCEL进行筛选
“数据”—-“筛选”——“自动筛选/高级筛选”
②利用EXCEL进行排序
“数据”——“排序”
⑵品质数据的EXCEL整理和显示:
“插入"--“图表”-—选择图形
⑶数值型数据的EXCEL整理和显示
“工具"--“数据分析”—-“直方图”
五、实验结果与数据处理
1。
解:
1)上面数据属于顺序数据
2)频数分布表如下:
服务质量等级
频数
频率
A
14
14%
B
21
21%
C
32
32%
D
18
18%
E
15
15%
总计
100
100%
3)评价等级条形:
2。
解:
1)第一、二、三产业的国内生产总值线图如下:
2)、2009年国内生产总值的饼图如下:
2009年国内生产总值中第二、三产业比重大都超过40%,二产业所占比例略高于第三产业,第一产业比重最小
3.解:
订单日期
国家/地区
销售人员
数据
第一季
第二季
第三季
第四季
总计
美国
Callahan
求和项:
订单金额
19992。
23
8686。
72
9649。
99
18625。
08
56954.02
求和项:
订单ID
198322
105278
148663
128682
580945
Davolio
求和项:
订单金额
17885。
82
15925.56
32394.91
29644。
07
95850.36
求和项:
订单ID
114710
115837
201999
161083
593629
Fuller
求和项:
订单金额
11434。
38
22136.67
16148。
8
21448。
29
71168。
14
求和项:
订单ID
114792
94859
95676
128759
434086
Leverling
求和项:
订单金额
28406.85
33493。
13
10888.96
30930。
13
103719。
07
求和项:
订单ID
187837
147426
127470
246980
709713
Peacock
求和项:
订单金额
41088。
53
22389.61
31231。
12
29946.3
124655。
56
求和项:
订单ID
187955
157898
254997
225487
826337
美国求和项:
订单金额
118807。
81
102631.69
100313。
78
130593.87
452347。
15
美国求和项:
订单ID
803616
621298
828805
890991
3144710
英国
Buchanan
求和项:
订单金额
3237.12
6647.67
12975.8
8572。
57
31433。
16
求和项:
订单ID
41811
31653
74452
53637
201553
Dodsworth
求和项:
订单金额
1310.8
5692.28
5285。
05
12468。
76
24756。
89
求和项:
订单ID
21182
73720
31904
64405
191211
King
求和项:
订单金额
15108。
34
16437.92
20263.93
8017
59827.19
求和项:
订单ID
41716
147254
127552
42879
359401
Suyama
求和项:
订单金额
5583。
16
14245。
21
5481.65
15516。
35
40826。
37
求和项:
订单ID
62608
94702
53146
118107
328563
英国求和项:
订单金额
25239。
42
43023。
08
44006.43
44574。
68
156843。
61
英国求和项:
订单ID
167317
347329
287054
279028
1080728
求和项:
订单金额汇总
144047。
23
145654。
77
144320.21
175168。
55
609190.76
求和项:
订单ID汇总
970933
968627
1115859
1170019
4225438
4。
解:
(1)12类绘制:
分组
频数
相对频数
7
24
0。
36363636
14
20
0.3030303
21
11
0。
16666667
28
3
0.04545455
35
1
0。
01515152
42
1
0。
01515152
49
5
0。
07575758
56
0
0
63
0
0
70
0
0
77
1
0.01515152
84
0
0
相对的直方图:
(2)3类绘制
分组
频数
相对频数
26
57
0。
86363636
52
8
0。
12121212
78
1
0。
01515152
相对的直方图:
(3)25类绘制:
分组
频数
相对频数
4
6
0。
09090909
8
22
0。
33333333
12
13
0。
1969697
16
6
0。
09090909
20
6
0.09090909
24
4
0。
06060606
28
1
0.01515152
32
0
0
36
1
0。
01515152
40
1
0.01515152
44
1
0。
01515152
48
2
0。
03030303
52
2
0.03030303
56
0
0
60
0
0
64
0
0
68
0
0
72
0
0
76
0
0
80
1
0。
01515152
相应频数直方图:
六、讨论与结论
通过此次试验,我掌握了EXCEL用于数据预处理的基本菜单操作及命令,整理与显示的基本菜单操作及命令,能够根据实际中的数据特点选择最优的图形进行数据的展示。
根据图形来分析数据比看枯燥的数字更有趣,也更容易理解。
正确地使用统计表和统计图是做好统计分析的最基本技能.
实验报告评分表
学生姓名
李小娟
学号
091415007
专业年级
2009级金融学
实验项目名称
实验一:
数据的整理与显示
实验学时
3学时
评价项目
权重
评价内容
评价结果
得分
A
B
C
D
实验态度
20%
实验态度端正,遵守实验室守则,严格按照实验要求进行操作。
20
16
14
12
实验过程
30%
实验项目符合大纲,实验方法科学;步骤操作合理,逻辑条理清晰,符合指导书要求.
30
24
21
18
实验结论与讨论
30%
实验结论正确,分析、讨论深入。
30
24
21
18
实验报告描述
20%
语言精炼、流畅、准确、灵活,逻辑性强;结构严谨规范,条理清晰,布局合理,系统严密。
20
16
14
12
总分
教师签名
统计实验二:
用EXCEL展示数据的分布特征及列联分析
一、实验目的及要求
(一)目的
⑴掌握利用EXCEL的命令对数据的分布特征进行描述;
⑵掌握利用函数命令对数据进行计算分析,
⑶掌握利用EXCEL的命令对数据分布特征进行分析,
⑷掌握利用EXCEL进行列联分析
(二)内容及要求
1。
请根据表4.01比较2007年与2000年中国人口分布状况的差异.图表(略)
2。
教学改革后学生有了更多的选课自由,但学院领导在安排课程上也面临新的问题。
例如,M。
B.A。
研究生班的学生选课学年之间的变化常常很大,去年的学生很多人选会计课,而今年的学生很多人选市场营销课。
由于事先无法确定究竟有多少学生选各门课程,所以无法有效地进行教学资源的准备。
有人提出学生所选课程与与其本科所学专业有关.为此,学院领导将学生本科所学专业和MBA三门课程的选修课程情况做了统计,得到数据见如下
本科专业
MBA所选课程
会计
统计
市场营销
合计
专业一
31
13
16
60
专业二
8
16
7
31
专业三
12
10
17
39
其他专业
10
5
7
22
合计
61
44
47
152
(1)以α=0。
05的显著性水平检验学生本科所学专业是否影响其读MBA期间所选课程;
(2)计算P值
二、仪器用具
Excel2003
三、实验原理
利用数据分布特征的基本知识对数据进行描述,包括集中趋势分布特征,离散分布特征以及数据分布的基本形状;根据卡方检验的基本原理对数据进行处理;根据数据的特征选择合适的变量进行多元回归模型的拟和和检验。
四、实验方法与步骤
⑴数值型数据的EXCEL整理和显示:
“工具”--“数据分析”——“直方图”
⑵数据的分布特征的EXCEL处理:
“工具"——“数据分析"——“描述统计”
⑶数据计算分析:
“插入”——“函数"——命令选择
⑷列联分析的EXCEL处理:
“插入”--“函数"-—“统计"-—“CHITEST”
五、实验结果与数据处理
1。
解:
2007年人口分布情况:
2000年人口分布情况:
差异:
2007年较2000年青壮年人口比重不断下降和而老年人口的比重不断加大,说明2000年到2007年我国人口老龄化不断加剧。
2.解:
H0:
π1=π2=π3=π4
H1:
π1,π2,π3,π4不全相等
f0
fe
f0—fe
(f0—fe)2
(f0-fe)2
31
24.08
6.92
47。
8864
1。
988638
13
17.37
—4。
37
19。
0969
1.099419
16
18.55
—2。
55
6。
5025
0。
350539
8
12。
44
-4。
44
19。
7136
1.584695
16
8。
97
7。
03
49。
4209
5。
509576
7
9。
59
-2。
59
6。
7081
0。
699489
12
15。
65
-3。
65
13.3225
0.851278
10
11。
29
—1。
29
1。
6641
0。
147396
17
12.06
4。
94
24.4036
2。
023516
10
8。
83
1。
17
1.3689
0.155028
5
6。
37
-1。
37
1.8769
0。
294647
7
6.8
0。
2
0。
04
0。
005882
X2=
14。
7101
自由度为3*2=6
X20.05(6)=12.5916
因为X20。
05(6)=14。
7018591〉X20。
05(6)=12.5916故拒绝原假设
所以本科所学专业对其读MBA期间所选课程有影响
p值=0。
022707
六、讨论与结论
我掌握利用EXCEL的命令对数据的分布特征进行描述,并利用函数命令对数据进行计算分析,在此基础上能够做到用EXCEL的命令对数据分布特征进行分析,通过此次操作,掌握了利用EXCEL进行列联分析.
实验报告评分表
学生姓名
李小娟
学号
091415007
专业年级
2009级金融学
实验项目名称
实验二:
数据的分布特征及列联分析
实验学时
3学时
评价项目
权重
评价内容
评价结果
得分
A
B
C
D
实验态度
20%
实验态度端正,遵守实验室守则,严格按照实验要求进行操作.
20
16
14
12
实验过程
30%
实验项目符合大纲,实验方法科学;步骤操作合理,逻辑条理清晰,符合指导书要求。
30
24
21
18
实验结论与讨论
30%
实验结论正确,分析、讨论深入.
30
24
21
18
实验报告描述
20%
语言精炼、流畅、准确、灵活,逻辑性强;结构严谨规范,条理清晰,布局合理,系统严密。
20
16
14
12
总分
教师签名
统计实验:
多元回归及时间序列分析
二、实验目的及要求
(一)目的
⑴熟悉EXCEL用于时间序列分析的基本菜单操作及命令;
⑵掌握EXCEL用于移动平均、季节指数的基本菜单操作及命令。
⑶掌握EXCEL用于回归分析的基本菜单操作及命令。
(二)内容及要求
1。
一家房地产评估公司想对某城市的房地产销售价格(y1)与地产的评估价值(x1)、房产的评估价值(x2)和使用面积(x3)建立一个模型,以便对销售价格作出合理预测。
为此,收集了20栋住宅的房地产评估数据见book12。
03。
销售价格(元/㎡)y
地产估价(万元)x1
房产估价(万元)x2
使用面积(㎡)x3
6890
596
4497
18730
4850
900
2780
9280
5550
950
3144
11260
6200
1000
3959
12650
11650
1800
7283
22140
4500
850
2732
9120
3800
800
2986
8990
8300
2300
4775
18030
5900
810
3912
12040
4750
900
2935
17250
4050
730
4012
10800
4000
800
3168
15290
9700
2000
5851
24550
4550
800
2345
11510
4090
800
2089
11730
8000
1050
5625
19600
5600
400
2086
13440
3700
450
2261
9880
5000
340
3595
10760
2240
150
578
9620
(1)写出估计的多元回归方程。
(2)在销售价格的总变差中,被估计的回归方程所解释的比例是多少?
(3)检验回归方程的线性关系是否显著(α=0。
05).
(4)检验各回归系数是否显著(α=0.05).
2.一家货物运输公司想研究运输