统计学课程实验报告综述文档格式.docx
《统计学课程实验报告综述文档格式.docx》由会员分享,可在线阅读,更多相关《统计学课程实验报告综述文档格式.docx(38页珍藏版)》请在冰点文库上搜索。
13
26
120-130
23
46
130-140
10
20
140及以上
1
2
合计
50
100
1.250名工人加工零件的人数频数分布表
组别
频数(人)
频率(%)
10-110
1.3
零件数(个)
人数(人)
≥130
11
〈130
39
优秀率=11÷
50×
100%=22%
六、讨论与结论
该实验主要是通过EXCEL软件的相关运用来对50名工人的日零件加工数进行分析,首先是制作组距式分布表并绘制柱状图。
相对而言,这部分的操作难度不是很大,通过对这50个数据的观察,除了一个极端值外其余数据的分布都比较集中,最小值为107,最小值为139。
我假设的组距为10,则组数=全距÷
组距=32÷
10=3.2组,化整可取为4组,另外将极端值509单独归入开口组。
然后通过统计数据便可的到每组的工人人数及其比重。
在制作好的组距式分布表的基础上便可很容易的绘制出柱状图。
把分布表与柱状图结合起来,我们可以对工人的日零件加工数的分布情况有一个大致的了解。
其主要表现为集中分布在120-130之间,110-120和130-140之间的分布大致持平,而两端的数据都比较少。
接下来是制作频数分布表和绘制直方图,这部分和上面的操作有很大类似的地方,并且通过这部分的操作我们可以更直观的看出工人日加工零件数的分布情况。
如果日加工零件数大于等于130为优秀,那么这50个数据中符合条件的有11个,对应的优秀率为11÷
100%=22%,所以从优秀率上看,这50名工人的技能水平还有待提高。
通过这个实验的操作,我EXCEL的基本命令与操作也有了一定的接触,在某种程度上熟悉了EXCEL数据输入、输出与编辑方法,这是对我们平日的学习工作很有帮助的。
实验二:
EXCEL的数据特征描述、抽样推断
熟悉EXCEL用于数据描述统计、列联分析、多元回归的基本菜单操作及命令。
根据实验1的数据,
(1)计算特征值;
(2)判断该企业职工的平均日加工零件数及优秀率的区间;
(3)假设检验(如果以往该企业的工人日加工零件数为115,优秀率为5%,显著性水平为5%)。
1、在相应方格中输入命令,得到各特征值。
COUNT(B4:
B53)并回车,得到50个数据中的单位总量。
SUM(B4:
B53)并回车,得到50个数据中的标志总量。
MAX(B4:
B53)并回车,得到50个数据中的最大值。
MIN(B4:
B53)并回车,得到50个数据中的最小值。
AVERAGE(B4:
B53)并回车,得到50个数据中的平均值。
MEDIAN(B4:
B53)并回车,得到50个数据中的中位数。
GEOMEAN(B4:
B53)并回车,得到50个数据中的几何平均数。
HARMEAN(B4:
B53)并回车,得到50个数据中的调和平均数。
AVEDEV(B4:
B53)并回车,得到50个数据中的变异统计的平均差。
STDEV(B4:
B53)并回车,得到50个数据中的变异统计的标准差。
VAR(B4:
B53)并回车,得到50个数据中的变异统计中的方差。
KURT(B4:
B53)并回车,得到50个数据中的变异统计中的峰度。
SKEW(B4:
B53)并回车,得到50个数据中的变异统计中的偏度。
2、抽样推断
在单元格中输入CONFIDENCE(α所在单元格,标准差所在单元格,样本容量单元格),点得到极限误差,从而得到日价格零件数和优秀率的置信区间。
单元格中键入“=(样本均值单元格-115)/(样本标准差单元格/SQRT(样本容量单元格))”,得到t值;
单元格中键入“=TINA(0.05,49)”得到α=0.05,自由度为49的临界值。
五、实验结果与数据处理
1.特征值
单位总量
标志总量
6537
最大值
509
最小值
107
平均值
130.74
中位数
123
几何平均数
126.2996
调和平均数
124.3825
变异统计的平均差
16.664
变异统计的标准差
55.17202
变异统计中的方差
3043.951
变异统计中的峰度
47.77895
变异统计中的偏度
6.838752
2.抽样推断
a
0.05
极限误差
15.29262
日加工零件数的置信区间[115.44738146.03262],优秀率的置信区间[0.1724360.334821]
t
2.0173018
自信度
49
临界值
2.0095752
由题可知待设检验ho:
u<
=115hi;
u>
115
T=(样本均值单元格-115)/样本标准单元格/(样本容量单元格)=2.0173018
由于TINA(0.05,49)=2.009575237,T>
TINA(0.05,49).所以拒绝ho接受hi
这个实验首先是要求我们计算这50个数据的特征值,然后运用所学知识求企业职工的平均日加工零件数及优秀率的区间,并且进行假设检验。
在所给的实验步骤的指导下,首先我将这50个数据在excel表中从按照纵排依次排序,然后用实验给定的函数:
COUNT(B4:
B53)等,分别输入,得到50个数据的单位总量,标志总量等特征值。
其实在掌握方法后这部分的操作并没有太大的难度。
在算出了相应特征值后,由于要计算置信区间,我用CONFIDENCE(α所在单元格,标准差所在单元格,样本容量单元格),得到了极限误差,并且有知道日加工零件数的平均值是130.74,优秀率是22%,所以根据这些数据从而得到日价格零件数和优秀率的置信区间。
然后是根据公式我们可以得到t值,由t值和极限误差,由于实验已经告诉我们以往该企业的工人加工零件数,优秀率和显著性水平,则我们用总体比例的区间估计来求得优秀率的区间,假设检验阶段用总体比率的假设检验来判断工人平均日加工零件数是否下降。
t>
t(n-1),所以拒绝h0,接受h1,即工人平均日加工零件数比以前有所上升。
假设检验是用来检验总体的,样本与总体的差异是由抽样误差引起还是本质差别引起的统计推断方法,实验二主要是在excel中运用各种命令进行计算大大的减少我们的工作量同时能够更加准确。
实验三:
时间序列分析
掌握EXCEL用于移动平均、线性趋势分析的基本菜单操作及命令。
(二)内容及要求
综合运用统计学时间序列中的移动平均、季节指数运算、时间序列因素分解、图形展示等知识,对某小区居民用电量(千度)季节数据的构成要素进行分解,并作出图形进行分析。
月度
第一年
第二年
第三年
第四年
559
574
585
542
447
469
455
438
345
366
352
341
4
354
327
427
5
374
412
388
358
359
353
332
355
7
365
381
392
376
8
437
460
429
441
9
344
361
382
295
311
291
377
454
453
395
398
12
457
486
491
409
时间序列分析中的移动平均分析原理、季节指数原理等。
1.
(1)输入“年/月度”、“时间标号”,复制各月度销售额到“用电量”。
(2)点击“数据分析”→“移动平均”,输入区域为“销售额”,间隔4,输出“移动平均值”;
同样的办法对“移动平均值”进行2步平均,输出“中心化后的移动平均值”。
(3)对称一下“移动平均值”和“中心化后的移动平均值”,然后用“用电量”除以“中心化后的移动平均值”求出“比值”。
(4)将“比值”中的数据复制到“季节指数计算表”中,计算完成表。
(5)点击“图标向导”→“折线图”,输入区域为季节指数中的数值,修改完成图表。
2.
(1)完善“用电量”和“季节指数”并计算“用电量”/“季节指数”,完成季节分离后的时间序列。
(2)点击“数据分析”→“回归”,Y值输入区域为季节分离后的时间序列,X值输入区域为时间标号,输出。
(3)利用计算出的趋势模型和季节比率,对该小区第五年用电量数据进行预测。
3.点击“图表向导”→“折线图”,数据区域为“用电量”、“季节分离后的时间序列”和“回归后的趋势”,系列产生在“列”,完善标题、X轴、Y轴,完成,再修改完成图。
4.用与图3相同的方法绘制销售额预测图。
五、实验结果与数据处理
年
月份
时间标号
用电量
移动平均
中心化的移动平均
比值
426.25
403.125
0.85581395
380
369
0.95934959
360.5
1.03744799
363
373.375
0.96149983
383.75
381.125
0.95769105
378.5
370.5
1.17948718
362.5
373.625
0.94479759
384.75
387.25
0.76178179
389.75
417.375
1.08775082
445
466.75
0.97911087
488.5
477.5
1.20209424
14
466.5
450.25
1.04164353
15
434
413.75
0.88459215
16
393.5
379
0.86279683
17
364.5
366.375
1.12453088
18
368.25
384.875
0.9171809
19
401.5
393
0.96946565
384.5
379.25
1.21292024
21
383
0.89817232
22
395.25
0.78684377
398.5
428.625
1.05686789
24
458.75
476.75
1.0194022
25
494.75
482.125
1.21337827
469.5
451.375
1.00803102
27
433.25
408.625
0.86142551
28
384
368.625
0.92505934
29
353.25
358.25
1.08304257
30
363.25
374.25
0.88710755
31
385.25
381.875
1.02651391
32
1.14897891
33
0.97931502
34
376.75
0.77239549
35
407.125
0.97021799
36
429.75
448.125
1.09567643
37
459.75
1.17890158
38
0.98426966
414
0.8236715
40
391
380.625
1.12183908
41
370.25
374.625
0.95562229
42
380.75
0.93237032
43
382.5
385.5
0.97535668
44
388.5
391.25
1.12715655
45
394
396.75
0.96282294
399.5
395.5
0.95322377
47
391.5
48
季节指数折线图
2.季节分离后的时间序列
月平均
季节指数
1.202094
1.213378
3.59437409
1.1981247
1.19895566
1.041644
1.008031
3.03394421
1.01131474
1.01201614
0.855814
0.884592
0.861426
3.42550311
0.85637578
0.85696972
0.95935
0.862797
0.925059
3.86904484
0.96726121
0.96793206
1.037448
1.124531
1.083043
4.20064373
1.05016093
1.05088928
0.9615
0.917181
0.887108
3.6981586
0.92453965
0.92518087
0.957691
0.969466
1.026514
3.92902729
0.98225682
0.98293807
1.179487
1.21292
1.148979
4.66854288
1.16713572
1.16794519
0.944798
0.898172
0.979315
3.78510787
0.94627697
0.94693326
0.761782
0.786844
0.772395
3.27424482
0.81856121
0.81912892
1.087751
1.056868
0.970218
3.1148367
1.0382789
1.038999
0.979111
1.019402
1.095676
3.0941895
1.0313965
1.03211183
11.9916831
季节分离后的时间序列
466.2390934
441.6925604
402.5813187
365.7281483
355.8890619
388.0322342
371.3357038
374.1613937
372.7823437
360.1386702
436.9590346
442.7814765
478.7499815
463.4313441
427.0862686
337.8336285
392.0489131
381.5470158
387.6134333
393.8540986
363.277978
379.6716151
435.9965698
470.879207
487.9246327
449.5975726
410.7496354
352.2974536
369.2111123
358.8487514
398.8043723
367.3117572
381.2306688
355.255434
380.1736094
475.7236432
452.060087
432.7994216
397.9137092
441.1466648
340.6638614
383.7087552
382.5266428
377.5862119
403.4075221
460.2450125
383.061