统计学实训报告.docx

上传人:b****3 文档编号:11672233 上传时间:2023-06-02 格式:DOCX 页数:19 大小:76.56KB
下载 相关 举报
统计学实训报告.docx_第1页
第1页 / 共19页
统计学实训报告.docx_第2页
第2页 / 共19页
统计学实训报告.docx_第3页
第3页 / 共19页
统计学实训报告.docx_第4页
第4页 / 共19页
统计学实训报告.docx_第5页
第5页 / 共19页
统计学实训报告.docx_第6页
第6页 / 共19页
统计学实训报告.docx_第7页
第7页 / 共19页
统计学实训报告.docx_第8页
第8页 / 共19页
统计学实训报告.docx_第9页
第9页 / 共19页
统计学实训报告.docx_第10页
第10页 / 共19页
统计学实训报告.docx_第11页
第11页 / 共19页
统计学实训报告.docx_第12页
第12页 / 共19页
统计学实训报告.docx_第13页
第13页 / 共19页
统计学实训报告.docx_第14页
第14页 / 共19页
统计学实训报告.docx_第15页
第15页 / 共19页
统计学实训报告.docx_第16页
第16页 / 共19页
统计学实训报告.docx_第17页
第17页 / 共19页
统计学实训报告.docx_第18页
第18页 / 共19页
统计学实训报告.docx_第19页
第19页 / 共19页
亲,该文档总共19页,全部预览完了,如果喜欢就下载吧!
下载资源
资源描述

统计学实训报告.docx

《统计学实训报告.docx》由会员分享,可在线阅读,更多相关《统计学实训报告.docx(19页珍藏版)》请在冰点文库上搜索。

统计学实训报告.docx

统计学实训报告

四川师范大学经济与管理学院

统计分析实训报告册

课程名称统计分析软件应用实训

专业国际经济与贸易

班级2015级4班

学生姓名杨冬梅

学号2015120429

指导老师张谦

实训一

一、实训目的

利用Excel掌握建立数据文件、数据整理、数据描述与显示等操作。

能计算各种平均指标、离散指标,会应用基本统计函数,会使用Excel描述统计工具进行统计分析。

二、实训内容、步骤、结果分析

(一)基本函数使用

0)实训内容

(3)计算个人平均成绩,按平均分从大到小进行排序,挑选出学习成绩最好、最差的3个同学;

(4)求这3门课的平均分和标准差、最大值、最小值、峰度、偏度;

表1某班学生期末成绩单

学号

性别

数学

语文

外语

学号

性别

数学

语文

外语

0301

88

86

72

0311

56

65

72

0302

75

88

90

0312

82

78

88

0303

80

76

63

0313

72

76

63

0304

75

92

78

0314

78

80

86

0305

65

70

58

0315

80

77

66

0306

72

50

80

0316

65

78

81

0307

91

88

95

0317

98

76

80

0308

68

76

81

0318

60

77

66

0309

72

77

79

0319

70

67

68

0310

95

88

96

0320

82

78

75

1)实训步骤

0)先使用AVERAGE函数,计算出学号为301的平均分,然后使用填充柄计算出其他同学的平均分。

选中A1:

F21,选择自定义排序,按“平均分”降序排序,再突出显示单元格,分别筛选出排名最靠前和靠后的三名同学,用红色字体突出显示成绩最好的三位同学,用蓝色字体显示成绩最差的三名同学。

1)用AVERAGE函数计算出全班数学、语文、外语的平均数;

用STDEV函数计算出全班数学、语文、外语的标准差;

用MAX函数计算出全班数学、语文、外语的最大值;

用MIN函数计算出全班数学、语文、外语的最小值;

用KURT函数计算出全班数学、语文、外语的峰度系数;

用SKEW函数计算出全班数学、语文、外语的偏度系数。

2)实验结果分析

0)计算出全班每位同学的平均分,降序排序后,筛选出成绩最好的三名同学为310,307,317;成绩最差的三名同学306,305,311。

1)

用AVERAGE函数计算出全班数学、语文、外语平均分分别为76.2,77.15,76.85;

用STDEV函数计算出全班数学、语文、外语标准差分别为11.16667976,9.477258098;10.8592672;

用MAX函数计算出全班数学、语文、外语最大值分别为98,92,96;

用MAN函数计算出全班数学、语文、外语最小值分别为56,50,58;

用KURT函数计算出全班数学、语文、外语峰度系数分别为-0.312074338,2.503166848,-0.780748813,分别为平峰、尖峰、平峰分布;

用SKEW函数计算出全班数学、语文、外语偏度系数分别为0.255195107,-1.057909963,0.098244068,分别为右偏、左偏、右偏分布。

(二)计算各种平均指标

0)实训内容

0)(算术平均数)中国股市中的10种股票在2014年9月1日收盘价如表,求该10种股票价格当日的平均价格。

股票代码

证券名称

价格

股票代码

证券名称

价格

600519

贵州茅台

165.21

300002

神州泰岳

124

002310

东方园林

116.5

002304

洋河股份

110

300026

红日药业

100.89

002294

信立泰

94.5

600547

山东黄金

79.02

600150

中国船舶

76.8

300024

机器人

76.38

300011

鼎汉技术

73

1)(加权平均数)某公司员工工资情况如下表,计算平均工资。

按工资分组

频数

组中值x

xf

1600以下

4

1600-1700

6

1700-1800

12

1800-1900

15

1900-2000

3

合计

40

2)(调和平均数)成都某小区菜市芹菜的价格,早上3.8元/kg,中午3.5元/kg,晚上2.9元/kg。

如果早、中、晚各买1KG,求平均价格。

3)(几何平均数)孙女士到中国银行存入一笔资金,按复利计算,10年的年利率分别是2.88%有3年,2.79%有2年,3.6%有2年,5%有3年。

计算其平均存款利率。

4)(中位数、众数)根据上面

(1)的股票价格求中位数。

根据上面

(2)员工工资表计算众数。

0)实训步骤

(1)在EXCEL中依次输入当天十只股票的价格,用AVERAGE函数计算当天十支股票平均价格。

(2)输入各组组中值,计算出各组xf值和合计xf值,再用合计xf值除以权数40,得到加权平均数,即该公司的平均工资。

(3)用HARMEAN函数计算出调和平均数。

(4)在EXCEL中输入十年的年利率,用GEOMEAN函数计算出十年的几何平均数利率。

(5)先排序,再用MEDIAN函数计算出当日十支股票的中位数。

筛选工资频数的最大值,用黄色填充该单元格,则该频数对应的工资水平计算为众数。

1)实训结果分析

0)计算出当天十支股票平均价格结果为101.63。

1)计算出该公司的平均工资为1767.50。

2)计算出调和平均数结果为3.36。

3)计算出十年的平均利率为3.53%

4)计算出中位数为97.695,计算出众数为1850。

(三)计算各种离散指标

11.实训内容

0)(极差)景经理在2013年度工资收入分别是5280、6421、7345、4888、7243、6896、5889、7124、7586、9200、7854、8455,计算其工资收入的极差。

1)(标准差和方差)根据

(二)

(2)题的员工工资表计算员工工资收入的方差和标准差。

2)(离散系数)根据

(二)

(2)题的员工工资表计算员工工资收入的离散系数。

12.实训步骤

0)在EXCEL表格中输入2013年度每个月的工资,用MAX(B1:

B12)-MIN(B1:

B12)函数,得到其工资极差。

1)先计算出所有工资的加权平均数平均数,在组中值后一列,计算出“=B20*(C20-$C$25)^2”的值,即每个分组与均值的的加权离差平方和,然后在D25单元格用SUM函数求和D20:

D24的值,即所有分组的加权离差平方和之和,在D26单元格计算“=D25/(B25-1)”的值,得到方差,在D27单元格用SQRT函数计算出标准差。

2)先计算出工资的加权平均数,再用STDEV函数计算出标准差,再用标准差除以加权平均数,得到离散系数。

13.实训结果分析

(1)如图,得到其工资极差为4312元,这说明其月收入差距较大。

(2)计算得到员工工资的方差为12250,标准差为110.67972。

(3)计算得到工资的离散系数为0.0626194,说明员工工资分布较集中。

(四)利用描述统计工具进行指标分析

0)实训内容

现有300名员工,从中随机抽取30名员工的工资进行统计,具体资料为3569、3107、3013、2187、1848、1689、1368、1342、1256、1133、1157、1082、1088、2874、2310、1762、3172、1939、1851、1480、1424、1354、1700、1097、2003、3133、3176、1459、1097、1396,使用描述统计工具对工资进行统计。

1)实训步骤

在EXCEL表中输入数据,选择数据分析中的描述统计,选择计算区域为A1:

A30单元格,选中汇总统计和平均数置信度,点击确定,得到描述统计的结果。

2)实训结果分析

如图所示,得到描述统计结果:

平均数为1902.2;标准误差为141.7646;中位数为1694.5;众数为1097;标准差为776.4767;方差为602916;峰度为-0.6732,即平峰分布;偏度为0.832503,即右偏分布;最小值为1082,最大值为3569;区域为2487,即极差为2487;工资总和为57066;由平均数和置信度可计算得到,在95%的置信度度水平下的区间估计为2192.14-1612.26。

三、实训总结

0)我通过利用Excel掌握了建立数据文件、数据整理、数据描述与显示等操作。

能熟练计算各种平均指标、离散指标,会应用基本统计函数,会使用Excel描述统计工具进行统计分析。

1)我学会了利用众数、中位数、分位数、均值、几何平均数等来测度数据的集中趋势,利用极差、方差、标准差、离散系数。

偏度和峰度系数等来测度数据的离散程度,进而更好的把握和分析数据。

实训二

一、实训目的

掌握用Excel进行统计分组。

掌握频数分布表和直方图数据分析基本技巧和操作方法。

利用统计图表工具进行数据直观分析。

掌握Excel柱形图、条形图、折线图、饼图、散点图、面积图、环形图等各种图形工具的使用方法和统计作用。

二、实训内容、步骤及结果分析

0)函数法进行统计分组、编制频数分布表、绘制直方图

(1)实训内容

在Excel中利用函数进行统计分组和编制频数分布表可利用COUNTIF()和FREQUENCY()等函数,但要根据变量值的类型不同而选择不同的函数。

某区共有30家企业,他们类型情况如下表,试编制此区企业类型的频数分布表,并生成直方图和拆线图(要求合并在一张图上)。

企业编号

企业类型

企业编号

企业类型

1

中型企业

16

中型企业

2

大型企业

17

大型企业

3

大型企业

18

小型企业

4

小型企业

19

小型企业

5

小型企业

20

中型企业

6

小型企业

21

小型企业

7

中型企业

22

小型企业

8

大型企业

23

中型企业

9

中型企业

24

小型企业

10

小型企业

25

中型企业

11

中型企业

26

大型企业

12

小型企业

27

中型企业

13

小型企业

28

大型企业

14

大型企业

29

小型企业

15

中型企业

30

小型企业

(2)实训步骤

1)先在EXCEL中分别输入该地区30家企业的类型,用COUNTIF函数计算大型企业、中型企业和小型企业的数量,制作出该地区企业类型情况的频率分布表。

2)利用数据分析工具,选择直方图,选择数据区域,点击确定,得到直方图,再把直方图的分类间距调整为0。

3)选中该地区企业类型情况的频率分布表,点击插入图表,制作出折线图,调整横纵轴距离。

(1)实训结果分析

如图,得到该地区企业类型情况的频率分布表、直方图和折线图,可以看出该地区的企业以大中型企业为主。

1)其他图形

(1)实训内容

根据某地三大产业情况基本数据,绘制该地三个产业的条形图、饼图、折线图。

年份

第一产业

第二产业

第三产业

1990

53.2

29.8

17

1995

44

33.7

22.3

2000

35.6

35.4

29

2004

26.1

43.6

30.3

2005

24.5

45.1

30.4

2006

22.6

45.8

31.6

2007

20.1

46.8

33.1

2008

19.2

47.6

33.2

(2)实训步骤

a)在EXCEL中输入该地三大产业情况基本数据,选中输入的数据,插入条形图,编辑条形图横纵轴坐标序列,横轴为各产业所占比率,纵轴为年份。

b)选中该地区2008年三大产业分布数据,插入饼状图。

c)选中所输入的数据,插入折线图。

(3)实训结果分析

如图所示,得到该地区三大产业分布情况的条形图、饼图和折线图。

从折线图和条形图可以看出,该地区近二十年来产业结构发生了巨大的变化。

第一产业比重持续下降,第二产业持续增大,第三产业比重总体上也不断增大;其中,第二产业比重最大。

第二、三产业比重的变化,反映了该地区产业结构在逐步优化。

从饼图可以看出,2008年该地区的第二产业所占比最大,达到了48%,第三产业次之,说明了该地区的产业结构仍以第二产业为主导,第三产业水平还不够高,仍需转变发展方式,促进产业结构调整。

三、实训总结

1.通过本节实训练习,我学会了频数分布表和直方图数据分析基本技巧和操作方法,学会了利用统计图表工具进行数据直观分析。

2.我掌握了Excel柱形图、条形图、折线图、饼图、散点图、面积图、环形图等各种图形工具的使用方法和统计作用。

3.通过折线图能直观看出数据的发展趋势;直方图应用比较广泛,但可能造成数据丢失;饼图可以形象直观地看出各组成部分所占比例,便于比较等。

实训三

一、实训目的

掌握Excel软件中假设检验方法(单样本t检验)及置信区间应用。

二、实训内容

在正常生产情况下,某厂生产的一种无缝钢管服从正态分布。

从某日生产的钢管中随机抽取10根,测得其内径分别为:

53.8、54.0、55.1、54.2、52.1、54.2、55.0、55.8、55.4、55.5(单位:

mm)

(一)区间估计

建立该批无缝钢管平均内径95%的置信区间。

(二)假设检验

若该日无缝钢管的内径服从均值为54mm的正态分布。

试在5%的显着性水平下检验该日产品的生产是否正常?

(三)用P值检验

对第

(二)题的假设检验采用P值检验方法进行检验

三、实训步骤

(一)区间估计

(1)在EXCEL中输入10个样本数据,利用AVERAGE函数计算出其均值,再利用STDEV函数得到其标准差。

(2)查t分布表,得到显着性水平?

=0.05下自由度为9的t值

(3)根据公式

写出置信区间

(二)假设检验

(1)、提出原假设和备择假设。

(2)、根据

(一)得到样本均值和样本标准差,计算出检验统计量t。

(3)、用t和

相比得出结论。

(三)用P值检验

(1)进入EXCEL界面,插入函数f(x),在函数分类中点击“统计”,并在函数名单下选择“TDIST”,然后点击确定。

(2)在弹出的对话框的“X”栏中输入计算出的t的绝对值“1.4728”。

在“Deg_freedom”(自由度)栏中,输入自由度“9”。

在“Tails”栏中,输入“2”。

四、实训结果及分析

(一)区间估计:

由于样本数据为10,为小于30的小样本,且其总体方差

未知,则用样本方差

代替总体方差

,故样本经过标准化的随机变量服从自由度为(n-1)的t分布。

由抽样结果计算得到,

根据?

=0.05查t分布表得到

则平均内径的置信区间为

即(53.73,55.29),该批无缝钢管平均内径95%的置信区间为53.73-55.29mm。

(二)假设检验

依题意建立如下原假设与备择假设:

H0:

u=54该日产品的生产是正常的

该日产品的生产不正常的

根据样本数据得到:

由于n<30为小样本,计算检验统计量为:

根据自由度n-1=10-1=9,查t分布表得:

由于

所以不拒绝原假设,样本提供的数据还不足以推翻原假设,即该日产品的生产正常。

(三)用P值检验

Excel计算的P值结果为0.912552913,如图所示。

由于P值=0.912552913>0.05,所以不拒绝原假设,样本提供的数据还不足以推翻原假设,即该日产品的生产正常。

五、实训总结

1.在进行区间估计时,应首先分析题目条件,看原总体是否服从正态分布、总体方差是否已知、用于构造估计量的样本是大样本还是小样本等几种情况,不同的条件下样本数据服从不同的分布形态。

在写出置信区间后,注意结合题目分析其现实意义。

2.在进行假设检验时,同样要考察所抽取的样本是否为大样本、是否服从正态分布、总体方差是否已知等几种情况。

不用的假设条件下,在对总体进行假设检验时,所采用的检验步骤和检验统计量不同。

此外,在提出假设时,主义原假设和备择假设的选取。

3.在利用P值进行决策时,P值越小,说明观测到的数据与H0之间不一致的程度就越大,检验的结果也就越显着。

不论是单侧检验,还是双侧检验,用P值进行决策的原则为:

如果P值<

,拒绝H0;如果P值>

,不拒绝H0。

实训四

一、目的要求

掌握Excel软件中方差分析应用(单因素方差分析和双因素方差分析)

二、实训内容

(一)单因素方差分析

某城市东西南北5个地区发生交通事故的次数如下表所示。

由于是随机抽样,有一些地区的汽车密度高、发生事故多(如南部和西部),而有些地区汽车密度低、发生事故少(如东部)。

试以

=5%的显着水平检验各地区平均每天交通事故次数是否相等?

表1某城市5个地区交通事故发生次数

东部

北部

中部

南部

西部

15

17

14

11

-

-

12

10

13

17

14

-

10

14

13

15

12

-

14

9

7

10

8

7

13

12

9

14

10

9

(二)双因素方差分析

某农科所实训在水溶液中种植西红柿,采用了3种施肥方式和4种不同的水温。

3种施肥方式一开始就给可溶性的肥料;每两个月给1/2的溶液;每月给以1/4的溶液。

水温分别为4℃、10℃、16℃、20℃。

实验结果的产量如下表所示。

表2不同水温水平不同施肥方式下的西红柿产量

水温

施肥方式

一次施肥

二次施肥

四次施肥

冷(4℃)

凉(10℃)

温(16℃)

热(20℃)

20

16

9

8

19

15

10

7

21

14

11

6

问施肥的方式和水温对产量的影响是否显着(

=5%)?

三、实训步骤

(一)单因素方差分析

在EXCEL中输入数据,点击数据分析,选择方差分析,在弹出的对话框中的“输入区域”选择样本数据所在的单元格,在“

”方框中输入“0.05”,点击确定,得到方差分析结果。

(二)双因素方差分析

在EXCEL中输入数据,点击数据分析,选择无重复因素方差分析,在弹出的对话框中的“输入区域”选择样本数据所在的单元格,在“

”方框中输入“0.05”,点击确定,得到方差分析结果,如下图所示。

四、实训结果及分析

(一)单因素方差分析

13.提出假设:

各地区平均每天交通事故次数相等

H1:

ui(i=1,2,3,4,5)不完全相等各地区平均每天交通事故次数不相等

用Excel给出单因素方差分析的计算结果,如下图:

根据方差分析表得出如下结论:

由于

,所以拒绝原假设,即

不成立,表明

之间的差异是显着的,即各地区平均每天交通事故次数不相等。

(1)双因素方差分析

首先对两个因素分别提出如下假设:

对行因素提出假设:

气温对产量没有影响

H1:

ui(i=1,2,3,4)不完全相等气温对产量有影响

对列因素提出假设:

施肥方式对产量没有显着影响

H1:

ui(i=1,2,3)不完全相等施肥方式对产量有显着影响

用Excel给出无重复双因素方差分析的计算结果,如下图:

根据方差分析表得出如下结论:

由于

,所以拒绝原假设,表明

之间的差异是显着的,即气温对产量有影响。

由于

,所以不拒绝原假设,表明

之间的差异是不显着的,即施肥方式对产量没有显着影响。

五、实训总结

通过本章实训,我学会了用方差分析来检验总体均值是否相等。

根据所涉及到的变量的多少,方差分析主要有单因素方差分析和双因素方差分析。

单因素方差分析是研究一个分类的自变量与一个数值的因变量之间的关系,双因素方差分析则是研究两个分类的自变量同因变量之间的关系。

对于双因素方差分析,当研究的两个因素之间无交互作用时,称为无交互作用的双因素方差分析或无重复双因素方差分析,当所研究的两个因素之间有交互作用时,称为有交互作用的双因素方差分析或可重复双因素方差分析。

实训五

一、实训目的

掌握Excel软件中回归分析及相关分析应用

二、实训内容

零售商要了解每周的广告费X及消费额Y之间的关系,记录如表所示。

表1每周广告费X与消费额Y数据表

X

40

20

25

18

50

45

40

22

55

48

38

52

Y

385

400

395

365

475

440

490

420

560

525

480

510

(0)画出散点图;

(1)计算相关系数,并进行相关系数的显着性检验(

=5%);

(2)求出线性回归方程,并评价其拟合程度;

(3)请对回归系数作统计检验。

=5%)。

三、实训步骤

(1)画出散点图:

在Excel中输入表格数据,插入散点图,点击“设计”的“选择数据”,然后点击左栏添加,选中横纵坐标所在单元格,单击确定。

如图所示:

(2)计算相关系数:

点击数据,选择数据分析,在弹出的对话框中下拉选中“相关系数”,点击确定,然后在弹出的对话框中,输入输入区域数据和输出区域单元格,点击确定,得到相关系数分析表。

(3)求出线性回归方程:

点击数据,选择数据分析,在弹出的对话框中下拉选中“回归”,点击确定,然后在弹出的对话框中,分别在X和Y值的输入区域输入X和Y值,选择输出区域单元格,点击确定,得到回归分析表。

(4)题同(3)题步骤。

四、实训结果及分析

(1)画出散点图:

如图所示为每周广告费X与消费额Y的散点图。

(2)计算相关系数:

如图,用回归方法得到相关系数。

3)求出相关系数为:

4)根据Excel进行显着性检验:

提出假设:

检验统计量

由上得:

r=0.82364

由题知:

n=12解得

又由显着性水平

得到

得到结论:

因为

,所以拒绝原假设

(3)求出线性回归方程:

如图得到回归分析表,

从表中可得到,估计的截距项

,估计的斜率系数

,即估计出的样本回归函数为:

这说明广告费每增加一个单位,消费额将增加3.8497个单位。

从表中可得到标准误差为36.865,数值较小,说明回归方程的拟合程度较好。

(4)对回归系数作统计检验:

提出原假设与备择假设为:

原假设:

备择假设:

显着性水平

,查t分布表得

由3题中的图可得:

表明拒绝

,即说明每周的广告费X对消费额Y有显着性影响。

又由表上得到SignificanceF=0.000991224,相当于计算后所得到的P值,与显着性水平?

比较,SignificanceF=0.000991224

=0.05,所以拒绝原假设,表明X和Y之间存在显着的线性关系。

五、实训总结

1.

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 医药卫生 > 基础医学

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2