统计实验指导书.docx
《统计实验指导书.docx》由会员分享,可在线阅读,更多相关《统计实验指导书.docx(48页珍藏版)》请在冰点文库上搜索。
统计实验指导书
第十章统计实验
实验一数据整理和数据描述
一、实验目的和要求
能熟练的进行统计数据的录入、分组、汇总及各种常用统计图表的绘制。
二、实验内容
数据的排序、分类汇总、统计分组、数据透视分析、绘制统计图
三、实验步骤
(一)数据的排序
①打开“数据整理.xls”工作簿,选定“等候时间”工作表。
②利用鼠标选定单元格A1:
B37区域
③在菜单中选择“数据”中的“排序”选项,则弹出排序对话框。
④在排序对话框窗口中,选择“主要关键字”列表中的“等候时间”作为排序关键字,并选择按“升序”排序。
由于所选取数据中已经包含标题,所以在“当前数据清单”中选择“有标题行”,然后单击“确定”按钮,即可得到排序的结果。
(二)分类汇总
先选择需要分类汇总的数据区域,然后选择“数据”菜单中的“分类汇总”选项,则打开“分类汇总”对话框。
(分类汇总前先排序一下)
在“分类字段”的下拉式列表中选择要进行分类的列标题,在“汇总方式”的下拉式列表中选择行汇总的方式,在资料“电器销售量”中分别选择按“订货单位”和“电器种类”进行分类,选择按“求和”进行汇总,单击“确定”按钮,便得到分类汇总的结果。
(三)数据筛选
(1)点击Excel表中的任意一格,选择“数据”菜单,点击左键,选择“筛选”中的“自动筛选”命令。
这时在表格第一行的每一格右下角会出现下拉箭头。
要筛选出移动电话类型为神州行的用户,就点击“数字移动电话类型”这格的下拉箭头,选择神州行,就显示出所有神州行的用户。
再点击这个下拉箭头,选择“全部”,又恢复原状。
(2)要筛选出每周通话次数最高的前3名用户,可点击“每周通话次数”这格的下拉箭头,选择“前10个……”,出现一个对话框,输入3,就显示出次数最高的用户。
(3)要筛选出通话次数都大于30次的,性别为男的神州行的城市用户,需要使用“高级筛选”命令。
使用高级筛选时,必须建立条件区域。
这时需要在表格以外的地方制作条件区域。
现将第一行(标志名称)复制到如E1,分别在名称对应的下方键入“城市”、“>30”“神州行”、“男”,然后在数据菜单上选择“筛选”中的“高级筛选”,出现对话框,在“列表区域”中,点击有红色箭头的图标,然后用鼠标左键点住A1不放,向右下方拉动,直到D1001,这时表格就在一个闪烁的框中。
其次选择“条件区域”,点击红色图标,用鼠标左键又选中从E1到H2,最后点确定,结果就出来了。
如想要再试一次,就选择“数据”菜单中“筛选”的“全部显示”,全部数据恢复。
(四)统计分组
用Excel进行统计分组和编制频数分布表有两种方法,一是函数法;二是利用数据分析中的“直方图”工具。
1、函数法
在Excel中利用函数进行统计分组和编制频数分布表可利用COUNTIF()和FREQUENCY()等函数,但要根据变量值的类型不同而选择不同的函数。
当分组标志是品质标志时应使用COUNTIF()函数;当分组标志是数量标志时应使用FREQUENCY()函数。
(1)COUNTIF()函数
COUNTIF()函数的语法构成是:
COUNTIF(区域,条件)。
具体使用方法举例如下。
【例10.1】某学院某系某毕业班学生共有30人,他们的毕业就业情况如下表。
试编制此调查数据的频数分布表。
表10-1某毕业班学生毕业就业情况表
学生编号
性别
年龄
工作单位
学生编号
性别
年龄
工作单位
1
男
24
事业单位
16
男
23
企业
2
男
21
企业
17
男
23
国家机关
3
女
22
事业单位
18
女
19
企业
4
女
23
事业单位
19
男
22
事业单位
5
男
21
企业
20
女
22
企业
6
男
21
企业
21
男
22
企业
7
女
22
国家机关
22
女
20
自主创业
8
女
20
企业
23
男
20
企业
9
男
23
事业单位
24
女
23
企业
10
女
23
企业
25
女
23
企业
11
女
24
企业
26
男
24
事业单位
12
男
21
企业
27
女
21
企业
13
女
23
企业
28
男
20
国家机关
14
男
23
事业单位
29
女
20
企业
15
女
20
企业
30
男
21
企业
操作步骤:
(1)打开“数据整理”文件,选择“学生毕业就业情况表”。
(2)选择单元格G2至G5区域,在“插入”菜单中单击“函数”
选项,打开“粘贴函数”对话框;在“函数分类”列表中选择“常用函数”或者选择“统计”也可以,在“函数名”列表中选择“COUNTIF”。
(3)单击“确定”按钮,Excel弹出“函数参数”对话框。
在数据区域“Range”中输入单元格D2:
D31,在数据接受区间Criteria中输入单元格F2:
F5。
(4)由于频数分布是数组操作,所以,此处不能直接单击“确定”按钮,而应按Ctrl+Shift组合键,同时敲“回车”键,得到频数分布。
事业单位
7
企业
19
国家机关
3
自主创业
1
(2)FREQUENCY()函数
FEQUENCY()可以对一列垂直数组返回某个区域中数据的频数分布。
其语法形式为:
FREQUENCY(data_array,bins_array)
其中:
Data_array为用来编制频数分布的数据,Bins_array为频数或次数的接收区间。
【例10.2】某班64名学生成绩如“学生成绩表”,试编制英语成绩的频数分布表。
操作步骤:
(1)打开“学生成绩表”;在单元格I2中输入“分组”,在J2中输入“分组组限”,在单元格K2中输入“频数”;在I3:
I7区域中依次输入60以下、60—70、70—80、80—90、90—100,表示分组方式,但是这还不能作为频数接收区间;在J3:
J7区域中依次输入59、69、79、89、100,表示分组组限,作为频数接收区间,它们分别表明60分以下的人数,60分以上、70分以下的人数等,这与前列分组方式是一致的。
(2)选择单元格K3至K7区域,在“插入”菜单中单击“函数”
选项,打开“粘贴函数”对话框;在“函数分类”列表中选择“常用函数”或者选择“统计”也可以,在“函数名”列表中选择“FREQUENCY”。
(3)单击“确定”按钮,Excel弹出“频数分布”对话框。
在数据区域“Data_array”中输入单元格E2:
E65,在数据接受区间Bins-array中输入单元格J3:
J7。
(4)由于频数分布是数组操作,所以,此处不能直接单击“确定”按钮,而应按Ctrl+Shift组合键,同时敲“回车”键,得到频数分布。
2、利用“直方图”工具进行统计分组
直方图分析工具是一个用于确定数据的频数分布、累计频数分布,并提供直方图的分析模块。
它在给定工作表中数据单元格区域和接收区间的情况下,计算数据的频数和累积频数。
具体使用方法举例如下。
仍以“某班学生英语成绩表”为例,试编制此调查数据的频数分布表。
操作步骤:
(1)在“工具”菜单中,单击“数据分析”选项,弹出“数据分析”对话框。
注意:
如果用户在Excel的“工具”菜单中没有找到“数据分析”选项,说明用户安装Excel不完整,必须在Excel中重新安装“分析工具库”内容。
具体安装方法如下。
①在“工具”菜单中,单击“加载宏”选项。
②选中“分析工具库”和“分析工具库-VBA函数”复选框,单击“确定”按钮,将会引导用户进行安装。
如图所示。
如果用户在安装Excel时选择的是“典型安装”,则需要使用CD—ROM进行安装,如果用户在安装Excel时选择的是“完全安装”,则Excel会从硬盘中直接进行安装。
③无论是何种情况,安装完毕后,“数据分析”选项会自动出现在Excel的工具菜单中。
(2)在“分析工具”列表框中,单击“直方图”分析工具,则会弹出“直方图”对话框。
(3)选择输入选项
输入区域:
在此输入待分析数据区域的单元格引用;
接收区域:
表示分组标志所在的区域,在此输入接收区域的单元格引用,该区域应包含一组可选的用来定义接收区间的边界值,这些值应当按升序排列,如本例中的“分组组限”。
关于这一点,与前面所讲的FREQUENCY函数一致。
在“输入区域”中,输入$E$1:
$E$65;选好接收区域的内容:
$J$2:
$J$7。
“标志”选项打钩。
(4)选择输出选项
输出选项中可选择输出区域、新工作表或新工作薄。
在这里选择输出区域,可以直接选择一个区域,也可以直接输出一个单元格,该单元格代表输出区域的左上角,这里常常只输入一个单元格,因为我们往往事先并不知道具体的输出区域有多大。
输出选项中还有以下选项:
柏拉图:
选中此复选框,可以在输出表中同时按降序排列频率数据。
如果此复选框被清除,Excel将只按升序来排列数据。
累积百分比:
选中此复选框,可以在输出表中添加一列累积百分比数值,并同时在直方图表中添加累积百分比折线。
如果清除此选项,则会省略累积百分比。
图表输出:
选中此复选框,可以在输出表中同时生成一个嵌入式直方图表。
本例中,我们选中“累积百分比”和“图表输出”两个复选框。
(5)单击“确定”按钮,可得输出结果。
注意:
在默认的直方图中,柱形彼此分开,如果要将其连接起来,操作步骤如下:
①单击某个柱形,双击鼠标右键,在弹出菜单中,选择“数据系列格式”选项,
弹出“数据系列格式”对话框。
②在对话框中选择“选项”标签,将间距宽度从150改成0,点上“依数据点分色”,再单击“确定”按钮,得到直方图。
(五)数据透视分析
数据透视主要是处理以文字形式表现的资料,如性别、职业、文化程度等。
分为单变量表格与双变量表格,前者称为单向表,后者称为交叉表。
1、单向表
【例10.3】某移动通讯公司要制定新一年的销售计划,需要向市场了解移动用户对数字移动电话类型的需求。
经过问卷设计,在该地区抽取了1000个样本进行问卷调查,获得关于移动电话用户消费行为的一些数据资料,试根据工作表中的数据分析该地区移动电话用户的电话类型偏好。
(1)打开“数据整理.xls”工作簿,选定“移动电话调查”工作表。
(2)单击“数据”菜单中的“数据透视表和数据透视图”选项,Excel弹出数据透视表向导对话框。
(3)根据向导要求,第1步是指定“数据源类型”和确定所需创建的“报表类型”。
选择“数据列表或数据库”作为数据源,选择“数据透视表”作为报表类型。
最后单击“下一步”。
(4)第2步是确定数据区域,本例中数据所覆盖区域为A1:
D1001单元格,单击“下一步”按钮,向导给出第3步操作对话框窗口。
(5)第3步确定数据透视表的位置。
选择现有工作表,并利用鼠标将数据透视表的位置确定在E1单元格中。
(6)单击“布局”,Excel弹出对话框窗口,选择右边的“数字移动电话类型”字段,并将它拖到左边的“行”区,再选择“数字移动电话类型”字段,将其拖放在“数据”区域中,显示为“计数项:
数字移动电话类型”,以便进行数据汇总。
(7)双击数据区域中的“计数项:
数字移动电话类型”字段,打开“数据透视表字段”对话框,在“汇总方式”列表中选择“计数”。
如果想选择数据显示方式,可单击图右侧的“选项”按钮,则EXCEL弹出“数据显示方式”。
在“数据显示方式”的下拉选项中确定“占同列数据总和的百分比”选项,单击“确定”按钮,则版式调整完毕。
再单击“确定”按钮,回到数据透视表步骤3。
(8)单击数据透视表步骤3中的“完成”按钮。
2、交叉表
【例10.4】该公司市场部经理希望根据上例中的调查结果,确认不同性别的用户,其移动电话类型偏好是否存在着不同。
(1)打开“数据整理.xls”工作簿,选定“移动电话调查”工作表。
(2)从“数据”菜单中选择“数据透视表和图表报告”选项,得到“数据透视表对话框”窗口。
在第1步之中选择“数据清单或数据库”与“数据透视表”,单击“下一步”按钮。
(3)在第2步中,确定数据区域A1:
D1001,单击“下一步”按钮
(4)在第3步中,确定数据透视表的位置,将其位置调整到“H1”单元格。
然后,单击“布局”按钮,打开“布局”对话框。
(5)将对话框右边的“数字移动电话类型”字段拖到左边的“行”区作为分组变量,再将右边的“性别”字段拖到“列”区,作为交叉分析的变量,最后将右边的“性别”字段拖放到“数据”区域中,并选择计数项。
如果希望结果是以百分比的形式显示,则可双击数据区域中的“计数项,性别”,则会弹出“数据透视表字段”对话框。
选择“占同列数据总和的百分比”选项,来表示所出现的频率,最后,单击“确定”按钮,又回到“版式”对话框。
(6)单击“确定”按钮,回到第3步,要注意数据透视表的位置定在单元格H1,最后,单击“完成”按钮,得到交叉表。
(六)用Excel绘制统计图
利用Excel绘制统计图比较方便,Excel提供“图表向导”工具,帮助创建适合于数据信息和分析目的的各种图表,Excel提供的统计图有多种,包括柱形图、条形图、折线图、饼图、散点图、面积图、环形图等等,各种图形的绘制方法大同小异。
图表操作的基本步骤:
(1)使用“图表向导”工具制作图表之前,选定数据所在的单元格,如果希望数据的行列标题显示在图表中,则选定区域还应包括含有标题的单元格。
(2)单击“插入”菜单中的“图表”选项,按照“图表向导”4个步骤的指令进行操作。
第1步“图表类型”:
每种类型的图表都有两种以上的子类型,选中所需要的图形以及它的子图形,单击“下一步”按钮。
第2步“图表数据源”:
选定包含数据和行列标志的工作表单元格,即便工作表包含多个行列标志,也能在图表中显示它们。
生成图表时,应将各行列标志包含到选定区域中。
若预览图表看去很合适,则表示所选数据区正确。
单击“下一步”按钮。
第3步“图表选项”:
为选定的图表设置某些标准选项。
修改这些设置时,随时查看预览图表可以帮助我们确定设置是否合适。
单击“下一步”按钮。
第4步“图表位置”:
可以将图表放置在工作表上,或者单独置于一张新的图表工作表上,在这一步中,我们为图表工作表命名,或者选择现有工作表的名称,单击“完成”按钮。
具体使用方法举例如下。
1、条形图与柱形图
【例10.5】薪酬是众人所关心的主题,也更是当代经理人所关心的主题。
北京、上海、深圳三个市经理人的薪酬是我国经理人“薪酬市场”的晴雨表。
1999年《经理人》杂志所作的薪酬调查发现:
所调查的经理人中,平均月收入最高的是上海经理人,为7767元;其次是深圳经理人,为7602元;最后是北京经理人,为7288元。
结论应当是最高为上海经理人。
那么此结论是否可以用图形来表示呢?
(1)打开“数据整理xls“工作簿,选择“薪酬”工作表。
(2)在Excel的“插入”菜单中选择“图表”选项,Excel会启动图表向导,弹出“图表向导”对话框窗口。
在“图表类型”列表中选择“柱形图”,在“子图表类型”列表中选择“三维簇状柱形图”,单击“下一步”按钮,进入数据源对话框。
(3)在这步对话框中,主要是选择数据源。
单击“数据区域”右端的“压缩对话框”按钮,打开工作表,在工作表上将鼠标指向单元格A1,按下鼠标左键,拖到B4单元格,再单击“压缩对话框”按钮,回到源数据对话框。
确定A1:
B4单元格作为此图的数据源,同时,也应注意数据系列是以行还是以列方式排列,如果正确,此时,便有一个预览的图形,如满意可单击“下一步”按钮,进入“图表选项”对话框。
(4)单击对话框上方的“标题”页面,在标题中输入“三城市薪酬比较”;在“图例”页面中选择底部,至于其他功能则不需改动与填加,这些过程都会在图表预览框中看到,如果满意,单击“完成”按钮结束,得到图形。
(5)双击所绘制的图形,则会得到对话框。
单击“字体”页面,在“字体”列表中选择“宋体”,在“字形”列表中选择“常规”,在“字号”列表选择“10”。
2、折线图
将平面中的交点相继联接起来所得图形称为折线图,它一般用于描述某一变量在一段时期内的变动情况。
【例10.6】已知1990年至1999年各月社会商品零售总额,试观察一下社会商品零售总额的发展趋势及其变动规律。
(1)打开“数据整理.xls”工作簿,选择“零售额”工作表。
(2)在B列后插入一列以便输入年份与月份。
先选择B列单元格,再打开“插入”菜单,选择“列”项,则自动在B列后填加一列C,原来C列的内容变成了D列。
(3)在单元格C1中输入“时间”,在C2单元格中输入公式“=B2&CHAR(13)&A2”,从单元格C3开始复制这个公式到C17。
(4)打开Excel“插入”菜单,选择“插入”菜单中的“图表”
选项,Excel会启动“图表向导”。
(5)在步骤1“图表类型”中选择“折线图”,及“数据点折线图”,单击“下一步”按钮,进入步骤2的向导窗口。
(6)在步骤2中的数据区域中输入C1:
D117,单击“下一步”按钮,进入向导“步骤3”。
(7)在步骤3中单击图表“标题”页面,输入标题“社会消费品零售额趋势图”;单击“图例”页面,取消显示图例,如果通过图表预览,认为满意,即可单击“完成”按钮。
3.饼形图
【例10.7】中国人如何看WTO。
由中国社会调查事务所组织的最新一次问卷调查显示:
有58.4%的被调查者对中国加入WTO非常有信心;有19.3%的被调查者没有态度;有9.2%的被调查者表示担心;有13.1%的被调查者反对中国加入WTO。
试用饼形图描述一下中国人对加入WTO的看法。
(1)打开“数据整理.xls”工作簿,选择“WTO”
工作表。
(2)打开Excel“插入”菜单,并单击“插入”菜单中的“图表”选项,Excel会启动图表向导。
(3)在步骤1的“图表类型”中选择“饼图”,并在“子类型图表”中选择“三维饼图”,单击“下一步”按钮,进入向导2。
(4)在步骤2中的数据区域中输入A3:
B6单元格,单击“下一步”按钮,进入向导3。
(5)在步骤3中单击“标题”页面,输入标题“中国人看WTO”;单击“图例”页面,取消显示图例;单击“数据标志”页面,在“数据标志”列表中选择“同时显示百分比及数据标志”。
(6)如果通过图表预览,认为满意,即可单击“完成”按钮。
四、上机实验作业
1、某区共有30家企业,他们类型情况如下表,试编制此区企业类型的频数分布表。
表10-2某地区企业类型情况表
企业编号
企业类型
企业编号
企业类型
1
中型企业
16
中型企业
2
大型企业
17
大型企业
3
大型企业
18
小型企业
4
小型企业
19
小型企业
5
小型企业
20
中型企业
6
小型企业
21
小型企业
7
中型企业
22
小型企业
8
大型企业
23
中型企业
9
中型企业
24
小型企业
10
小型企业
25
中型企业
11
中型企业
26
大型企业
12
小型企业
27
中型企业
13
小型企业
28
大型企业
14
大型企业
29
小型企业
15
中型企业
30
小型企业
2、打开数据“学生成绩”工作表,要求:
根据班级进行分类,对班级的平均成绩进行汇总,并绘制柱状图。
3、打开数据“学生成绩”工作表,要求:
按照组距上限分为60、70、80、90、100这5个组,用FREQUENCY函数计算管理学的频数;用直方图工具分组。
4、打开“移动电话调查”工作表,按城乡及性别进行分组,绘制交叉表,统计每组中的每周平均通话次数,并进行含义解释。
5、洛伦茨曲线与居民收入差异分析。
洛伦茨曲线是本世纪初美国经济统计学家洛伦茨根据意大利经济学家巴雷特提出的收入分配公式绘制成的描述收入和财富分配性质的曲线。
曲线横轴是累计人口百分比,纵轴是累计收入或财富的百分比。
当一个国家的收入分配完全按人均分配时,同一累计百分比的人口就一定占有相同的累
计收入百分比。
此时该国的收入分配程度曲线就与对角线重合。
如果绝大多数人口占有很少的财富和收入,而少部分人占有了绝大部分的收入,则该国的曲线就靠近下横轴和右纵轴。
一般来说,国家的收入分配不会是绝对平均的,也不会是绝对不平均的。
将任一国家或地区的收入分配情况绘制成洛伦茨曲线就可以观察分析该国家或地区收入分配的平均程度。
某地区2005年的人口及收入情况见图所示(见excel表“洛伦兹曲线”),试绘制该地区的洛伦茨曲线。
实验二时间序列分析与预测
一、实验目的和要求
能熟练运用Excel数据分析工具进行长期趋势的预测,掌握平均发展水平和平均发展速度的计算方法,了解季节变动的分析方法。
二、实验主要内容
1、时间序列水平分析指标
2、速度分析指标
3、长期趋势的测定与预测
4、季节变动的测定与预测
三、实验步骤
(一)时间序列水平分析指标计算
1、增长量
增长量也称增长水平,是报告期发展水平与基期发展水平之差。
增长量有逐期增长量和累计增长量之分,这两个指标用公式表达如下:
逐期增长量
累计增长量
用Excel进行逐期增长量、累计增长量、平均增长量的计算
打开数据表,找到水平分析指标表
(1)在单元格A3、A4、A8、A9中分别输入“逐期增长量”、“累计增长量”、“平均增长量=”和“平均增长量=”;
(2)在单元格C3中输入“=C2-B2”,回车得1996年的逐期增长量;
(3)依次在单元格D3至L3中重复步骤
(2);或把光标移至C3单元格右下角,当光标变为黑十字星时,按住鼠标右键并拖到L3区域松开,得1997至2005各年的逐期增长量;
(4)选择单元格C4,输入“=C2-$B$2”,回车得1996年的累计增长量;
(5)依次在单元格D4至L4中重复步骤(4);或把光标移至C4单元格右下角,当光标变为黑十字星时,按住鼠标右键并拖到L4区域松开,得1997至2005各年的累计增长量;
(6)选择单元格L8,在其中输入“=L4/10”,1996年到2005年期间的平均增长量;
(7)或在单元格L9中输入“=(C3+D3+E3+F3+G3+H3+I3+J3+K3+L3)/(11-1)”,按回车得1996年到2005年期间的平均增长量。
2、平均增长量
平均增长量计算公式如下:
(二)时间序列速度分析指标计算
:
,
,…,
:
,
,…,
用Excel进行环比发展速度、定期发展速度、环比增长速度、定期增长速度、平均发展速度和平均增长速度的计算:
打开数据资料的“速度分析指标”
(1)在单元格A3、A4、A5、A6、A8、A9、A10、A12中分别输入“环比发展速度”、“定基发展速度”、“环比增长速度”和“定基增长速度”、“平均发展速度”、“平均发展速度”、“平均发展速度”、“平均增长速度”;
(2)在单元格C3中输入“=C2/B2*100”,按回车得2001年的环比发展速度;
(3)依次在单元格D3至G3中重复步骤⑵;或把光标移至C3单元格右下角,当光标变为黑十字星时,按住鼠标右键并拖到G3区域松开,得2002至2005各年的环比发展速度;
(4)在单元格C4中输入“=C2/$B$2*100”,回车后得到2001年的定基发展速度;(注意B2是相对引用,复制时会改变,$B$2是绝对引用,复制粘贴时不会改变)
(5)把光标移至D4单元格右下角,当光标变为黑十字星时,按住鼠标右键并拖到G4区域