浙财统计学李伟项目一描述性分析.docx
《浙财统计学李伟项目一描述性分析.docx》由会员分享,可在线阅读,更多相关《浙财统计学李伟项目一描述性分析.docx(8页珍藏版)》请在冰点文库上搜索。
浙财统计学李伟项目一描述性分析
实验(实训)报告
项目名称描述性分析
所属课程名称统计学
项目类型
实验(实训)日期
班级
学号
姓名
指导教师李伟
浙江财经学院教务处制
一、实验(实训)概述:
【目的及要求】
描述性分析是统计学原理中最基本的一种分析方法,包括统计分组、统计代表性指标的计算等。
通过本实验的学习,要求学生掌握运用SPSS统计分析软件整理原始数据并分析其基本特征。
(1)对原始数据进行统计分组(简单分组、复合分组、单项式分组、组距式分组和交叉分组等)
(2)次数分布进行向上累计次数和向下累计次数的计算
(3)对原始数据和分组后数据进行简单的统计图绘制和分布曲线绘制
(4)基本指标计算,如最大值、最小值、平均数、中位数、众数、全距、标准差等
【基本原理】
(1)统计分组的理论及依据
(2)次数分布的类型
(3)集中趋势和离中趋势的计算
【实施环境】(使用的材料、设备、软件)
SPSS11.0中文版
二、实验(实训)要求:
(一)搜集数据
搜集2012年(或其它年份)我国31个省市人口总数(或其他总量指标)的数据。
(二)频数分析
(1)品质分组:
按照31省市所处地理位置分为东、中、西三个区域,并统计各区域所含的省市个数,最终将分组的结果按照分配数列的形式列出。
(2)组距式分组:
按照“人数”标志进行组距式分组。
将分组的过程详细陈述,并将最后的分组结果按照分配数列的形式列出。
同时,根据分组的结果绘制出相应的直方图和次数分布曲线,说明这种现象属于什么分布情况。
(3)交叉分组:
进行区域和人数的双变量分析,列出分布结果。
并绘制对比条形图。
(三)描述性分析
(1)在原始数据“人数”基础上的指标计算:
集中趋势指标和离中趋势指标值。
(2)在分组数据“人数“基础上的指标计算:
集中趋势指标和离中趋势指标值。
(3)对上述两种情况下算出来的指标值进行对比。
说明存在差异的原因。
(4)分组比较:
分析不同区域的人数分布情况。
三、实验步骤(列出每一个内容进行SPSS操作时的主要步骤)
(一)搜集数据:
来源:
中国知网经济与社会发展统计数据库
(二)频数分析
打开SPSS17.0,选择“文件”→“打开”→“数据”,导入所用数据“2012年我国31个省市总人口数”
(1)品质分组:
增加变量“地域“→按省份输入所属东,中,西部地域→分析→描述统计→频率→变量为“地域”→输出频率分布表
(2)组距式分组:
选择“转换”→“可视离散化”→“总人口数”→继续→填写可离散化变量→上端点:
“排除”→生成分割点,分割点为4,宽度为3000→生成标签→完成可视离散化
分析→描述统计→频率→变量为“总人口数(已离散化)“→图表:
直方图,带正态曲线→输出频数分布表,直方图和次数分布曲线
(3)交叉分组:
选择“分析“→描述统计→交叉表→行列分别选择地域和总人口数(已离散化)→显示复式条形图→生成结果
(三)描述性分析
(1)
(2)
(3)
四、实验结论(按照项目内容的要求,以上述顺序分别列出输出结果和做出相应的分析)
(一)搜集数据
省份
总人口数(万人)
北京市
2069
天津市
1413
河北省
7288
山西省
3611
内蒙古自治区
2490
辽宁省
4389
吉林省
2750
黑龙江省
3834
上海市
2380
江苏省
7920
浙江省
5477
安徽省
5988
福建省
3748
江西省
4504
山东省
9685
河南省
9406
湖北省
5779
湖南省
6639
广东省
10594
广西壮族自治区
4682
海南省
887
重庆市
2945
四川省
8076
贵州省
3484
云南省
4659
西藏自治区
308
陕西省
3753
甘肃省
2578
青海省
573
宁夏回族自治区
647
新疆维吾尔自治区
2233
(二)频数分析
(1)品质分组
我国31个省市东中西部划分情况表
按地理位置分组
频率
百分比
东部
11
35.5
西部
12
38.7
中部
8
25.8
合计
31
100.0
分析:
样本容量为31,东部频数为11,占百分比为35.5%,西部频数为12,占百分比为38.7%,中部频数为8,所占百分比为25.8%。
(2)组距式分组:
我国31个省市总人口数分组分布情况表
按总人口数分组(万人)
频率
百分比
<1000
4
12.9
1000-3999
13
41.9
4000-6999
8
25.8
7000-9999
5
16.1
10000+
1
3.2
合计
31
100.0
分析:
我国31个省市按总人口数分布,<1000万人的频数为4,所占百分比为12.9%,1000-3999万人的频数为13,所占百分比为41.9%,4000-6999万人的频数为8,所占百分比为25.8%,7000-9999万人的频数为5,所占百分比为16.1%,>10000万人的频数为1,所占百分比为3.2%。
直方图与次数分布曲线:
分析:
该直方图与次数分布曲线显示总人口数在1000-3999万人段数占最多,次数分布曲线呈钟型分布,且呈右偏分布。
(3)交叉分组:
区域*总人口数(万人)(已离散化)交叉制表
总人口数(万人)(已离散化)
合计
<1000
1000-3999
4000-6999
7000-9999
10000+
地域
东部
1
4
2
3
1
11
西部
3
6
2
1
0
12
中部
0
3
4
1
0
8
合计
4
13
8
5
1
31
分析:
东部地区在各总人口数分段都有省市符合,在总数1000-9999万人段居多,而在总人口数10000万人以上,仅东部有一省符合,西部与中部没有总人数10000+万人的省市。
西部地区省市总人口数大体分布于3999万人以下,其中1000-3999万人段最多,占6个省。
中部地区总人口数集中于1000-6999万人段,而总人口数1000万人以下无省市。
分析:
西部地区省市总人口数特别集中于1000-3999万人,远多于中部与东部。
而东部地区省市总人口数各分段皆存在省市符合,人数分布相较其他区域数量多,且分布较均衡。
中部省市与人数较少。
(三)描述性分析
(1)
(2)
(3)
五、指导教师评语及成绩:
评语:
成绩:
指导教师签名:
批阅日期: