东中西部及东北地区城镇居民家庭就业分析.docx
《东中西部及东北地区城镇居民家庭就业分析.docx》由会员分享,可在线阅读,更多相关《东中西部及东北地区城镇居民家庭就业分析.docx(16页珍藏版)》请在冰点文库上搜索。
![东中西部及东北地区城镇居民家庭就业分析.docx](https://file1.bingdoc.com/fileroot1/2023-7/3/284d603e-5e57-4d39-9675-83bf39392a4e/284d603e-5e57-4d39-9675-83bf39392a4e1.gif)
东中西部及东北地区城镇居民家庭就业分析
成绩评定表
学生姓名
陈基政
班级学号
1009010217
专业
信息与计算科学
课程设计题目
东、中、西部及东北地区城镇居民家庭就业分析
评
语
组长签字:
成绩
日期
20年月日
课程设计任务书
学院
理学院
专业
信息与计算科学
学生姓名
陈基政
班级学号
1009010217
课程设计题目
东、中、西部及东北地区城镇居民家庭就业分析
实践教学要求与任务:
设计要求(技术参数):
1、熟练掌握SPSS软件的操作方法;
2、根据所选题目及调研所得数据,运用数据分析知识,建立适当的数学模型;
3、运用SPSS软件,对模型进行求解,对结果进行分析并得出结论;
4、掌握利用数据分析理论知识解决实际问题的一般步骤。
设计任务:
1、查阅相关资料,确定评估居民家庭就业的相关指标,获得东、中、西部及东北地区城镇居民家庭就业的相关指标的数据;
2、利用数据分析的理论,建立东、中、西部及东北地区城镇居民家庭就业的数学模型;
2、利用SPSS软件求解,并给出正确的结论。
工作计划与进度安排:
第一天——第二天学习使用SPSS软件并选题
第三天——第四天查阅资料
第五天——第六天建立数学模型
第七天——第九天上机求解并完成论文
第十天答辩
指导教师:
201年月日
专业负责人:
201年月日
学院教学副院长:
201年月日
摘要
近年来,我国宏观经济形势发生了重大变化,经济发展速度加快,居民收入稳定增加,但是,由于我国各地区的经济背景、社会背景和环境背景等都存在着这样或那样的差异,从而导致了城镇居民家庭收入水平也参差不齐。
SPSS在经济、管理、医学及心理学等方面的研究起着很重要的作用,为了客观的了解我国城镇居民的总体收入水平和生活现状,本文运用SPSS软件中的各种分析方法对我国城镇居民的人均收入情况进行科学的分析。
关键词:
城镇居民,就业情况,描述性分析,多元线性回归分析
目录
1实验材料及原始数据1
2数据分析2
2.1各变量的描述性分析2
2.1.1操作步骤2
2.1.2变量描述性分析2
2.2多元线性回归分析3
2.2.1操作步骤3
2.2.2相关性分析3
2.2.3线性回归分析4
3总结10
参考文献11
1实验材料及原始数据
下图是出自《中国统计年鉴—2010》这一资料性年刊,它系统收录了全国2010年经济、社会各方面的统计数据,以及近三十年和其他重要历史年份的全国主要统计数据。
此年鉴正文内容分为24个篇章,本文选取其中的第九篇章-人民生活,用以探究我国城镇居民消费结构及其趋势。
注:
1.本表为城镇住户抽样调查资料。
2.从2002年起,城镇住户调查对象由原来的非农业人口改为城市市区和县
县城关镇住户。
本篇章相关资料均按新口径计算,历史数据作了相应调整。
2数据分析
2.1各变量的描述性分析
2.1.1操作步骤
通过菜单兰中的分析选项,进行描述性分析,选中目标项,求最大值、最小值、均值、标准差、峰度和偏度,得到如下结果:
2.1.2变量描述性分析
表
(1)描述性统计量表
描述统计量
N
极小值
极大值
均值
标准差
偏度
峰度
统计量
统计量
统计量
统计量
统计量
统计量
标准误
统计量
标准误
平均每户家庭人口
4
2.72
2.91
2.85
0.08832
-1.788
1.014
3.209
2.619
平均每户就业人口
4
1.36
1.55
1.4575
0.07932
-0.173
1.014
0.304
2.619
平均每户就业面
4
50.00%
53.26%
51.12%
1.50%
1.511
1.014
2.007
2.619
平均每一就业者负担人数
4
1.88
2
1.9575
0.05439
-1.468
1.014
1.908
2.619
平均每人全部年收入
4
17302.96
25773.29
19518.365
4173.84093
1.989
1.014
3.962
2.619
有效的N(列表状态)
4
表
(1)为描述性统计量,显示出各变量的最大值、最小值、均值、标准差、峰度和偏度。
通过观察每个变量的描述性统计信息,可以了解这个变量的极值情况(极小值和极大值)、取值波动情况(标准差)以及分布情况(峰度和偏度)。
从变量的极值和标准差来看,全国各地区家庭的就业情况相差不大,但平均每人的收入和可支配有明显的差距。
从各变量的取值范围来看,相差的数量级不大,所以没有必要进行标准化;从峰度、偏度的取值来看(接近于0),所以各变量都没有很过分的偏离正态分布。
2.2多元线性回归分析
2.2.1操作步骤
通过菜单兰中的“分析→回归→线性”选项,进行多元线性回归分析,选中目标项:
“方法→向后”,“统计量→估计、协方差矩阵、模拟拟合度、共线性诊断、Durbin-Watson”,“绘制→Y(*ADJPRED)、X2(DEPENDNT)”,“保存→预测值(未标准化)、残差(未标准化、标准化、学生化)”得到如下结果:
2.2.2相关性分析
表
(2)相关系数矩阵
相关性
平均每一就业者负担人数
平均每户家庭人口
平均每户就业人口
平均每户就业面
Pearson相关性
平均每一就业者负担人数
1.000
-.652
-.914
-1.000
平均每户家庭人口
-.652
1.000
.904
.631
平均每户就业人口
-.914
.904
1.000
.902
平均每户就业面
-1.000
.631
.902
1.000
Sig.(单侧)
平均每一就业者负担人数
.
.174
.043
.000
平均每户家庭人口
.174
.
.048
.185
平均每户就业人口
.043
.048
.
.049
平均每户就业面
.000
.185
.049
.
N
平均每一就业者负担人数
4
4
4
4
平均每户家庭人口
4
4
4
4
平均每户就业人口
4
4
4
4
平均每户就业面
4
4
4
4
表
(2)从以上表中可以看出变量“平均每户家庭人口”、“平均每户就业人口”、“平均每户就业面”和“平均每户就业者负担人数”之间分别存在线性相关关系。
2.2.3线性回归分析
表(3)变量进入/剔除信息表
输入/移去的变量
模型
输入的变量
移去的变量
方法
1
平均每户就业面,平均每户家庭人口a
.
输入
a.已达到容差=.000限制。
表(3)给出了进入模型和被剔除的变量的信息,从表中我们可以看出自变量进入模型,说明我们的解释变量都是显著并且是有解释力的。
表(4)模型摘要表
模型汇总b
模型
R
R方
调整R方
标准估计的误差
Durbin-Watson
1
1.000a
1.000
1.000
.00083
2.495
a.预测变量:
(常量),平均每户就业面,平均每户家庭人口。
b.因变量:
平均每一就业者负担人数
表(4)给出模型整体拟合效果的概述,模型的R值、R方值、调整R方都达到1.000,反映了因变量于自变量之间具有高度显著的线性关系即模型几乎解释了总变异的全部,说明模型的整体拟合效果非常好。
另外表中还给出了标准估计的误差0.00083和杜宾-瓦特森检验值DW=2.495,杜宾-瓦特森检验统计量DW是一个用于检验一阶变量自回归形式的序列相关问题的统计量,DW在数值2到4之间的附近说明模型变量无序列相关,两残差之间正相关。
表(4)方差分析表
Anovab
模型
平方和
df
均方
F
Sig.
1
回归
.009
2
.004
6462.064
.009a
残差
.000
1
.000
总计
.009
3
a.预测变量:
(常量),平均每户就业面,平均每户家庭人口。
b.因变量:
平均每一就业者负担人数
表(4)是多元线性回归分析的方差分析表。
从表中可以看出,模型回归的均方为:
0.004;剩余均方为:
0.000;F检验统计量的观测值为6462.064,相应的概率ρ值为:
0.009小0于0.05,可以认为因变量“平均每一就业者负担人数”和“平均每户就业面”、“平均每户家庭人口”之间存在线性关系。
表(5)模型的参数估计
系数a
模型
非标准化系数
标准系数
t
Sig.
共线性统计量
B
标准误差
试用版
容差
VIF
1
(常量)
3.832
.018
217.563
.003
平均每户家庭人口
-.022
.007
-.037
-3.223
.192
.602
1.660
平均每户就业面
-.035
.000
-.977
-86.168
.007
.602
1.660
a.因变量:
平均每一就业者负担人数
表(5)为自变量调整后的模型的参数估计,包含了进入模型的变量,主要描述模型的参数估计值(标准的和未标准化),以及每个变量的系数估计值的显著检验和共线性检验。
结果从表中可以看出,常量、平均每户家庭人口和平均每户就业面中t检验Sig没有特别大的异常值,同时变量系数的t检验十分显著,即这些自变量对于模型的贡献都是显著的。
VIF值均小于10,说明共线性也有所消除。
归系数的显著性检表,常数项的P=0.003<0.05,说明与0有显著性差异,故应该出现在回归方程中,可得回归方程为:
平均每一就业者负担人数=3.832-0.22*平均每户家庭人口-0.35*平均每户就业面。
这个方程给出了各因素对平均每一就业者负担人数的量化影响。
表(6)已排除的变量
已排除的变量b
模型
BetaIn
t
Sig.
偏相关
共线性统计量
容差
VIF
最小容差
1
平均每户就业人口
-29.809a
.
.
-1.000
8.707E-8
1.148E7
8.707E-8
a.模型中的预测变量:
(常量),平均每户就业面,平均每户家庭人口。
b.因变量:
平均每一就业者负担人数
表(6)给出的是所有未进入模型的变量检验信息,有t检验Sig值没有可以看出,这些变量对于模型的贡献不显著,所以它们不包括在模型里面。
表(7)共线性诊断
共线性诊断a
模型
维数
特征值
条件索引
方差比例
(常量)
平均每户家庭人口
平均每户就业面
1
1
2.999
1.000
.00
.00
.00
2
.000
89.488
.95
.32
.08
3
.000
109.776
.05
.68
.92
a.因变量:
平均每一就业者负担人数
表(7)中显示包括各变量的容差,方差膨胀因子和共线性的诊断表。
表(8)残差统计量
残差统计量a
极小值
极大值
均值
标准偏差
N
预测值
1.8802
1.9999
1.9575
.05439
4
标准预测值
-1.422
.780
.000
1.000
4
预测值的标准误差
.001
.001
.001
.000
4
调整的预测值
1.8841
1.9913
1.9564
.05054
4
残差
-.00053
.00061
.00000
.00048
4
标准残差
-.634
.741
.000
.577
4
Student化残差
-1.000
1.000
.000
1.155
4
已删除的残差
-.00412
.00877
.00111
.00553
4
Student化已删除的残差
.
.
.
.
0
Mahal。
距离
.605
2.223
1.500
.802
4
Cook的距离
.274
36.962
11.414
17.399
4
居中杠杆值
.202
.741
.500
.267
4
a.因变量:
平均每一就业者负担人数
表(8)为残差统计量。
残差统计量是对残差的诊断和分析,给出了预测值、标准预测值、残差、标准化残差的最小值、最大值、均值、标准偏差及样本容量等统计量,根据概率的3西格玛原则,标准化残差的绝对值最大为1.155,小于3,说明样本数据中没有奇异值。
图
(1)回归标准化残差的直方图
图
(1)是回归标准化残差的直方图,正太曲线也显示在直方图上,用以判断标准化残差是否服从正态分布,从图中看服从正态分布,但是样本数太少,所以判断不可采纳。
图
(2)回归标准化残差的标准P-P图
图
(2)是回归标准化残差的标准P-P图。
该图给出了观测值的残差分布与假设的正态分布比较,如果标准化残差呈正态分布,则标准化的残差散点应该分布在直线上或者靠近直线。
从图
(2)中可以看出,所有的散点都分布在对角线附近,说明残差的正太性假设基本成立。
图(3)散点图
图(3)显示的是因变量与回归标准化预测值的散点图。
其中变量“DEPENDENT”为X轴变量,变量“*ADJPRED”为Y轴变量。
由图(3)中可以看出,所有的散点都分布在对角线附近,说明预测值和观测值非常接近,预测效果不错。
3总结
根据以上的各种分析,可以看出全国城镇居民平均每户家庭的就业情况,每户家庭就业人口比例较小,平均每一就业者负担人数的比重较大,对于增加城镇居民的生活质量有很大影响。
所以提高城镇居民就业和收入水平,缩小收入差距,应做到:
大力发展教育事业,特别是高等教育、成人教育、职业教育应是政府长期坚持和倡导的;进一步强化收入分配的宏观调控力度采取切实措施努力提高低收入群体的收入水平;加快西部大开发步伐,做好扶贫开发工作;进一步完善社会保障制度,改善居民整体尤其是社会弱势群体的生存环境;通过完善税收制度来缩小部分不合理的高低收入阶层差距;对不动产、金融资产收益以及财产的继承与赠与,要通过合理设置税种税率,征收房产税、利息税以及遗产与赠与税等税种来进行调节。
参考文献
[1]吕振通张凌云《spss统计分析与应用》机械工程出版社,2009年
[2]NancyL.LeechKarenC.BarrettCeorgeA.Morgan《SPSSforIntermediateStatisticsUseandInterpretation(ThirdEdition)》PUBLISHINGHOUSEOFELECTRONICSINDUSTRY,2009年
[3]Spssforwindows统计分析刘子君赵维波编著东北大学出版社2004年
[4]2010年统计年鉴: