统计学完整案例Word格式.docx
《统计学完整案例Word格式.docx》由会员分享,可在线阅读,更多相关《统计学完整案例Word格式.docx(40页珍藏版)》请在冰点文库上搜索。
![统计学完整案例Word格式.docx](https://file1.bingdoc.com/fileroot1/2023-5/9/d9c5d1a1-73de-4649-b6df-af850835fed3/d9c5d1a1-73de-4649-b6df-af850835fed31.gif)
(2)调查数据变量包括:
就业途径方式、了解次数、满意程度。
2、按变量类型分:
(1)分类变量包括:
性别、就业途径方式
(2)顺序变量包括:
学习成绩等级、满意程度
(3)数值型变量包括:
年级、了解次数、途径普遍工资、理想就业工资
2.1.3抽样方法与数据搜集方法
1、选定的抽样方法简介及选择的原因:
先分层,再整群,再简单随机抽样
2、详述抽样过程具体步骤:
采用简单随机抽样方式和多阶段抽样(最少两个阶段,前后顺序自定)方式生成两组样本数据文件。
2.1.4详述在本次调查工作中控制抽样误差的方法
在同样条件下,又重复抽样比重复抽样的抽样误差小,又如在总体现象分类比较明显时,采用分层随机抽样比其它方法的抽样误差小。
由于总体真正的参数值未知,真正的抽样误差也未知,所以抽样误差的计算一般都以抽样平均误差来代表真正的抽样误差。
2.2编写数据文件
部分截图
年级
就业途径
途径普遍工资
就业理想最低工资
未来工作方向
学习成绩等级
就业途经方式
了解次数
满意程度
大一
学校提供的推荐
2800
3500
清楚
2900
3520
不太清楚
优秀
2
4
A
3000
3540
不清楚
6
3100
3560
无所谓
7
3580
熟人联系
3600
3620
及格
1
C
3200
3640
网路招聘
3660
良好
D
3680
5
10
B
3700
11
3720
3300
3740
中等
3760
3
3780
3800
3820
3900
3840
3860
3880
4000
现场招聘会
3920
3940
3960
3980
大二
第三章统计分析过程及结论
3.1统计分析
3.1.1年级和就业途径两个品质变量的对比分析
1、预设结论:
(1)在校大学生年级不同了解就业途径多少不同,进而面对就业压力不同。
(2)在校大学生了解就业途径,网络招聘是最受欢迎的途径。
2、涉及的品质变量名称:
年级,就业途径
3、编制年级图表
在校大学生主要了解就业途径图表
4、年级与主要了解就业途径概括性度量情况表
项目
主要了解就业途径
众数
无
众数率
51%
异众比率
100%
49%
从此表可看出
(1)某高校在校大学生主要了解就业途径属网路招聘最多,众数率为51%(>
33.4%),说明众数的代表性很好,说明对于此高校在校大学生面对就业从网路招聘了解最多,与预设结论基本一致。
(2)此高校在校大学生主要了解就业途径中属网路招聘最多,众数率为51%(>
33.4%),人才市场和熟人联系占的百分比也很高,说明在校大学生的主动了解就业情况意识还不错。
(3)二者相比,年级的集中程度较低,离散程度较高,而主要了解就业途径的
集中度较高,离散度较低。
3.1.2途径普遍工资和就业理想最低工资的对比分析
(1)此校在校学生途径普遍工资呈现对称分布,没有显著的偏态特征;
绝大多数学生途径普遍工资处于中心区域,集中程度较高;
(2)在校大学生就业理想最低工资呈左偏分布,绝大多数学生的了解就业途径意识很强。
2、涉及的变量名称:
途径普遍工资,就业理想最低工资
3、途径普遍工资和就业理想最低工资概括性度量情况表
中位数
4500
4532
下四分位数(精确算法)
上四分位数(精确算法)
4980
极差(全距)
2500
1980
四分位差(内距)
1200
1000
由此表和计算可得数两组数据的四分位差率都远小于50%,故集中程度都较高。
4、编制途径普遍工资图表
某高校在校大学生途径普遍工资图表
某高校在校大学生途径普遍工资直方图
编制就业理想最低工资图表
某高校在校大学生就业理想最低工资图表
某高校在校大学生就业理想最低工资直方图
5、途径普遍工资和就业理想最低工资的概括性度量情况表
众数组
(4000,4500]
(3500,4000]
中位数所在组
(4500,5000]
平均数所在组
标准差
594.0751236
580.2298395
离散系数
0.138221294
0.129227136
从此表可以看出
(1)我校在校学生的途径普遍工资呈现对称分布,与预设结论完全相符。
(2)此高校在校大学生就业理想最低工资呈现右偏分布,与预设结论不相符,说明绝大多数学生有些理想化,有点不现实。
6、分别计算两个变量分组后的方差、标准差、离散系数,比较两个变量的离散程度,并给出结论。
我校在校学生的途径普遍工资比较集中,离散程度相比较于在校大学生就业理想最低工资低了很多,
7、对比两个变量的所有计算结果,给出统计结论,并回应预设结论。
如果和预设结论不一致,请尝试找出原因。
在校大学生就业理想最低工资的离散系数大于途径普遍工资,结合中心集中度的结论,说明我校大学生就业理想最低工资呈现高度集中。
3.1.3大学生年级与理想就业工资之间的单因素方差分析
1、从样本数据文件中选择关系密切的一个品质变量(作为因素自变量)和一个数值型变量(作为数据因变量),写出变量名称和预设结论。
要求:
所选的品质变量至少要有3个以上变量值。
变量名称:
年级理想就业工资
预设结论:
随着年级的增长,大学生认为的理想就业工资越来越高。
2、通过方差分析,运用F检验探讨二者的关系程度。
1、提出假设:
H0:
u1=u2=u3=u4,即4个年级被调查的均值都相等,自变量对因变量没有显著影响,不同年级之间的理想就业工资没有显著差异。
H1:
u1、u2、u3、u4不全相等,即4个年级被调查的均值不全相等,自变量对因变量有显著影响,不同年级之间的理想就业工资有显著差异。
2、方差分析计算表
3、取得统计结论,并总结预设结论的结果,如果分析结论与预设结论不一致,请尝试找出原因。
因为F<
Fcrit,所以随着年级的增长,大学生认为的理想就业工资越来越高,与预设结论相符。
进行关系强度分析。
计算关系强度系数:
R2=SSA/SST
本例R2=93.75%,即年级(自变量)对理想就业工资(因变量)的影响效应占总效应的93.75%,而其他因素(残差变量)所解释的比例占6.25%。
说明年级是影响理想就业工资的主要因素之一,但不一定是最主要因素。
3.2变量变动趋势预测分析
3.2.1途径普遍工资和理想就业工资的相关回归分析
1、从样本数据文件中选择涉及2个关系密切且有因果关系的数值型变量,写出预设结论和涉及的变量名。
预设结论:
途径普遍工资是理想就业工资的主要因素
变量名:
途径普遍工资理想就业工资
2、计算相关系数,探讨二者的关系程度。
r=0.85303
由散点图可以看出,R2=0.8530>
0.5,故途径普遍工资和理想就业工资之间有极高的线性相关关系。
3、若r>
=0.71,则做回归分析。
否则重新选择一组数值型变量。
r=0.85303>
=0.71,做回归分析。
4、用最小二乘法得出回归方程,并解释回归系数的意义;
=(100*1961320000–429800*449000)/(100*1882220000–429800*429800)=0.9021
=4490–0.9021*4298=612.77
y=612.77+0.9021x(其中:
y为理想就业工资,x为途径普遍工资)
5、运用Excel“回归”输出回归分析结果,验证上述计算的准确性;
Y=0.902X+612.899
6、对每一个自变量原始值,做全部的点估计和置信区间估计,取得统计结论,并总结分析结论。
如果分析结论与预设结论不一致,请尝试找出原因。
序号
途径普遍工资
理想就业工资
置信区间下限
置信区间上限
X
Y
Y^
Y-Y^
(X-X^)^2
d
u
Y-d
Y-u
3138.499
361.501
2244004
3129.4566
3148.0524
370.5434
351.9476
3228.699
291.301
1954404
3219.6566
3238.2524
300.3434
281.7476
3318.899
221.101
1684804
3309.8566
3328.4524
230.1434
211.5476
3409.099
150.901
1435204
3400.0566
3418.6524
159.9434
141.3476
170.901
179.9434
161.3476
190.901
199.9434
181.3476
210.901
219.9434
201.3476
8
3499.299
140.701
1205604
3490.2566
3508.8524
149.7434
131.1476
9
160.701
169.7434
151.1476
180.701
189.7434
171.1476
200.701
209.7434
191.1476
12
220.701
229.7434
211.1476
13
3589.499
150.501
996004
3580.4566
3599.0524
159.5434
140.9476
14
170.501
179.5434
160.9476
15
190.501
199.5434
180.9476
16
210.501
219.5434
200.9476
17
4040.499
-220.499
248004
4031.4566
4050.0524
-211.457
-230.052
18
4130.699
-290.699
158404
4121.6566
4140.2524
-281.657
-300.252
19
-270.699
-261.657
-280.252
20
-250.699
-241.657
-260.252
21
4220.899
-320.899
88804
4211.8566
4230.4524
-311.857
-330.452
22
-300.899
-291.857
-310.452
23
-280.899
-271.857
-290.452
24
-260.899
-251.857
-270.452
25
-240.899
-231.857
-250.452
26
-220.899
-211.857
-230.452
27
4100
4020
4311.099
-291.099
39204
4302.0566
4320.6524
-282.057
-300.652
28
4040
-271.099
-262.057
-280.652
29
4060
-251.099
-242.057
-260.652
30
4080
-231.099
-222.057
-240.652
31
4200
4401.299
-301.299
9604
4392.2566
4410.8524
-292.257
-310.852
32
4300
4120
4491.499
-371.499
4482.4566
4501.0524
-362.457
-381.052
33
4140
-351.499
-342.457
-361.052
34
4160
-331.499
-322.457
-341.052
35
4180
-311.499
-302.457
-321.052
36
4400
4581.699
-381.699
10404
4572.6566
4591.2524
-372.657
-391.252
37
4220
-361.699
-352.657
-371.252
38
4240
-341.699
-332.657
-351.252
39
4260
-321.699
-312.657
-331.252
40
4280
-301.699
-292.657
-311.252
41
-281.699
-272.657
-291.252
42
4320
-261.699
-252.657
-271.252
43
4340
-241.699
-232.657
-251.252
44
4360
-221.699
-212.657
-231.252
45
4380
-201.699
-192.657
-211.252
46
4671.899
-271.899
40804
4662.8566
4681.4524
-262.857
-281.452
47
4420
-251.899
-242.857
-261.45