spss 统计分析与应用 作业.docx
《spss 统计分析与应用 作业.docx》由会员分享,可在线阅读,更多相关《spss 统计分析与应用 作业.docx(25页珍藏版)》请在冰点文库上搜索。
spss统计分析与应用作业
统计分析与SPSS应用
作业
目录
第一题1
第二题4
第三题
第一题:
使用的数据文件为自己编辑的workerxinxi.sav
具体dataview如下
数据属性variableview如下
其中sex的value值设定如下
renge的value值设定如下
jixiao的value值设定如下
Frequencies过程的结果:
对weight字段用frequencies过程分析的结果如下
Statistics
体重
N
Valid
28
Missing
0
Percentiles
5
43.8000
25
48.2500
50
54.0000
75
63.7500
95
76.5500
体重
Frequency
Percent
ValidPercent
CumulativePercent
Valid
42
1
3.6
3.6
3.6
46
3
10.7
10.7
14.3
47
1
3.6
3.6
17.9
48
2
7.1
7.1
25.0
49
1
3.6
3.6
28.6
52
1
3.6
3.6
32.1
53
2
7.1
7.1
39.3
54
4
14.3
14.3
53.6
55
1
3.6
3.6
57.1
58
3
10.7
10.7
67.9
59
1
3.6
3.6
71.4
63
1
3.6
3.6
75.0
64
1
3.6
3.6
78.6
68
2
7.1
7.1
85.7
70
2
7.1
7.1
92.9
76
1
3.6
3.6
96.4
77
1
3.6
3.6
100.0
Total
28
100.0
100.0
由第一张表可以看出,被调查的工人样本的体重的四分位数分别为:
48.2500kg,54.0000kg,63.7500kg。
第二张表可以看出体重的累积分布百分数,有百分之64.3%的工人的体重位于49kg—70kg之间。
对renge和jixiao字段用frequencies过程分析的结果如下
霍兰德的六种人格类型
Frequency
Percent
ValidPercent
CumulativePercent
Valid
社会型S
1
3.6
3.6
3.6
企业型E
2
7.1
7.1
10.7
传统型C
11
39.3
39.3
50.0
现实性R
8
28.6
28.6
78.6
研究型I
4
14.3
14.3
92.9
艺术性A
2
7.1
7.1
100.0
Total
28
100.0
100.0
绩效评级
Frequency
Percent
ValidPercent
CumulativePercent
Valid
A
6
21.4
21.4
21.4
B
8
28.6
28.6
50.0
C
9
32.1
32.1
82.1
D
5
17.9
17.9
100.0
Total
28
100.0
100.0
表中给出了人格类型和绩效评级的频数表,其中Frequency为频数,Percent为各族频数占总例数的百分比(包括缺失数据),ValidPercent为各组频数占总例数的有效百分比,因为我所选用的工人信息表中没有缺失数据,因此Percent和ValidPercent字段的值是相同的。
CumulativePercent为各组频数占总例数的累积百分比。
在有关人格类型分析的表中,可见,大多数工人有传统型或者现实型人格,共有大约67.9%。
在绩效评级分析的表中,可见,大多数人达到了C级以上的绩效评级。
总体而言该公司的绩效评级体制还是合理的。
Descriptive过程的结果
对height字段用descriptive过程分析结果如下
DescriptiveStatistics
N
Minimum
Maximum
Mean
Std.Deviation
身高
28
152.00
186.00
1.6768E2
7.31337
ValidN(listwise)
28
可看出,被调查的28个样本中,身高最大值为186cm,最小值为152cm,均值为167.82cm,标准误差为7.31337
Explore模块分析结果
CaseProcessingSummary
性别
Cases
Valid
Missing
Total
N
Percent
N
Percent
N
Percent
身高
男
15
100.0%
0
.0%
15
100.0%
女
13
100.0%
0
.0%
13
100.0%
Descriptives
性别
Statistic
Std.Error
身高
男
Mean
1.6800E2
2.22753
95%ConfidenceIntervalforMean
LowerBound
1.6322E2
UpperBound
1.7278E2
5%TrimmedMean
1.6789E2
Median
1.6800E2
Variance
74.429
Std.Deviation
8.62720
Minimum
152.00
Maximum
186.00
Range
34.00
InterquartileRange
9.00
Skewness
.033
.580
Kurtosis
.683
1.121
女
Mean
1.6731E2
1.59882
95%ConfidenceIntervalforMean
LowerBound
1.6382E2
UpperBound
1.7079E2
5%TrimmedMean
1.6734E2
Median
1.6600E2
Variance
33.231
Std.Deviation
5.76461
Minimum
158.00
Maximum
176.00
Range
18.00
InterquartileRange
9.00
Skewness
.029
.616
Kurtosis
-.891
1.191
从上两张图中可以看出集中趋势指标、离散趋势指标、分布特征指标和参数估计值等。
下两张图分别为男工人和女工人的身高分布直方图
下图分别为男工人和女工人身高分布的茎叶图
身高 Stem-and-Leaf Plot for
sex= 男
Frequency Stem & Leaf
1.00 Extremes (=<152)
1.00 15 . 4
.00 15 .
2.00 16 . 24
5.00 16 . 55889
3.00 17 . 003
2.00 17 . 77
1.00 Extremes (>=186)
Stem width:
10.00
Each leaf:
1 case(s)
身高 Stem-and-Leaf Plot for
sex= 女
Frequency Stem & Leaf
2.00 15 . 89
2.00 16 . 44
4.00 16 . 5567
3.00 17 . 024
2.00 17 . 56
Stem width:
10.00
Each leaf:
1 case(s)
下图为分布的盒形图
Crosstabs过程分析的结果
对renge字段和jixiao字段分析的结果如下
CaseProcessingSummary
Cases
Valid
Missing
Total
N
Percent
N
Percent
N
Percent
霍兰德的六种人格类型*绩效评级
28
100.0%
0
.0%
28
100.0%
霍兰德的六种人格类型*绩效评级Crosstabulation
绩效评级
Total
A
B
C
D
霍兰德的六种人格类型
社会型S
Count
0
1
0
0
1
%within霍兰德的六种人格类型
.0%
100.0%
.0%
.0%
100.0%
%within绩效评级
.0%
12.5%
.0%
.0%
3.6%
企业型E
Count
0
0
2
0
2
%within霍兰德的六种人格类型
.0%
.0%
100.0%
.0%
100.0%
%within绩效评级
.0%
.0%
22.2%
.0%
7.1%
传统型C
Count
3
5
2
1
11
%within霍兰德的六种人格类型
27.3%
45.5%
18.2%
9.1%
100.0%
%within绩效评级
50.0%
62.5%
22.2%
20.0%
39.3%
现实性R
Count
3
2
2
1
8
%within霍兰德的六种人格类型
37.5%
25.0%
25.0%
12.5%
100.0%
%within绩效评级
50.0%
25.0%
22.2%
20.0%
28.6%
研究型I
Count
0
0
1
3
4
%within霍兰德的六种人格类型
.0%
.0%
25.0%
75.0%
100.0%
%within绩效评级
.0%
.0%
11.1%
60.0%
14.3%
艺术性A
Count
0
0
2
0
2
%within霍兰德的六种人格类型
.0%
.0%
100.0%
.0%
100.0%
%within绩效评级
.0%
.0%
22.2%
.0%
7.1%
Total
Count
6
8
9
5
28
%within霍兰德的六种人格类型
21.4%
28.6%
32.1%
17.9%
100.0%
%within绩效评级
100.0%
100.0%
100.0%
100.0%
100.0%
第一张表给出了缺失值的情况报告。
第二张表是人格和绩效的交叉表,行变量是人格,列变量是绩效。
这样便可以根据第二张表中提供的信息进行一定的结果分析。
有一些可能是由于偶然误差导致的,必须要通过假设检验才可进行更精确的理论证明。
第二题
1.数据文件仍然用第一题中的workerxinxi.sav
2.对数据文件中的连续变量身高、体重、工龄等进行降序排列操作,结果如下
3.对身高进行分组,身高>168cm的归类为高个子,低于168cm的归类为低个子。
结果如下:
4.对身高比较的结果分析如下
Statistics
身高比较
N
Valid
28
Missing
0
身高比较
Frequency
Percent
ValidPercent
CumulativePercent
Valid
低个子
14
50.0
50.0
50.0
高个子
14
50.0
50.0
100.0
Total
28
100.0
100.0
28名被选作样本的工人中,高个子和低个子所占比例相同,都为50%。
条形图描述如下
5.对二分类变量“性别”统计不同类别下的连续变量“奖金”是否存在差异。
奖金定义为“jixiao*10”。
分析结果如下:
男性工人的奖金分布如下
OLAPCubes
性别:
男
Sum
N
Mean
Std.Deviation
%ofTotalSum
%ofTotalN
奖金
370.00
15
24.6667
9.90430
53.6%
53.6%
女性工人的奖金分布如下
OLAPCubes
性别:
女
Sum
N
Mean
Std.Deviation
%ofTotalSum
%ofTotalN
奖金
320.00
13
24.6154
11.26601
46.4%
46.4%
6,以多值变量“霍兰德的六种人格类型”为基础统计得到的奖金分布结果如下表所示:
社会型人格的奖金分布
霍兰德的六种人格类型:
社会型S
Sum
N
Mean
Std.Deviation
Minimum
Maximum
奖金
20.00
1
20.0000
.
20.00
20.00
企业型人格的奖金分布
霍兰德的六种人格类型:
企业型E
Sum
N
Mean
Std.Deviation
Minimum
Maximum
奖金
60.00
2
30.0000
.00000
30.00
30.00
传统型人格的奖金分布
霍兰德的六种人格类型:
传统型C
Sum
N
Mean
Std.Deviation
Minimum
Maximum
奖金
230.00
11
20.9091
9.43880
10.00
40.00
现实型人格的奖金分布
霍兰德的六种人格类型:
现实性R
Sum
N
Mean
Std.Deviation
Minimum
Maximum
奖金
170.00
8
21.2500
11.25992
10.00
40.00
研究型人格的奖金分布
霍兰德的六种人格类型:
研究型I
Sum
N
Mean
Std.Deviation
Minimum
Maximum
奖金
150.00
4
37.5000
5.00000
30.00
40.00
艺术型人格的奖金分布
霍兰德的六种人格类型:
艺术性A
Sum
N
Mean
Std.Deviation
Minimum
Maximum
奖金
60.00
2
30.0000
.00000
30.00
30.00
第三题:
建立的有关数据如下:
各变量的属性定义为:
研究gdp(国民生产总值)与xiaofei(居民消费),investment(外商投资),zongchuxu(居民总储蓄),jingchukou(净出口)之间的关系,建立相关的回归方程。
相关结果如下所示:
VariablesEntered/Removedb
Model
VariablesEntered
VariablesRemoved
Method
1
外商投资,居民总储蓄,居民消费a
.
Enter
a.Allrequestedvariablesentered.
b.DependentVariable:
国民生产总值
ModelSummary
Model
R
RSquare
AdjustedRSquare
Std.ErroroftheEstimate
1
.961a
.923
.909
9335.68960
a.Predictors:
(Constant),外商投资,居民总储蓄,居民消费
a.Predictors:
(Constant),外商投资,居民总储蓄,居民消费
b.DependentVariable:
国民生产总值
ANOVAb(
Model
SumofSquares
df
MeanSquare
F
Sig.
1
Regression
1.675E10
3
5.583E9
64.060
.000a
Residual
1.394E9
16
8.716E7
Total
1.814E10
19
a.Predictors:
(Constant),外商投资,居民总储蓄,居民消费
Coefficientsa
Model
UnstandardizedCoefficients
StandardizedCoefficients
t
Sig.
B
Std.Error
Beta
1
(Constant)
5054.197
4312.663
1.172
.258
居民消费
2.729
.438
1.205
6.230
.000
居民总储蓄
-1.019
.312
-.379
-3.264
.005
外商投资
-2.129
12.594
-.025
-.169
.368
a.DependentVariable:
国民生产总值
第一张表示对模型中各个变量纳入模型情况进行的汇总,本例中共有三个自变量,变量选择的方法为强行进入法,也就是将所有的自变量都放进模型中。
第二张表示对模型的简单汇总,其实就是对回归方程模拟和情况的描述,通过这张表可以知道相关系数的取值(R),相关系数的平方即决定系数(R-square),校正后的决定系数(AdjustRSquare)和回归系数的标准误(Std.ErroroftheEstimate)。
本例子中R-Square的值相对较大,说明这三个因素对于被解释变量所起的作用是很大的。
第三张表为对模型进行方差分析的结果,F值为64.060,P值小于0.05,所以该模型是有意义的
第四张表中给出了回归方程中常数项,回归系数的估计值和检验结果。
1.回归系数a=5054.197,b1=2.729,b2=-1.019,b3=-2.129。
表示的意义是:
居民消费每增加一个单位,gdp平均增加2.729个单位;居民总储蓄每增加一个单位,gdp平均减少1.019个单位,外商投资每增加一个单位,gdp平均减少2.129个单位.
2.第四张表中还用t检验对各参数进行了检验,其中对常数检验其是否为0,t检验结果和相应的P值可以知道,常数并不为0,拒绝了原假设。
对各个回归系数的检验拒绝了原假设,认为以上三个影响是的确存在的。
3.对方程的偏回归系数进行检验结果如下:
Correlations
ControlVariables
净出口
国民生产总值
居民总储蓄
净出口
Correlation
1.000
.828
Significance(2-tailed)
.
.000
df
0
17
国民生产总值
Correlation
.828
1.000
Significance(2-tailed)
.000
.
df
17
0
在控制住国民总储蓄这一因素后,净出口和国民生产总值之间的关系很密切,相关系数达到了0.828,切经过检验P值约为0.000。
4.分析所建模型的优劣程度
第二张表中,复相关系数R,R-Square值和调整后的R-Square值很大,回归情况良好。
第三张表为对模型进行方差分析的结果,F值为64.060,P值小于0.05。
标准化残差Std.ErroroftheEstimate值为9335.68960,相对较大。
这个说明本回归方程的拟合存在一定的不合理的地方。
5.给出非标准化和标准化预测值结果如下
6.对残差的结果分析如下所示:
ANOVAb
Model
SumofSquares
df
MeanSquare
F
Sig.
1
Regression
1.675E10
3
5.583E9
64.060
.000a
Residual
1.394E9
16
8.716E7
Total
1.814E10
19
a.Predictors:
(Constant),外商投资,居民总储蓄,居民消费
b.DependentVariable:
国民生产总值
散点图如下
从残差的散点图中看出相关系数性不是很强。
直方图如下:
P-P图如下
直方图和P-P图显示,残差分布不存在明显的正态分布关系。