SPSS学习系列16统计量与统计图.docx
《SPSS学习系列16统计量与统计图.docx》由会员分享,可在线阅读,更多相关《SPSS学习系列16统计量与统计图.docx(14页珍藏版)》请在冰点文库上搜索。
SPSS学习系列16统计量与统计图
16.统计量与统计图
针对连续变量做描述性统计。
描述性统计量分为:
(1)刻画集中趋势——均值、中位数、众数;
(2)刻画离散程度——方差、标准差、极差、变异系数;
(3)刻画分布形态——偏度、峰度。
一、简单的描述性统计
有数据文件:
对“数学成绩”、“英语成绩”做描述性统计。
1.【分析】——【描述统计】——【描述】,打开“描述性”窗口,将变量“数学成绩”“英语成绩”选入【变量】框,
2.点【选项】,打开“选项”子窗口,根据需要勾选
点【继续】回到原窗口;
若需要得到Z标准分数,勾选“将标准化得分另存为变量”;点【确定】得到
描述统计量
N
全距
极小值
极大值
和
均值
标准差
方差
偏度
峰度
统计量
统计量
统计量
统计量
统计量
统计量
标准误
统计量
统计量
统计量
标准误
统计量
标准误
数学成绩
50
58
42
100
3789
75.78
1.974
13.960
194.869
-.174
.337
-.651
.662
英语成绩
50
62
38
100
3966
79.32
2.280
16.123
259.936
-.725
.337
-.355
.662
有效的N(列表状态)
50
注:
默认是按变量选入顺序输出上表。
二、探索性描述统计
输出统计量和统计图,其主要作用有:
(1)检查异常值;
(2)检验数据的分布特征(是否服从正态分布);
1.【分析】——【描述统计】——【探索】,打开“探索”窗口,将变量“数学成绩”“英语成绩”选入【变量】框
注:
若在【因子变量】框选入若干分类变量,将按其水平值组合分别统计分析;注意勾选【输出】可选项的“两者都”。
2.点【统计量】,打开“统计量”子窗口,
“M-估计量”——当数据背离正态分布、带长尾、或有极端数据时,M-估计量仍能提供很好的中心趋势估计;
“界外值”——可以检验数据是否有极端值存在;
3.点【绘制】,打开“图”子窗口,【箱图】勾选“按因子水平分组”,【描述性】勾选“茎叶图”、“直方图”,勾选“带检验的正态图”(检验数据是否具有正态性)
点【继续】回到原窗口,点【确定】得到
案例处理摘要
案例
有效
缺失
合计
N
百分比
N
百分比
N
百分比
数学成绩
50
100.0%
0
0.0%
50
100.0%
英语成绩
50
100.0%
0
0.0%
50
100.0%
描述
统计量
标准误
数学成绩
均值
75.78
1.974
均值的95%置信区间
下限
71.81
上限
79.75
5%修整均值
75.92
中值
75.50
方差
194.869
标准差
13.960
极小值
42
极大值
100
范围
58
四分位距
22
偏度
-.174
.337
峰度
-.651
.662
英语成绩
均值
79.32
2.280
均值的95%置信区间
下限
74.74
上限
83.90
5%修整均值
80.30
中值
85.00
方差
259.936
标准差
16.123
极小值
38
极大值
100
范围
62
四分位距
26
偏度
-.725
.337
峰度
-.355
.662
正态性检验
Kolmogorov-Smirnova
Shapiro-Wilk
统计量
df
Sig.
统计量
df
Sig.
数学成绩
.082
50
.200*
.974
50
.340
英语成绩
.178
50
.000
.913
50
.001
*.这是真实显著水平的下限。
a.Lilliefors显著水平修正
(1)样本量大于50用Kolmogorov-Smirnov检验,样本量小于50用Shapiro-Wilk检验;
(2)原假设H0:
服从正态分布;H1:
不服从正态分布。
P值<0.05,拒绝原假设H0;P值>0.05,接受原假设H0,即服从正态分布;
本例中,数学成绩的P值=0.340>0.05,故服从正态分布;英语成绩的P值=0.001<0.05,故不服从正态分布。
数学成绩Stem-and-LeafPlot
FrequencyStem&Leaf
1.004.2
.004.
.005.
7.005.5556777
3.006.024
4.006.5578
7.007.0111124
9.007.555668888
3.008.244
7.008.5577779
4.009.1224
4.009.5789
1.0010.0
Stemwidth:
10
Eachleaf:
1case(s)
茎叶图,SPSS自动根据全距选定5作为组距,以第5行为例,茎的数字为6,叶的数字为024,表示该组距有三个观察值:
60,62,64
即正态概率分布图,越接近直线,表示越服从正态分布。
残差图。
盒形图。
“英语成绩”的上述图形(略)。
三、盒形图
在一条数轴上,以数据的上下四分位数(Q1-Q3)为界画一个矩形盒子(中间50%的数据落在盒内);在数据的中位数位置画一条线段为中位线;用◇标记数据的均值;默认延长线不超过盒长的1.5倍,之外的点认为是异常值(用○标记)。
盒形图的主要应用就是,剔除数据的异常值、判断数据的偏态和尾重。
有数据文件:
依前文做探索性描述统计,只绘制“直方图”和“盒形图”。
描述
统计量
标准误
X1
均值
45.36
1.739
均值的95%置信区间
下限
41.91
上限
48.81
5%修整均值
44.31
中值
42.00
方差
302.516
标准差
17.393
极小值
20
极大值
98
范围
78
四分位距
22
偏度
.871
.241
峰度
.440
.478
X2
均值
66.14
1.871
均值的95%置信区间
下限
62.43
上限
69.85
5%修整均值
66.99
中值
68.00
方差
350.243
标准差
18.715
极小值
12
极大值
98
范围
86
四分位距
27
偏度
-.656
.241
峰度
.126
.478
正态性检验
Kolmogorov-Smirnova
Shapiro-Wilk
统计量
df
Sig.
统计量
df
Sig.
X1
.125
100
.001
.940
100
.000
X2
.083
100
.086
.965
100
.010
a.Lilliefors显著水平修正
注:
X1为正偏态数据(偏度>0,高峰左偏移、右长尾),均值45.36>中位数42>众数35.盒形图中的黑线为中位数位置;圆圈标记为异常值;若有*标记,表示极端值(3倍IQR外)。
注:
X2为负偏态数据(偏度<0,高峰右偏移、左长尾)。