SPSS学习系列16统计量与统计图.docx

资源描述

SPSS学习系列16统计量与统计图.docx

《SPSS学习系列16统计量与统计图.docx》由会员分享，可在线阅读，更多相关《SPSS学习系列16统计量与统计图.docx（14页珍藏版）》请在冰点文库上搜索。

SPSS学习系列16统计量与统计图.docx

SPSS学习系列16统计量与统计图

16.统计量与统计图

针对连续变量做描述性统计。

描述性统计量分为：

（1）刻画集中趋势——均值、中位数、众数；

（2）刻画离散程度——方差、标准差、极差、变异系数；

（3）刻画分布形态——偏度、峰度。

一、简单的描述性统计

有数据文件：

对“数学成绩”、“英语成绩”做描述性统计。

1.【分析】——【描述统计】——【描述】，打开“描述性”窗口，将变量“数学成绩”“英语成绩”选入【变量】框，

2.点【选项】，打开“选项”子窗口，根据需要勾选

点【继续】回到原窗口；

若需要得到Z标准分数，勾选“将标准化得分另存为变量”；点【确定】得到

描述统计量

全距

极小值

极大值

和

均值

标准差

方差

偏度

峰度

统计量

标准误

统计量

标准误

统计量

标准误

数学成绩

100

3789

75.78

1.974

13.960

194.869

-.174

.337

-.651

.662

英语成绩

100

3966

79.32

2.280

16.123

259.936

-.725

.337

-.355

.662

有效的N（列表状态）

注：

默认是按变量选入顺序输出上表。

二、探索性描述统计

输出统计量和统计图，其主要作用有：

（1）检查异常值；

（2）检验数据的分布特征（是否服从正态分布）；

1.【分析】——【描述统计】——【探索】，打开“探索”窗口，将变量“数学成绩”“英语成绩”选入【变量】框

注：

若在【因子变量】框选入若干分类变量，将按其水平值组合分别统计分析；注意勾选【输出】可选项的“两者都”。

2.点【统计量】，打开“统计量”子窗口，

“M-估计量”——当数据背离正态分布、带长尾、或有极端数据时，M-估计量仍能提供很好的中心趋势估计；

“界外值”——可以检验数据是否有极端值存在；

3.点【绘制】，打开“图”子窗口，【箱图】勾选“按因子水平分组”，【描述性】勾选“茎叶图”、“直方图”，勾选“带检验的正态图”（检验数据是否具有正态性）

点【继续】回到原窗口，点【确定】得到

案例处理摘要

案例

有效

缺失

合计

百分比

数学成绩

100.0%

0.0%

100.0%

英语成绩

100.0%

0.0%

100.0%

描述

统计量

标准误

数学成绩

均值

75.78

1.974

均值的95%置信区间

下限

71.81

上限

79.75

5%修整均值

75.92

中值

75.50

方差

194.869

标准差

13.960

极小值

极大值

100

范围

四分位距

偏度

-.174

.337

峰度

-.651

.662

英语成绩

均值

79.32

2.280

均值的95%置信区间

下限

74.74

上限

83.90

5%修整均值

80.30

中值

85.00

方差

259.936

标准差

16.123

极小值

极大值

100

范围

四分位距

偏度

-.725

.337

峰度

-.355

.662

正态性检验

Kolmogorov-Smirnova

Shapiro-Wilk

统计量

Sig.

统计量

Sig.

数学成绩

.082

.200*

.974

.340

英语成绩

.178

.000

.913

.001

*.这是真实显著水平的下限。

a.Lilliefors显著水平修正

（1）样本量大于50用Kolmogorov-Smirnov检验，样本量小于50用Shapiro-Wilk检验；

（2）原假设H0：

服从正态分布；H1：

不服从正态分布。

P值<0.05,拒绝原假设H0；P值>0.05,接受原假设H0,即服从正态分布；

本例中，数学成绩的P值=0.340>0.05,故服从正态分布；英语成绩的P值=0.001<0.05,故不服从正态分布。

数学成绩Stem-and-LeafPlot

FrequencyStem&Leaf

1.004.2

.004.

.005.

7.005.5556777

3.006.024

4.006.5578

7.007.0111124

9.007.555668888

3.008.244

7.008.5577779

4.009.1224

4.009.5789

1.0010.0

Stemwidth:

Eachleaf:

1case（s）

茎叶图，SPSS自动根据全距选定5作为组距，以第5行为例，茎的数字为6，叶的数字为024，表示该组距有三个观察值：

60,62,64

即正态概率分布图，越接近直线，表示越服从正态分布。

残差图。

盒形图。

“英语成绩”的上述图形（略）。

三、盒形图

在一条数轴上，以数据的上下四分位数（Q1-Q3）为界画一个矩形盒子（中间50%的数据落在盒内）；在数据的中位数位置画一条线段为中位线；用◇标记数据的均值；默认延长线不超过盒长的1.5倍，之外的点认为是异常值（用○标记）。

盒形图的主要应用就是，剔除数据的异常值、判断数据的偏态和尾重。

有数据文件：

依前文做探索性描述统计，只绘制“直方图”和“盒形图”。

描述

统计量

标准误

均值

45.36

1.739

均值的95%置信区间

下限

41.91

上限

48.81

5%修整均值

44.31

中值

42.00

方差

302.516

标准差

17.393

极小值

极大值

范围

四分位距

偏度

.871

.241

峰度

.440

.478

均值

66.14

1.871

均值的95%置信区间

下限

62.43

上限

69.85

5%修整均值

66.99

中值

68.00

方差

350.243

标准差

18.715

极小值

极大值

范围

四分位距

偏度

-.656

.241

峰度

.126

.478

正态性检验

Kolmogorov-Smirnova

Shapiro-Wilk

统计量

Sig.

统计量

Sig.

.125

100

.001

.940

100

.000

.083

100

.086

.965

100

.010

a.Lilliefors显著水平修正

注：

X1为正偏态数据（偏度>0,高峰左偏移、右长尾），均值45.36>中位数42>众数35.盒形图中的黑线为中位数位置；圆圈标记为异常值；若有*标记，表示极端值（3倍IQR外）。

注：

X2为负偏态数据（偏度<0,高峰右偏移、左长尾）。

展开阅读全文