统计SPSS实习.docx - 冰点文库

资源描述

统计SPSS实习.docx

《统计SPSS实习.docx》由会员分享，可在线阅读，更多相关《统计SPSS实习.docx（36页珍藏版）》请在冰点文库上搜索。

统计SPSS实习.docx

统计SPSS实习

实验报告二

实验项目：

描述性统计分析

实验目的：

掌握数据集中趋势和离中趋势的分析方法,并熟练掌握各个分析过程的基本步骤以及彼此之间的联系和区别。

实验内容及其步骤：

统计分析的第一步是描述性统计分析，这第一步是进行以下步骤的开始。

我用的方法是：

Frequencies过程。

它的特色是产生频数表；Descriptives过程是进行一般性的统计描述；Explore过程是对数据概况不清时的探索性分析；Crosstabs过程是完成计数资料，和等级资料的统计描述和一般的统计检验，也就是卡方检验。

一、频数分析（Frequencies过程）

数据集1]E:

\excel安装\2011统计模拟实习资料\数据资料\数据集\第二章\2.4、高考[录取\数据集\数据－SPSS格式\交大机械工程.sav

统计量

名次

有效

缺失

名次

频率

百分比

有效百分比

累积百分比

有效

1.00

10.9

11.3

2.00

6.3

6.5

17.7

3.00

6.3

6.5

24.2

4.00

6.3

6.5

30.6

5.00

6.3

6.5

37.1

6.00

4.7

4.8

41.9

7.00

4.7

4.8

46.8

8.00

3.1

3.2

50.0

9.00

3.1

3.2

53.2

10.00

3.1

3.2

56.5

11.00

3.1

3.2

59.7

12.00

3.1

3.2

62.9

13.00

3.1

3.2

66.1

14.00

3.1

3.2

69.4

15.00

3.1

3.2

72.6

16.00

3.1

3.2

75.8

17.00

3.1

3.2

79.0

18.00

3.1

3.2

82.3

19.00

3.1

3.2

85.5

20.00

3.1

3.2

88.7

21.00

3.1

3.2

91.9

22.00

3.1

3.2

95.2

23.00

3.1

3.2

98.4

24.00

1.6

100.0

合计

96.9

100.0

缺失

系统

3.1

合计

100.0

分析：

由上图的调查结果中，可以看出，名次第一的频率最高，百分比为11.3.其次为2、3、4、5名的百分比为6.5.。

可以看出，随着名次靠后，频率也随之下降。

二、描述性分析（Descriptives过程）

[数据集1]E:

\excel安装\2011统计模拟实习资料\数据资料\数据集\第二章\2.4、高考录取\数据集\数据－SPSS格式\交大机械工程.sav

描述统计量

极小值

极大值

均值

标准差

招生人数

1.00

78.00

9.6471

12.23899

有效的N（列表状态）

上图的调查结果可以看出，极大值为78，极小值为1。

标准差为12.239，较小。

说明招生人数对交大机械工程的影响不怎么显著。

三、探索分析（Explore过程）

[数据集1]E:

\excel安装\2011统计模拟实习资料\数据资料\数据集\第二章\2.4、高考录取\数据集\数据－SPSS格式\交大机械工程.sav

学校

案例处理摘要

学校

案例

有效

缺失

合计

百分比

重点线

西安交通

96.8%

3.2%

100.0%

描述

学校

统计量

标准误

重点线

西安交通

均值

526.6333

7.54688

均值的95%置信区间

下限

511.5321

上限

541.7346

5%修整均值

526.2593

中值

526.5000

方差

3417.321

标准差

58.45786

极小值

400.00

极大值

650.00

范围

250.00

四分位距

78.25

偏度

.218

.309

峰度

-.307

.608

重点线

茎叶图

重点线Stem-and-LeafPlotfor

学校=西安交通

FrequencyStem&Leaf

4.02234

4.55677777788899

5.000011111222233333334444

5.556677899

6.0012334

6.5

Stemwidth:

100.00

Eachleaf:

1case（s）

分析：

由上图可以得出，西安交通大学的重点分数线主要集中在525分左右。

四、交叉列联表分析（Crosstabs过程）

原假设：

招生人数在年度之间无差异

备择假设：

招生人数在年度之间有差异。

[数据集1]E:

\excel安装\2011统计模拟实习资料\数据资料\数据集\第二章\2.4、高考录取\数据集\数据－SPSS格式\交大机械工程.sav

案例处理摘要

案例

有效的

缺失

合计

百分比

年度*招生人数

82.3%

17.7%

100.0%

年度交叉制表

招生人数

合计

1.00

2.00

3.00

4.00

5.00

6.00

7.00

8.00

9.00

10.00

12.00

14.00

17.00

18.00

21.00

22.00

24.00

37.00

78.00

年度

2000.00

2001.00

合计

卡方检验

值

渐进Sig.（双侧）

Pearson卡方

22.303a

.219

似然比

28.369

.057

线性和线性组合

.446

.504

有效案例中的N

38单元格（100.0%）的期望计数少于5。

最小期望计数为.49。

由卡方检验可以得出：

P值为0.219，大于0.05，则接受原假设，则，招生人数在年度之间无差异。

实验报告三

均数间的比较实验

实验项目：

均数间的比较实验

基本操作训练

实验的目的：

运用SPSS软件进行均数之间的比较。

并能掌握运用SPSS软件的进行假设检验

实验内容：

1、描述统计（Means过程）

2、单样本T检验（One-SampleTTest过程）

3、两个独立样本T检验（Independent-SamplesTTest过程）

4、配对样本T检验（Paired-SamplesTTest过程）

1.描述统计（Means过程）

数据选取：

操作步骤：

输出结果：

案例处理摘要

案例

已包含

已排除

总计

百分比

投入证券市场总资金（万元）*受教育程度

381

91.8%

8.2%

415

100.0%

报告

投入证券市场总资金（万元）

受教育程度

均值

标准差

初中及以下

42.4730

37.05869

高中

34.5663

32.45342

大专

35.0941

101

31.08188

大学

42.2769

121

31.73694

硕士

42.6563

31.49973

博士

50.9286

41.38279

总计

38.9029

381

32.47079

分析与结论：

从以上数据中可以得出，学历越高的人在证券市场的投资额越高，其中，学历在初中及以下的平均投资42.4730万元，高中平均投资34.5663，大专平均35.0941万元，硕士平均42.6563，博士平均50.9286.

2.单样本T检验（One-SampleTTest过程）

数据选取：

操作步骤：

输出结果：

单个样本统计量

均值

标准差

均值的标准误

投入证券市场总资金（万元）

405

38.9000

32.37486

1.60872

单个样本检验

检验值=38.9

Sig.（双侧）

均值差值

差分的95%置信区间

下限

上限

投入证券市场总资金（万元）

.000

404

1.000

.00000

-3.1625

3.1625

分析与结论：

对于投入证券市场总资金的样本均值与已知的总体均值进行比较，看样本均值是否具有代表性，由此进行假设检验：

H0:

投入证券市场总资金的均值=38.9000；

H1：

投入证券市场总资金的均值≠38.9000；

因为P=1.000>0.05

所以接受原假设。

因此可以得出结论：

总资金的均值显著为38.9

3、独立样本T检验

操作步骤：

输出结果：

组统计量

投入证券市场总资金（万元）

男

213

40.8967

32.71855

2.24184

女

189

36.8016

32.15238

2.33874

独立样本检验

方差方程的

Levene检验

均值方程的t检验

Sig.

（双侧）

均值

差值

标准误

差值

差分的95%置信区间

下限

上限

投入证

券市场

总资金

（万元）

假设方差相等

1.622

.204

1.263

400

.207

4.09513

3.24307

-2.28046

10.47072

假设方差不相等

1.264

395.843

.207

4.09513

3.23968

-2.27401

10.46426

分析与结论：

第一部分为方差齐性检验，用于判断两总体方差是否齐，结果为F=1.622，P=0.204，可见在本例中方差是齐性的

第二部分是对男性和女性进行独立样本检验，检验男性和女性的投入证券市场总资金（万元）是否相等；

检验如下：

H0：

男性的投入证券市场总资金=女性的投入证券市场总资金；

H1：

男性的投入证券市场总资金≠女性的投入证券市场总资金；

方差检验：

p=0.204>0.05

所以方差显著相等，说明样本值来自同一个大样本。

均值检验：

p=0.207>0.05;

所以接受原假设，男性和女性的投入证券市场总资金是相等的。

4.配对样本T检验（Paired-SamplesTTest过程）

数据选取：

操作步骤：

输出结果：

成对样本统计量

均值

标准差

均值的标准误

对1

问卷A下的得分

149.60

2.542

.568

问卷B下得得分

148.90

2.654

.593

成对样本相关系数

相关性

人均食品支出

人均收入

人均食品支出

Pearson相关性

.921**

显著性（双侧）

.000

平方与叉积的和

1035808.839

2080550.032

协方差

34526.961

69351.668

人均收入

Pearson相关性

.921**

显著性（双侧）

.000

平方与叉积的和

2080550.032

4926978.194

协方差

69351.668

164232.606

**.在.01水平（双侧）上显著相关。

3.分析结果：

R=0.921显著性=0.000＜0.01处于拒绝域拒绝原假设

4.得出结论：

年人均食品支出与年人均收入相关，且是高度相关。

（二）偏相关分析（Partial过程）

1.分析实例：

分析年人均可支配收入与教育支出是否都对年人均消费性支出有影响

2.提出假设：

控制人均可支配收入时，

H0：

教育支出与年人均消费性支出不相关

H1：

教育支出与年人均消费性支出相关

相关性

年人均可支配收入

年人均消费性支出

教育支出

年人均可支配收入

Pearson相关性

.997**

.921**

显著性（双侧）

.000

年人均消费性支出

Pearson相关性

.997**

.914**

显著性（双侧）

.000

教育支出

Pearson相关性

.921**

.914**

显著性（双侧）

.000

**.在.01水平（双侧）上显著相关。

相关性

控制变量

年人均消费性支出

教育支出

年人均可支配收入

年人均消费性支出

相关性

1.000

.002

显著性（双侧）

.996

教育支出

相关性

.002

1.000

显著性（双侧）

.996

3.分析结果：

当不剔除年人均可支配收入时，教育支出与年人均消费性支出相关性达0.914，显著性小于0.01，处于拒绝域，是相关的。

当剔除年人均可支配收入时，教育支出与年人均消费性支出相关性为0.002，显著性等于0.996大于0.05，不处于拒绝域不拒绝原假设。

4.得出结论：

当控制人均可支配收入时，教育支出与年人均消费性支出

（三）距离分析（Distances过程）

1.分析实例：

比较各组心脏病猝死人数近似程度

案例处理摘要

案例

有效

缺失

合计

百分比

100.0%

.0%

100.0%

近似矩阵

Euclidean距离

.000

3.000

1.000

2.000

4.000

3.000

2.000

3.000

1.000

3.000

4.000

3.000

.000

2.000

1.000

.000

1.000

.000

2.000

.000

1.000

.000

3.000

.000

2.000

1.000

.000

1.000

.000

2.000

.000

1.000

.000

1.000

2.000

.000

1.000

3.000

2.000

1.000

2.000

.000

2.000

3.000

2.000

1.000

.000

2.000

1.000

.000

1.000

2.000

1.000

4.000

1.000

3.000

2.000

.000

1.000

2.000

1.000

3.000

1.000

.000

1.000

3.000

.000

2.000

1.000

.000

1.000

.000

2.000

.000

1.000

.000

3.000

.000

2.000

1.000

.000

1.000

.000

2.000

.000

1.000

.000

这是一个不相似性矩阵

2.分析结果：

1组和4组相似性最小，和6组相似性最大；

2组和3组相似性最小，和1组相似性最大；

3组和2组相似性最小，和1组相似性最大；

4组和5组相似性最小，和6组相似性最大；

5组和4组相似性最小，和1,6组相似性最大；

6组和3组相似性最小，和4组相似性最大；

7组和1组相似性最小，和3组相似性最大；

8组和1组相似性最小，和3组相似性最大.、

（四）线性回归分析（Linear过程）

（1）一元线性回归

1.分析实例：

分析粮食单价与人均食用支出是否具有一元线性关系

2.提出假设：

H0：

β1=0

H1：

β1≠0

输入／移去的变量b

模型

输入的变量

移去的变量

方法

粮食平均单价

输入

a.已输入所有请求的变量。

b.因变量:

人均食品支出

模型汇总

模型

R方

调整R方

标准估计的误差

.730a

.532

.516

129.230

a.预测变量:

（常量）,粮食平均单价。

Anovab

模型

平方和

均方

Sig.

回归

551497.958

33.023

.000a

残差

484310.880

16700.375

总计

1035808.839

a.预测变量:

（常量）,粮食平均单价。

b.因变量:

人均食品支出

系数a

模型

非标准化系数

标准系数

Sig.

标准误差

试用版

（常量）

260.227

95.878

2.714

.011

粮食平均单价

640.586

111.473

.730

5.747

.000

a.因变量:

人均食品支出

3.分析结果：

由模型汇总表R方=0.532具有相关性

再看系数表sig=0.00＜0.05处于拒绝域拒绝原假设

4.得出结论：

论粮食单价与人均食用量具有一元线性关系

可得出一元线性回归函数关系式：

y=260.227+640.586x

（2）多元线性回归

1.分析实例：

分析服装消费与价格服装指数，金融资产，可支配收入是否具有多元线性关系。

2.提出假设：

H0：

β1=β2=…=β6=0

H1：

β1，β2,…β6不全为0

输入／移去的变量b

模型

输入的变量

移去的变量

方法

服装价格指数，95=100,金融资产，百万美元,可支配收入，百万美元

输入

a.已输入所有请求的变量。

b.因变量:

服装消费，百万美元

模型汇总

模型

R方

调整R方

标准估计的误差

.998a

.996

.994

.33508

b.预测变量:

（常量）,服装价格指数，95=100,金融资产，百万美元,可支配收入，百万美元。

Anovab

模型

平方和

均方

Sig.

回归

165.826

55.275

492.297

.000a

残差

.674

.112

总计

166.500

a.预测变量:

（常量）,服装价格指数，95=100,金融资产，百万美元,可支配收入，百万美元。

b.因变量:

服装消费，百万美元

系数a

模型

非标准化系数

标准系数

Sig.

标准误差

试用版

（常量）

.940

5.180

.181

.862

可支配收入，百万美元

.139

.025

1.174

5.585

.001

金融资产，百万美元

-.038

.057

-.114

-.668

.529

服装价格指数，95=100

-.034

.070

-.065

-.494

.639

a.因变量:

服装消费，百万美元

3.分析结果：

可支配收入sig=0.001<0.05不应剔除

金融资产sig=0.529>0.05应剔除

服装价格指数sig=0.639＞0.05应剔除

4.得出结论：

根据向后剔除法，最后剩下可支配收入，一般价格指数具有多重共线性。

可得出多元线性关系

展开阅读全文