SPSS实践报告(最终版).doc

资源描述

SPSS实践报告(最终版).doc

《SPSS实践报告(最终版).doc》由会员分享，可在线阅读，更多相关《SPSS实践报告(最终版).doc（31页珍藏版）》请在冰点文库上搜索。

SPSS实践报告(最终版).doc

SPSS应用

实验报告

姓名：

胡昆仁

学号：

1304100715

指导老师：

胡朝明

专业班级：

统计1001

一目的

SPSSforWindows使用Windows的窗口方式展示各种管理数据和分析方法的功能，使用对话框展示各种功能选择项，清晰、直观、易学易用，涵盖面积广。

由于它具有强大的图形功能，使用它不但可以得到分析后的数字结果，还可以得到直观、清晰、漂亮的统计图，形象地显示对原始数据和分析结果的各种描述。

所以，作为统计专业的学生有必要掌握这门软件的使用。

这次课程实践的目的主要有以下三个方面：

1.掌握SPSS的基本操作，能够熟练应用SPSS进行基本的统计分析。

2.在用SPSS对具体实例进行分析的基础上能对结果进行正确的解释。

3.在对SPSS基本操作熟练的情况下，进一步自学SPSS更强大的分析能力。

二内容要求

1.掌握如何通过SPSS进行数据的获取和管理，包括数据的录入，保存，读

取，转化，增加，删除；数据集的合并，拆分，排序。

2.了解描述性统计的作用，并掌握其SPSS的实现（频数，均值，标准差，

中位数，众数，极差）。

3.应用SPSS生成表格和图形，并对表格和图形进行简单的编辑和分析。

4.应用SPSS做一些探索性分析（如方差分析，相关分析、回归分析）

5.应用SPSS做一个案例分析（某医院护士长对床旁凝血测定仪的应用研究）

三实验内容

1.江西省的投资收益表（单位：

亿元）

年份

GDP

最终消费

居民消费

工资总额

投资总额

1995

1169.73

769.98

629.78

162.16

284.18

1996

1409.74

919.59

758.36

185.83

355.85

1997

1605.77

989.6

796.77

194.4

384.3

1998

1719.87

1053.66

823.03

173.93

454.77

1999

1853.65

1122.56

865.87

205.78

491.48

2000

2003.07

1269.58

989.2

204.74

548.2

2001

2175.68

1357.47

1041.96

225.43

660.49

2002

2450.48

1459.65

1114.58

243.75

924.6

2003

2807.41

1515.64

1161.01

271.09

1379.97

2004

3456.7

1822.14

1431.42

305.45

1819.66

2005

4056.76

2117.3

1642.2

358.31

2292.55

2006

4670.53

2372.91

1804.79

417.07

2168.97

2007

5500.25

2793.45

2047.13

499.42

3301.94

2008

6480.31

3279.89

2522.19

573.25

4745.43

2009

7589.22

3545.84

2750.72

671.39

6643.14

2010

9435.36

4489.22

3545.46

807.14

8775

（1）数据的录入过程：

打开SPSS13.0软件，在SPSS的variableview里面的名称改成如下的格式：

然后再回到dataview输入数据可以得到：

（2）数据的保存过程

点击SPSS的文件-保存有如下的界面：

（3）数据的读取

点击文件-打开-数据文件，然后会出现下面的窗口，只要点击你要打开的sav后缀文件：

（4）数据的转化过程：

点击数据-行列转换，将所有的拖到变量中有：

点击确定之后，dataview里就会出现：

（5）数据的增加过程：

在var上右键点击就会出现插入变量，然后在variableview修改名称,

在dataview里输入相应变量的数据这样就增加了一列数据有：

（6）数据的删除过程：

选取某一行，或某一列的数据，右键-清除，例如，清除投资总额的数据，在投资总额上右键，然后点击清除有：

（7）数据集的合并：

观测值合并：

先将需要合并的文件保存

年份

GDP

居民消费

工资总额

1990

428.62

250.02

65.7

1991

479.37

270.89

71.93

1992

572.55

299.37

86.03

1993

723.04

349.29

104.2

1994

948.16

471.91

140.7

点击数据-合并-合并观测值，然后点击你要合并的文件有：

点击打开之后将不配对变量全部拖入新工作数据文件中的变量有：

点击确定之后，数据就合并了，有：

变量的合并：

年份

房地产投资

1998

27.12

1999

33.59

2002

103.36

2003

177.47

2007

435.45

先将其保存至一个文件，然后在江西投资收益表这个文件的数据下打开数据-合并文件-合并变量有

点击打开之后，在已经排序的文件中按关键变量匹配观测量前面打勾，并选取两个文件都是提供观测量，然后将排除变量中的年份移入到关键变量中就有：

点击确定之后出现：

（8）数据的拆分

由于上述数据没有分类，不便于拆分和排序，因此，需要换下面的某大学的成绩数据，其中的性别1为男性，2为女性

某大学基本信息

学号

性别

年龄

成绩

将这些数据录入到SPSS后，点击数据-拆分文件

根据分组安排输出：

将性别和年龄拖入，点击确定之后有：

（9）数据的排序

对（8）中合并的数据进行成绩排序，操作步骤为：

数据-观测量排序有：

点击确定之后就有：

2下表是某公司销售某产品的销量：

234

159

187

155

172

183

182

177

163

158

143

198

141

167

194

225

177

189

196

203

187

160

214

168

172

178

184

209

176

188

161

152

149

211

196

234

185

189

196

206

150

161

178

168

174

153

186

190

160

171

228

162

223

170

165

179

186

175

197

208

153

163

218

180

175

144

178

191

197

192

166

196

179

171

233

179

187

173

174

210

154

164

215

233

175

188

237

194

198

168

174

226

182

172

190

172

187

189

200

211

156

165

175

210

207

181

205

195

201

172

203

165

196

172

176

182

188

195

202

213

用SPSS得出频数分布的步骤是：

先将这些数据在SPSS中保存为一列的数据，再点击分析-描述统计-频数分布表，然后将销售量拖入到变量中，有：

点击统计：

勾选需要统计量，点击继续之后，点确定有：

Statistics

Valid

120

Missing

Mean

184.5750

Median

182.0000

Mode

172.00

Std.Deviation

21.68245

Range

96.00

销售量

Frequency

Percent

ValidPercent

CumulativePercent

Valid

141.00

143.00

1.7

144.00

2.5

149.00

3.3

150.00

4.2

152.00

5.0

153.00

1.7

6.7

154.00

7.5

155.00

8.3

156.00

9.2

158.00

10.0

159.00

10.8

160.00

1.7

12.5

161.00

1.7

14.2

162.00

15.0

163.00

1.7

16.7

164.00

17.5

165.00

2.5

20.0

166.00

20.8

167.00

21.7

168.00

2.5

24.2

170.00

25.0

171.00

1.7

26.7

172.00

5.0

31.7

173.00

32.5

174.00

2.5

35.0

175.00

3.3

38.3

176.00

1.7

40.0

177.00

1.7

41.7

178.00

2.5

44.2

179.00

2.5

46.7

180.00

47.5

181.00

48.3

182.00

2.5

50.8

183.00

51.7

184.00

52.5

185.00

53.3

186.00

1.7

55.0

187.00

3.3

58.3

188.00

2.5

60.8

189.00

2.5

63.3

190.00

1.7

65.0

191.00

65.8

192.00

66.7

194.00

1.7

68.3

195.00

1.7

70.0

196.00

4.2

74.2

197.00

1.7

75.8

198.00

1.7

77.5

200.00

78.3

201.00

79.2

202.00

80.0

203.00

1.7

81.7

205.00

82.5

206.00

83.3

207.00

84.2

208.00

85.0

209.00

85.8

210.00

1.7

87.5

211.00

1.7

89.2

213.00

90.0

214.00

90.8

215.00

91.7

218.00

92.5

223.00

93.3

225.00

94.2

226.00

95.0

228.00

95.8

233.00

1.7

97.5

234.00

1.7

99.2

237.00

100.0

Total

120

100.0

3基本图表

（1）直方图

可以同时上题画出它的正态分布曲线，只要点击图表，直方图：

结果为：

（2）饼图

对上述的大学生基本信息中的年龄画饼图操作：

点击图表-饼图有：

点击定义之后有：

点击确定之后：

从而可以看出这届19岁的学生为最多。

（3）散点图（SPSS11.5画）

点击图表-散点图有：

点击确定之后有：

再点击确定之后有：

从这个图可以看出学生们的成绩有高有低，直观地显示了每个同学的成绩

4探索性分析

（1）方差分析

单因素方差分析：

为寻求适应本地区的高产量油菜品种，今选了5个不同品种，每一品种在4块试验田上试种，得到在每一块田上的亩产量如下表。

田块/品种

256

244

250

288

206

222

300

277

280

212

280

290

230

315

220

298

275

322

259

212

首先对这种数据进行预处理，在SPSS中如下显示：

点击分析-均值比较-一维方差分析，将产是拖入因变量列，将因子拖入品种内有：

点击确定之后有：

查出表中的数据和上述的F值进行比较可以得出，不同品种的为产量在0.05水平上有显著差异。

双因素方差分析：

下面记录了3位操作工分别在4台不同机器上操作二天的日产量

机器

操作工

甲

乙

丙

对它进行双因素方差分析的过程为：

同理对此，SPSS的显示为

从而点击-分析-一般线性模型-单因素双变量方差分析：

点击确定之后有：

通过查表比较F值从而可以看出机器与机器之间无显著差异，操作工与操作工之间有显著差异，操作工*机器有显著差异。

（2）相关分析

下面是某生产公司的基本信息：

电力消耗（千瓦）

温度（华氏）

日产量

120

110

128

101

105

108

110

107

112

119

对它们进行相关分析有：

在ＳＰＳＳ中点击分析－相关分析－两个变量相关分析有：

点击确定之后有：

从输出的结果来看：

电力消耗和温度在0.01水平上显著相关

电力消耗和日产量之间低度相关

温度和日产量中度相关

（3）回归分析

维尼纶纤维的耐热水性能好坏可以用指标“缩醛化度”来衡量。

这个指标越高，耐热水性能就越好。

而甲醛浓度是影响缩醛化度的重要因素，在生产中常用甲醛浓度去控制这一指标，为此必须找出它们之间关系，现安排了一批试验，获得如下的数据：

甲酫浓度（克/升）

缩醛化度（摩尔%）

26.68

28.35

28.75

28.87

29.75

30.36

先观察它们之间的关系散点图：

根据上面的操作步骤对它们画散点图有：

从而可以看出基本呈现线性分析，所以对其进行一元线性回归分析，具体操作为

点击分析-回归-线性有：

点击确定之后有：

这个显示的是选取的变量，舍弃的变量，和分析的方法，这里用到的方法是进入的方法进行回归。

这个输出显示了拟合的优度，从R方，我们可以看到，拟合优度可以达到90%，可以看出还是很理想的

这个就是方差分析。

从这个我可以看出它的方程为：

五、案例分析

案例一分析：

某医院护士长对床旁凝血测定仪的应用研究（SPSS19.0中文版）

我很赞成护士长的做法，简单，科学，有说服力。

但是我自己做了一下，发现护士长做的方差分析过程中的输出是明显有误的，这里我主要探讨护士长结果是如何做来的，是怎么运用SPSS得到的，并且指出文章中明显错误的地方，下面是我做的过程：

1、方差分析

将数据录入成这种形势：

APTTPTINR之间的均值比较分析

点击分析-比较均值-单因素anova有：

然后将APPT.PT.INR拖入因变量列表方式拖入因子中

点击两两比较有：

在假定方差齐性中选择LSD在示假定方差齐性中选择Tamhane’sT2

点击继续之后确定有：

多重比较

因变量

（I）方式

（J）方式

均值差（I-J）

标准误

显著性

95%置信区间

下限

上限

APPT

LSD

1.00

2.00

-4.01471*

.96543

.000

-5.9303

-2.0991

3.00

-1.72647

.96543

.077

-3.6421

.1892

2.00

1.00

4.01471*

.96543

.000

2.0991

5.9303

3.00

2.28824*

.96543

.020

.3726

4.2039

3.00

1.00

1.72647

.96543

.077

-.1892

3.6421

2.00

-2.28824*

.96543

.020

-4.2039

-.3726

Tamhane

1.00

2.00

-4.01471*

.91633

.000

-6.2596

-1.7698

3.00

-1.72647

.98923

.236

-4.1512

.6983

2.00

1.00

4.01471*

.91633

.000

1.7698

6.2596

3.00

2.28824

.98890

.070

-.1357

4.7121

3.00

1.00

1.72647

.98923

.236

-.6983

4.1512

2.00

-2.28824

.98890

.070

-4.7121

.1357

LSD

1.00

2.00

-.18235

.36425

.618

-.9051

.5404

3.00

.07647

.36425

.834

-.6463

.7992

2.00

1.00

.18235

.36425

.618

-.5404

.9051

3.00

.25882

.36425

.479

-.4639

.9816

3.00

1.00

-.07647

.36425

.834

-.7992

.6463

2.00

-.25882

.36425

.479

-.9816

.4639

Tamhane

1.00

2.00

-.18235

.37018

.947

-1.0897

.7250

3.00

.07647

.37473

.996

-.8419

.9948

2.00

1.00

.18235

.37018

.947

-.7250

1.0897

3.00

.25882

.34725

.841

-.5919

1.1095

3.00

1.00

-.07647

.37473

.996

-.9948

.8419

2.00

-.25882

.34725

.841

-1.1095

.5919

INR

LSD

1.00

2.00

-.01147

.01879

.543

-.0488

.0258

3.00

.00912

.01879

.629

-.0282

.0464

2.00

1.00

.01147

.01879

.543

-.0258

.0488

3.00

.02059

.01879

.276

-.0167

.0579

3.00

1.00

-.00912

.01879

.629

-.0464

.0282

2.00

-.02059

.01879

.276

-.0579

.0167

Tamhane

1.00

2.00

-.01147

.01820

.897

-.0561

.0331

3.00

.00912

.01880

.949

-.0370

.0552

2.00

1.00

.01147

.01820

.897

-.0331

.0561

3.00

.02059

.01935

.644

-.0268

.0680

3.00

1.00

-.00912

.01880

.949

-.0552

.0370

2.00

-.02059

.01935

.644

-.0680

.0268

*.均值差的显著性水平为0.05。

显然这与文章中的结果不一样，但是明显可以看出文章中的数据采用了38组数据（38*3-1=113）来进行计算，但是给出的数据只有34组（34*3-1=101）。

从上面第一个表中可以看出APTT显著性概率0.00<0.01，表示三各方法所得A数据不具有方差齐性，既不同方法所得APTT有显著差异。

PT显著性概率0.767>0.01，表示三各方法所得A数据具有方差齐性，既不同方法所得PT没有显著差异。

INR显著性概率0.549>0.01，表示三各方法所得A数据具有方差齐性，既不同方法所得INR没有显著差异。

从上面第二个表可以看出

对于APTT（Tamhane值）：

静脉血实验室组与静脉血试条组所得APTT均值组合的显著性概率为0.00〈0.01，既两种方法所得的APTT均值有显著性差异，静脉血实验室组与末梢血试条组组合的显著性概率为0.236〉0.01，既两种方法所得的APTT均值无显著性差异，静脉血试条组与末梢血试条组组合的显著性概率为0.07〉0.01，既两种方法所得的APTT均值无显著性差异。

对于PT（LSD）

静脉血实验室组与静脉血试条组的显著性概率为0.618〉0.01，无显著性差异，静脉血实验室组与末梢血试条组的显著性概率为0.834〉0.01，无显著性差异，静脉血

展开阅读全文