SPSS实践报告(最终版).doc
《SPSS实践报告(最终版).doc》由会员分享,可在线阅读,更多相关《SPSS实践报告(最终版).doc(31页珍藏版)》请在冰点文库上搜索。
SPSS应用
实验报告
姓名:
胡昆仁
学号:
1304100715
指导老师:
胡朝明
专业班级:
统计1001
一目的
SPSSforWindows使用Windows的窗口方式展示各种管理数据和分析方法的功能,使用对话框展示各种功能选择项,清晰、直观、易学易用,涵盖面积广。
由于它具有强大的图形功能,使用它不但可以得到分析后的数字结果,还可以得到直观、清晰、漂亮的统计图,形象地显示对原始数据和分析结果的各种描述。
所以,作为统计专业的学生有必要掌握这门软件的使用。
这次课程实践的目的主要有以下三个方面:
1.掌握SPSS的基本操作,能够熟练应用SPSS进行基本的统计分析。
2.在用SPSS对具体实例进行分析的基础上能对结果进行正确的解释。
3.在对SPSS基本操作熟练的情况下,进一步自学SPSS更强大的分析能力。
二内容要求
1.掌握如何通过SPSS进行数据的获取和管理,包括数据的录入,保存,读
取,转化,增加,删除;数据集的合并,拆分,排序。
2.了解描述性统计的作用,并掌握其SPSS的实现(频数,均值,标准差,
中位数,众数,极差)。
3.应用SPSS生成表格和图形,并对表格和图形进行简单的编辑和分析。
4.应用SPSS做一些探索性分析(如方差分析,相关分析、回归分析)
5.应用SPSS做一个案例分析(某医院护士长对床旁凝血测定仪的应用研究)
三实验内容
1.江西省的投资收益表(单位:
亿元)
年份
GDP
最终消费
居民消费
工资总额
投资总额
1995
1169.73
769.98
629.78
162.16
284.18
1996
1409.74
919.59
758.36
185.83
355.85
1997
1605.77
989.6
796.77
194.4
384.3
1998
1719.87
1053.66
823.03
173.93
454.77
1999
1853.65
1122.56
865.87
205.78
491.48
2000
2003.07
1269.58
989.2
204.74
548.2
2001
2175.68
1357.47
1041.96
225.43
660.49
2002
2450.48
1459.65
1114.58
243.75
924.6
2003
2807.41
1515.64
1161.01
271.09
1379.97
2004
3456.7
1822.14
1431.42
305.45
1819.66
2005
4056.76
2117.3
1642.2
358.31
2292.55
2006
4670.53
2372.91
1804.79
417.07
2168.97
2007
5500.25
2793.45
2047.13
499.42
3301.94
2008
6480.31
3279.89
2522.19
573.25
4745.43
2009
7589.22
3545.84
2750.72
671.39
6643.14
2010
9435.36
4489.22
3545.46
807.14
8775
(1)数据的录入过程:
打开SPSS13.0软件,在SPSS的variableview里面的名称改成如下的格式:
然后再回到dataview输入数据可以得到:
(2)数据的保存过程
点击SPSS的文件-保存有如下的界面:
(3)数据的读取
点击文件-打开-数据文件,然后会出现下面的窗口,只要点击你要打开的sav后缀文件:
(4)数据的转化过程:
点击数据-行列转换,将所有的拖到变量中有:
点击确定之后,dataview里就会出现:
(5)数据的增加过程:
在var上右键点击就会出现插入变量,然后在variableview修改名称,
在dataview里输入相应变量的数据这样就增加了一列数据有:
(6)数据的删除过程:
选取某一行,或某一列的数据,右键-清除,例如,清除投资总额的数据,在投资总额上右键,然后点击清除有:
(7)数据集的合并:
观测值合并:
先将需要合并的文件保存
年份
GDP
居民消费
工资总额
1990
428.62
250.02
65.7
1991
479.37
270.89
71.93
1992
572.55
299.37
86.03
1993
723.04
349.29
104.2
1994
948.16
471.91
140.7
点击数据-合并-合并观测值,然后点击你要合并的文件有:
点击打开之后将不配对变量全部拖入新工作数据文件中的变量有:
点击确定之后,数据就合并了,有:
变量的合并:
年份
房地产投资
1998
27.12
1999
33.59
2002
103.36
2003
177.47
2007
435.45
先将其保存至一个文件,然后在江西投资收益表这个文件的数据下打开数据-合并文件-合并变量有
点击打开之后,在已经排序的文件中按关键变量匹配观测量前面打勾,并选取两个文件都是提供观测量,然后将排除变量中的年份移入到关键变量中就有:
点击确定之后出现:
(8)数据的拆分
由于上述数据没有分类,不便于拆分和排序,因此,需要换下面的某大学的成绩数据,其中的性别1为男性,2为女性
某大学基本信息
学号
性别
年龄
成绩
1
2
19
85
2
2
19
64
3
1
18
52
4
2
18
94
5
1
19
68
6
1
21
75
7
2
20
76
8
1
19
77
9
1
18
84
10
1
19
52
11
2
19
45
12
2
20
95
13
1
22
78
14
2
17
63
将这些数据录入到SPSS后,点击数据-拆分文件
根据分组安排输出:
将性别和年龄拖入,点击确定之后有:
(9)数据的排序
对(8)中合并的数据进行成绩排序,操作步骤为:
数据-观测量排序有:
点击确定之后就有:
2下表是某公司销售某产品的销量:
234
159
187
155
172
183
182
177
163
158
143
198
141
167
194
225
177
189
196
203
187
160
214
168
172
178
184
209
176
188
161
152
149
211
196
234
185
189
196
206
150
161
178
168
174
153
186
190
160
171
228
162
223
170
165
179
186
175
197
208
153
163
218
180
175
144
178
191
197
192
166
196
179
171
233
179
187
173
174
210
154
164
215
233
175
188
237
194
198
168
174
226
182
172
190
172
187
189
200
211
156
165
175
210
207
181
205
195
201
172
203
165
196
172
176
182
188
195
202
213
用SPSS得出频数分布的步骤是:
先将这些数据在SPSS中保存为一列的数据,再点击分析-描述统计-频数分布表,然后将销售量拖入到变量中,有:
点击统计:
勾选需要统计量,点击继续之后,点确定有:
Statistics
N
Valid
120
Missing
0
Mean
184.5750
Median
182.0000
Mode
172.00
Std.Deviation
21.68245
Range
96.00
销售量
Frequency
Percent
ValidPercent
CumulativePercent
Valid
141.00
1
.8
.8
.8
143.00
1
.8
.8
1.7
144.00
1
.8
.8
2.5
149.00
1
.8
.8
3.3
150.00
1
.8
.8
4.2
152.00
1
.8
.8
5.0
153.00
2
1.7
1.7
6.7
154.00
1
.8
.8
7.5
155.00
1
.8
.8
8.3
156.00
1
.8
.8
9.2
158.00
1
.8
.8
10.0
159.00
1
.8
.8
10.8
160.00
2
1.7
1.7
12.5
161.00
2
1.7
1.7
14.2
162.00
1
.8
.8
15.0
163.00
2
1.7
1.7
16.7
164.00
1
.8
.8
17.5
165.00
3
2.5
2.5
20.0
166.00
1
.8
.8
20.8
167.00
1
.8
.8
21.7
168.00
3
2.5
2.5
24.2
170.00
1
.8
.8
25.0
171.00
2
1.7
1.7
26.7
172.00
6
5.0
5.0
31.7
173.00
1
.8
.8
32.5
174.00
3
2.5
2.5
35.0
175.00
4
3.3
3.3
38.3
176.00
2
1.7
1.7
40.0
177.00
2
1.7
1.7
41.7
178.00
3
2.5
2.5
44.2
179.00
3
2.5
2.5
46.7
180.00
1
.8
.8
47.5
181.00
1
.8
.8
48.3
182.00
3
2.5
2.5
50.8
183.00
1
.8
.8
51.7
184.00
1
.8
.8
52.5
185.00
1
.8
.8
53.3
186.00
2
1.7
1.7
55.0
187.00
4
3.3
3.3
58.3
188.00
3
2.5
2.5
60.8
189.00
3
2.5
2.5
63.3
190.00
2
1.7
1.7
65.0
191.00
1
.8
.8
65.8
192.00
1
.8
.8
66.7
194.00
2
1.7
1.7
68.3
195.00
2
1.7
1.7
70.0
196.00
5
4.2
4.2
74.2
197.00
2
1.7
1.7
75.8
198.00
2
1.7
1.7
77.5
200.00
1
.8
.8
78.3
201.00
1
.8
.8
79.2
202.00
1
.8
.8
80.0
203.00
2
1.7
1.7
81.7
205.00
1
.8
.8
82.5
206.00
1
.8
.8
83.3
207.00
1
.8
.8
84.2
208.00
1
.8
.8
85.0
209.00
1
.8
.8
85.8
210.00
2
1.7
1.7
87.5
211.00
2
1.7
1.7
89.2
213.00
1
.8
.8
90.0
214.00
1
.8
.8
90.8
215.00
1
.8
.8
91.7
218.00
1
.8
.8
92.5
223.00
1
.8
.8
93.3
225.00
1
.8
.8
94.2
226.00
1
.8
.8
95.0
228.00
1
.8
.8
95.8
233.00
2
1.7
1.7
97.5
234.00
2
1.7
1.7
99.2
237.00
1
.8
.8
100.0
Total
120
100.0
100.0
3基本图表
(1)直方图
可以同时上题画出它的正态分布曲线,只要点击图表,直方图:
结果为:
(2)饼图
对上述的大学生基本信息中的年龄画饼图操作:
点击图表-饼图有:
点击定义之后有:
点击确定之后:
从而可以看出这届19岁的学生为最多。
(3)散点图(SPSS11.5画)
点击图表-散点图有:
点击确定之后有:
再点击确定之后有:
从这个图可以看出学生们的成绩有高有低,直观地显示了每个同学的成绩
4探索性分析
(1)方差分析
单因素方差分析:
为寻求适应本地区的高产量油菜品种,今选了5个不同品种,每一品种在4块试验田上试种,得到在每一块田上的亩产量如下表。
田块/品种
A
B
C
D
E
1
256
244
250
288
206
2
222
300
277
280
212
3
280
290
230
315
220
4
298
275
322
259
212
首先对这种数据进行预处理,在SPSS中如下显示:
点击分析-均值比较-一维方差分析,将产是拖入因变量列,将因子拖入品种内有:
点击确定之后有:
查出表中的数据和上述的F值进行比较可以得出,不同品种的为产量在0.05水平上有显著差异。
双因素方差分析:
下面记录了3位操作工分别在4台不同机器上操作二天的日产量
机器
操作工
甲
乙
丙
1
15
17
19
16
19
21
2
17
17
15
15
21
16
3
15
16
19
15
18
18
4
18
22
15
17
17
17
对它进行双因素方差分析的过程为:
同理对此,SPSS的显示为
从而点击-分析-一般线性模型-单因素双变量方差分析:
点击确定之后有:
通过查表比较F值从而可以看出机器与机器之间无显著差异,操作工与操作工之间有显著差异,操作工*机器有显著差异。
(2)相关分析
下面是某生产公司的基本信息:
电力消耗(千瓦)
温度(华氏)
日产量
12
83
120
11
79
110
13
85
128
9
75
101
14
87
105
10
81
108
12
84
110
11
77
107
14
85
112
11
84
119
对它们进行相关分析有:
在SPSS中点击分析-相关分析-两个变量相关分析有:
点击确定之后有:
从输出的结果来看:
电力消耗和温度在0.01水平上显著相关
电力消耗和日产量之间低度相关
温度和日产量中度相关
(3)回归分析
维尼纶纤维的耐热水性能好坏可以用指标“缩醛化度”来衡量。
这个指标越高,耐热水性能就越好。
而甲醛浓度是影响缩醛化度的重要因素,在生产中常用甲醛浓度去控制这一指标,为此必须找出它们之间关系,现安排了一批试验,获得如下的数据:
甲酫浓度(克/升)
18
20
22
24
26
28
30
缩醛化度(摩尔%)
26.68
28.35
28.75
28.87
29.75
30
30.36
先观察它们之间的关系散点图:
根据上面的操作步骤对它们画散点图有:
从而可以看出基本呈现线性分析,所以对其进行一元线性回归分析,具体操作为
点击分析-回归-线性有:
点击确定之后有:
这个显示的是选取的变量,舍弃的变量,和分析的方法,这里用到的方法是进入的方法进行回归。
这个输出显示了拟合的优度,从R方,我们可以看到,拟合优度可以达到90%,可以看出还是很理想的
这个就是方差分析。
从这个我可以看出它的方程为:
五、案例分析
案例一分析:
某医院护士长对床旁凝血测定仪的应用研究(SPSS19.0中文版)
我很赞成护士长的做法,简单,科学,有说服力。
但是我自己做了一下,发现护士长做的方差分析过程中的输出是明显有误的,这里我主要探讨护士长结果是如何做来的,是怎么运用SPSS得到的,并且指出文章中明显错误的地方,下面是我做的过程:
1、方差分析
将数据录入成这种形势:
APTTPTINR之间的均值比较分析
点击分析-比较均值-单因素anova有:
然后将APPT.PT.INR拖入因变量列表方式拖入因子中
点击两两比较有:
在假定方差齐性中选择LSD在示假定方差齐性中选择Tamhane’sT2
点击继续之后确定有:
多重比较
因变量
(I)方式
(J)方式
均值差(I-J)
标准误
显著性
95%置信区间
下限
上限
APPT
LSD
1.00
2.00
-4.01471*
.96543
.000
-5.9303
-2.0991
3.00
-1.72647
.96543
.077
-3.6421
.1892
2.00
1.00
4.01471*
.96543
.000
2.0991
5.9303
3.00
2.28824*
.96543
.020
.3726
4.2039
3.00
1.00
1.72647
.96543
.077
-.1892
3.6421
2.00
-2.28824*
.96543
.020
-4.2039
-.3726
Tamhane
1.00
2.00
-4.01471*
.91633
.000
-6.2596
-1.7698
3.00
-1.72647
.98923
.236
-4.1512
.6983
2.00
1.00
4.01471*
.91633
.000
1.7698
6.2596
3.00
2.28824
.98890
.070
-.1357
4.7121
3.00
1.00
1.72647
.98923
.236
-.6983
4.1512
2.00
-2.28824
.98890
.070
-4.7121
.1357
PT
LSD
1.00
2.00
-.18235
.36425
.618
-.9051
.5404
3.00
.07647
.36425
.834
-.6463
.7992
2.00
1.00
.18235
.36425
.618
-.5404
.9051
3.00
.25882
.36425
.479
-.4639
.9816
3.00
1.00
-.07647
.36425
.834
-.7992
.6463
2.00
-.25882
.36425
.479
-.9816
.4639
Tamhane
1.00
2.00
-.18235
.37018
.947
-1.0897
.7250
3.00
.07647
.37473
.996
-.8419
.9948
2.00
1.00
.18235
.37018
.947
-.7250
1.0897
3.00
.25882
.34725
.841
-.5919
1.1095
3.00
1.00
-.07647
.37473
.996
-.9948
.8419
2.00
-.25882
.34725
.841
-1.1095
.5919
INR
LSD
1.00
2.00
-.01147
.01879
.543
-.0488
.0258
3.00
.00912
.01879
.629
-.0282
.0464
2.00
1.00
.01147
.01879
.543
-.0258
.0488
3.00
.02059
.01879
.276
-.0167
.0579
3.00
1.00
-.00912
.01879
.629
-.0464
.0282
2.00
-.02059
.01879
.276
-.0579
.0167
Tamhane
1.00
2.00
-.01147
.01820
.897
-.0561
.0331
3.00
.00912
.01880
.949
-.0370
.0552
2.00
1.00
.01147
.01820
.897
-.0331
.0561
3.00
.02059
.01935
.644
-.0268
.0680
3.00
1.00
-.00912
.01880
.949
-.0552
.0370
2.00
-.02059
.01935
.644
-.0680
.0268
*.均值差的显著性水平为0.05。
显然这与文章中的结果不一样,但是明显可以看出文章中的数据采用了38组数据(38*3-1=113)来进行计算,但是给出的数据只有34组(34*3-1=101)。
从上面第一个表中可以看出APTT显著性概率0.00<0.01,表示三各方法所得A数据不具有方差齐性,既不同方法所得APTT有显著差异。
PT显著性概率0.767>0.01,表示三各方法所得A数据具有方差齐性,既不同方法所得PT没有显著差异。
INR显著性概率0.549>0.01,表示三各方法所得A数据具有方差齐性,既不同方法所得INR没有显著差异。
从上面第二个表可以看出
对于APTT(Tamhane值):
静脉血实验室组与静脉血试条组所得APTT均值组合的显著性概率为0.00〈0.01,既两种方法所得的APTT均值有显著性差异,静脉血实验室组与末梢血试条组组合的显著性概率为0.236〉0.01,既两种方法所得的APTT均值无显著性差异,静脉血试条组与末梢血试条组组合的显著性概率为0.07〉0.01,既两种方法所得的APTT均值无显著性差异。
对于PT(LSD)
静脉血实验室组与静脉血试条组的显著性概率为0.618〉0.01,无显著性差异,静脉血实验室组与末梢血试条组的显著性概率为0.834〉0.01,无显著性差异,静脉血