SPSS实验指导.docx
《SPSS实验指导.docx》由会员分享,可在线阅读,更多相关《SPSS实验指导.docx(54页珍藏版)》请在冰点文库上搜索。
SPSS实验指导
1.《统计分析与SPSS的应用》大纲
2.实验一SPSS的数据管理
3.实验二描述性统计分析
4.实验三均值检验
5.实验四方差分析
6.实验五聚类分析和判别分析
7.实验六因子分析和主成分分析
8.实验七相关分析和回归分析
9.实验八非参数检验
10.实验九绘制统计图
11.实习报告书写格式
实验一SPSS的数据管理
一、实验目的
熟悉SPSS的菜单和窗口界面及SPSS的数据管理功能。
二、实验内容及步骤
(一)SPSS的数据输入
实验内容:
数据文件建立、变量定义和数据录入;数据库查询导入;3.文本向导导入。
实验步骤:
1.数据文件建立、变量定义和数据录入
a)选择菜单“File→New→Data”,进入数据编辑窗口:
.
b)单击标签栏中的“VariableViewer”,即切换到变量视窗。
在该窗口定义变量。
c)单击标签栏中的“DataViewer”,即切换到数据视窗。
在该窗口输入数据。
2.数据库查询导入
a)选择菜单“File→OpenDatabase→NewQuery”,在弹出的数据库查询中选择数据源(DataSource);
b)单击“下一步”,在弹出的窗口中输入数据库文件存放路径;
c)单击“OK”,在弹出的窗口中选择数据表及字段;
d)单击“下一步”,如选择两个或多个表,则在弹出的窗口中设置表间的连接;否则,在弹出的窗口中设置检索条件;
e)单击“下一步”,在弹出的窗口中可以重新定义变量;
f)单击“下一步”,在弹出的窗口中可以看到生成的SQL语句,可以将其保存以供下次使用;
g)单击“完成”,即完成了数据库查询导入操作。
3.文本向导导入
a)选择菜单“File-ReadTextData”or“File-Open-Data…”,选中文件以后,在弹出窗口的窗口中设置文本文件和预定义格式;
b)单击“下一步”,在弹出的窗口中设置变量;
c)单击“下一步”,在弹出的窗口中设置记录的导入和存储条件;
d)单击“下一步”,在弹出的窗口中选择文本文件中的分隔符;
e)单击“下一步”,在弹出的窗口中更改变量名和变量类型;
f)单击“下一步”,在弹出的窗口中可以保存文件读入格式设置;
g)单击“完成”,即完成了文本文件的导入。
上机练习:
建立学生成绩的数据文件stu.sav,变量有:
学生姓名,学号,数学成绩,语文成绩,英语成绩。
并输入10条记录。
(二)SPSS的数据编辑整理
实验内容:
数据的增删;变量重新赋值;数据的运算与新变量的生成;数据排序;数据的行列互换。
实验步骤:
1.数据的增删
插入新变量、插入一行、插入单元格、删除变量、删除一行、删除单元格,这些操作均可通过菜单“Edit”或“Data”完成,或通过鼠标键盘完成,其操作类似于Excel。
2.变量重新赋值
1)对自身变量重新赋值
a)选择菜单“Transform→Recode→intoSameVariables”,在弹出窗口的变量名列中选1个或多个变量点击钮使之进入NumericVariables框;
b)点击“OldandNewValues...”钮弹出“RecodeintoSameVariables:
OldandNewValue”对话框,用户根据实际情况确定旧值和新值,点击Continue钮返回,再点击OK钮即可。
上机练习:
将学生成绩的数据文件stu.sav中数学成绩的百分制转化为五分制。
2)对其他变量赋值
a)选择菜单“Transform→Recode→intoDifferentVariables”,在弹出窗口的变量名列中选1个或多个变量点击钮使之进入NumericVariables框;
b)在”OutputVariable”框确定一赋值变量(可以是数据管理器中已有的变量,也可以是用户要求生成的新变量);
c)点击“OldandNewValues...”钮弹出“RecodeintoDifferentVariables:
OldandNewValue”对话框,用户根据实际情况确定旧值和新值,点击Continue钮返回,再点击OK钮即可。
上机练习:
将学生成绩的数据文件stu.sav中语文成绩的百分制转化为五分制后并赋值给新变量NewChinese。
3)数据的运算与新变量的生成
a)选择菜单“Transform→Compute...”,弹出的ComputeVariable对话框,在”TargetVariable”中指定一个变量(可以是数据管理器中已有的变量,也可是用户欲生成的新变量);
b)点击“Type&Label...”钮确定是数值型变量,还是字符型变量,或加上变量标签;
c)在“NumericExpression”框中键入运算公式,系统提供计算器和82种函数(在Functions框内)让用户使用;
d)点击If...钮会弹出“ComputeVariable:
IfCases”对话框,用户可指定符合条件的变量参与运算。
可忽略此项。
上机练习:
将学生成绩的数据文件stu.sav中成绩汇总并赋值给新变量TotalScore。
4)数据排序
a)选择菜单“Data→SortCases...”,弹出SortCases...对话框,在变量名列框中选1个需要按其数值大小排序的变量(用户也可选多个变量,系统将按变量选择的先后逐级依次排序);
b)点击钮使选中变量进入Sortby框,在SortOrder框中确定是按升序(Ascending,从小到大)或降序(Descending,从大到小),点击OK钮即可。
上机练习:
将学生成绩的数据文件stu.sav按照学号升序排列。
5)数据的行列互换
a)选择菜单“Data→Transpose...”,弹出Transpose...对话框,在变量名列框中选1个或多个需要转换的变量,点击钮使之进入Variable(s)框;
b)选择某个变量到“NameVariable”编辑框中,作为给新的列变量命名的依据,再点击OK钮即可。
若要将数据再转换回原来的排列方式,方法与上述过程相同。
实验二描述性统计分析
一、实验目的
学习利用SPSS进行描述性统计分析。
二、实验内容及实验步骤
(一)频数分析(Frequencies过程)
实验内容:
调查100名健康女大学生的血清总蛋白含量(g%)如下表,试作频数分析。
7.437.886.887.807.048.056.977.127.358.05
7.957.567.507.887.207.207.207.437.127.20
7.507.357.887.437.586.507.437.126.976.80
7.357.507.206.437.588.036.977.437.357.35
7.587.586.887.657.047.128.127.507.046.80
7.047.207.657.437.657.766.737.207.507.43
7.357.957.357.476.507.658.167.547.277.27
6.727.657.277.047.726.886.736.736.737.27
7.587.357.507.277.357.357.278.167.037.43
7.357.957.047.657.277.728.437.507.657.04
实验步骤:
1.建立数据文件。
定义血清总蛋白含量的变量名为X,然后输入血清总蛋白含量的原始数据.
2.选择菜单“Analyze→DescriptiveStatistics→Frequencies”,弹出“Frequencies”对话框。
在对话框左侧的变量列表中选择变量x,使之进入“Variable(s)”框。
选中复选框“Displayfrequencytables”,输出变量的频数分布表。
3.单击“Statistics”按钮,弹出“Frequencies:
Statistics”对话框,选择四分位数(Quartiles)、均数(Mean)、中位数(Median)、众数(Mode)、总和(Sum)、标准差(Std.deviation)、方差(Variance)、全距(Range)、最小值(Minimum)、最大值(Maximum)、标准误(S.E.mean)、偏度系数(Skewness)和峰度系数(Kurtosis),单击“Continue”按钮返回。
4.单击“Charts”钮,弹出“Frequencies:
Charts”对话框。
选择“Histograms”及“NormalCurve”,对变量x绘制直方图,并绘制正态曲线。
单击“Continue”按钮返回。
5.单击“OK”按钮,得到输出结果。
(二)描述性分析(Descriptives过程)
实验内容:
调查20名男婴的出生体重(克)资料如下,试作描述性统计。
2770291527952995286029703087312631254654
2272350334183921266942183707231025733881
实验步骤:
1.建立数据文件。
激活数据管理窗口,定义男婴出生体重的变量名为X,然后输入男婴出生体重的原始数据。
2.选择菜单“Analyze→DescriptiveStatistics→Descriptives”,弹出“Descriptives”对话框。
在对话框左侧的变量列表中选x,进入“Variable(s)”框。
并选中“Savestandardizedvalueasvariables”项。
3.单击“OK”按钮,得到输出结果。
(三)探索分析(Explore过程)
实验内容:
下表为30名10岁少儿的身高(cm)资料,试作探索性分析。
编号
身高
编号
身高
男孩
女孩
男孩
女孩
1
2
3
4
5
6
7
8
121.4
131.5
132.6
129.2
134.1
135.8
140.4
136.0
133.4
132.7
130.1
136.7
139.7
133.0
140.3
124.0
9
10
11
12
13
14
15
128.2
137.4
135.5
129.0
132.2
140.9
129.3
125.4
137.5
120.9
138.8
138.6
141.4
137.5
实验步骤:
1.建立数据文件。
定义少儿身高的变量名为Height,然后再定义一个变量为SEX,用于作性别分组。
顺序输入少儿身高的原始数据,在变量SEX中,男孩输入1、女孩输入2,并设置其值标签。
2.选择菜单“Analyze→DescriptiveStatistics→Explore”,弹出“Explore”对话框。
现欲对少儿身高资料进行分组的探索性分析,故在对话框左侧的变量列表中选x,使之进入DependentList框,再选变量sex,使之进入FactorList框。
3.单击“Statistics”按钮,弹出“Explore:
Statistics”对话框,选中Descriptives、M-estimators、Outliers、Percentiles以及GroupedFrequencytables。
单击“Continue”按钮返回“Explore”对话框。
4.点击“Plot”按钮弹出“Explore:
Plot”对话框,在Boxplot栏内选“Factorlevelstogether”,按组别进行箱图绘制;在“Descriptive”栏内选“Stem-and-leaf”,作茎叶情形描述。
单击“Continue”按钮返回“Explore”对话框。
5.单击“OK”按钮,得到输出结果。
(四)交叉列联表分析(Crosstabs过程)
实验内容:
用两组大白鼠诱发鼻咽癌的动物实验中,一组单纯用亚硝胺鼻注,另一组附加维生素B12,生癌率如下表,问两组生癌率有无差别?
动物分组
生癌鼠数
未生癌鼠数
合计
生癌率(%)
亚硝胺组
亚硝胺+B12组
52
39
19
3
71
42
73.2
92.9
合计
91
22
113
80.5
实验步骤:
1.建立数据文件。
定义变量名:
count为频数变量(行列对应的频数值),group为组变量(行),test为试验结果变量(列)。
按顺序输入相应的数据。
2.在进行计数资料的分析前,应对频数变量的值进行加权处理。
选择菜单“Data→WeightCases”,弹出“WeightCases”对话框,选“Weightcasesby”,再选变量count,使之进入“FrequencyVariable”框中,单击“OK”按钮完成加权。
3.选择菜单“Analyze→DescriptiveStatistics→Crosstabs”,弹出“Crosstabs”对话框。
在“Crosstabs”对话框中,选择变量group,使之进入“Row(s)”框,选择变量test,使之进入“Column(s)”框。
4.单击“Statistics”按钮,弹出“Crosstabs:
Statistics”对话框,选择“Chi-square”(卡方检验)。
5.单击“Cells”按钮,弹出“Crosstabs:
CellsDisplay”对话框,定义列联表单元格中需要计算的指标。
“Observed”为实际观察数,“Expected”为理论数,“Row”为行百分数,“Column”为列百分数,“Total”为合计百分数,“Unstandardized”为实际数与理论数的差值,“Standardized”为实际数与理论数的差值除理论数,“AdjustedStandardized”为由标准误确立的单元格残差。
设置完成后单击“Continue”按钮返回“Crosstabs”对话框。
6.单击“OK”按钮,得到输出结果。
实验三均值检验
一、实验目的
学习利用SPSS进行单样本、两独立样本以及成对样本的均值检验。
二、实验内容及步骤
(一)描述统计(Means过程)
实验内容:
某医师测得血红蛋白值(g%)如表3.1,试利用Means过程作基本的描述性
统计分析。
表3.1
对象
编号
性别
年龄
血红蛋白值
对象
编号
性别
年龄
血红蛋白值
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
女
男
女
女
男
男
女
男
女
女
男
男
男
女
女
女
男
男
女
男
18
16
18
17
16
18
16
18
18
17
18
18
16
17
17
17
17
16
16
18
12.83
15.50
12.25
10.06
10.88
9.65
8.36
11.66
8.54
7.78
13.66
10.57
12.56
9.87
8.99
11.35
14.56
12.40
8.05
14.03
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
女
男
男
女
女
女
女
男
男
男
男
女
女
女
男
男
男
男
女
男
16
16
18
18
17
18
17
16
16
18
16
16
18
18
18
18
17
17
16
16
11.36
12.78
15.09
8.67
8.56
12.56
11.56
14.67
7.88
12.35
13.65
9.87
10.09
12.55
16.04
13.78
11.67
10.98
8.78
11.35
实验步骤:
1.建立数据文件。
定义4个变量:
ID、Gender、Age和HB,分别表示编号、性别、年龄和血红蛋白值。
2.选择菜单“Analyze→CompareMeans→Means”,弹出“Means”对话框。
在对话框左侧的变量列表中,选择变量“血红蛋白值”进入“DependentList”列表框,选择变量“性别”进入“IndependentList”,单击“Next”按钮,选择变量“年龄”进入“IndependentList”。
3.单击“Options”按钮,在弹出的“选择描述统计量”对话框中设置输出的描述统计量。
4.单击“OK”按钮,得到输出结果。
(二)单样本T检验(One-SampleTTest过程)
实验内容:
某地区10年测得16-18岁人口的平均血红蛋白值为10.25。
现在抽查测量了该地区40个16-18岁人口的血红蛋白如表1,试分析该地区现在16-18岁人口的血红蛋白与10年前相比,是否有显著的差异?
实验步骤:
1.打开数据文件。
2.选择菜单“Analyze→CompareMeans→One-SampleTTest”。
弹出“One-SampleTTest”对话框。
3.在对话框左侧的变量列表中选择变量“血红蛋白”进入“TestVariable(s)”框;在“TestValue”编辑框中输入过去的平均血红蛋白值10.25.
4.单击“OK”按钮,得到输出结果。
(三)双样本T检验(Independent-SamplesTTest过程)
实验内容:
分别测得14例老年性慢性支气管炎病人及11例健康人的尿中17酮类固醇排出量(mg/dl)如下,试比较两组均数有无差别。
病人
2.905.415.484.604.035.104.974.244.362.722.372.097.105.92
健康人
5.188.793.146.463.726.645.604.577.714.994.01
实验步骤:
1.建立数据文件。
定义变量名:
把实际观察值定义为x,再定义一个变量group来区分病人与健康人。
输入原始数据,在变量group中,病人输入1,健康人输入2。
2.选择菜单“Analyze→CompareMeans→Independent-samplesTTest”项,弹出“Independent-samplesTTest”对话框。
从对话框左侧的变量列表中选x,进入“TestVariable(s)”框,选择变量“group”,进入“GroupingVariable”框,点击“DefineGroups”钮弹出“DefineGroups”定义框,在Group1中输入1,在Group2中输入2。
3.单击“OK”按钮,得到输出结果。
(四)成对样本T检验(Paired-SamplesTTest过程)
实验内容:
某单位研究饲料中缺乏维生素E与肝中维生素A含量的关系,将大白鼠按性别、体重等配为8对,每对中两只大白鼠分别喂给正常饲料和维生素E缺乏饲料,一段时期后将之宰杀,测定其肝中维生素A含量(mol/L)如下,问饲料中缺乏维生素E对鼠肝中维生素A含量有无影响?
大白鼠对别
肝中维生素A含量(mol/L)
正常饲料组
维生素E缺乏饲料组
1
2
3
4
5
6
7
8
37.2
20.9
31.4
41.4
39.8
39.3
36.1
31.9
25.7
25.1
18.8
33.5
34.0
28.3
26.2
18.3
实验步骤:
1.建立数据文件。
定义变量名:
正常饲料组测定值为x1,维生素E缺乏饲料组测定值为x2,输入原始数据。
2.选择菜单“Analyze→CompareMeans→Paired-samplesTTest”项,弹出“Paired-samplesTTest”对话框。
从对话框左侧的变量列表中选择变量x1、x2进入Variables框。
3.单击“OK”按钮,得到输出结果。
实验四方差分析
一、实验目的
学习利用SPSS进行单因素方差分析、多因素方差分析和协方差分析。
二、实验内容及步骤
(一)单因素方差分析(One-WayANOVA过程)
实验内容:
某城市从4个排污口取水,进行某种处理后检测大肠杆菌数量,单位面积内菌落数如下表所示,请分析各个排污口的大肠杆菌数量是否有差别。
排污口
1
2
3
4
大肠杆菌数量
9,12,7,5
20,14,18,12
12,7,6,10
23,13,16,21
实验步骤:
1.建立数据文件。
定义变量名:
编号、大肠杆菌数量和排污口的变量名分别为x1、x2、x3,之后输入原始数据。
2.选择菜单“Analyze→CompareMeans→One-wayANOVA”,弹出单因素方差分析对话框。
从对话框左侧的变量列表中选择变量”大肠杆菌数量”,使之进入“DependentList”列表框;选择“排污口”进入“Factor”框。
3.选择进行各组间两两比较的方法。
单击“PostHoc”,弹出“One-WayANOVA:
PostHocMultipleComparisons”。
在“EqualVariancesAssumed”复选框组中选择LSD.
4.定义相关统计选项以及缺失值处理方法。
单击“Options”按钮,弹出“One-WayANOVA:
Options”对话框。
在“Statistics”复选框组选择Descriptive和Homogeneity-of-variance.同时选中“Meansplot”复选框。
5.单击“OK”按钮,执行单因素方差分析,得到输出结果。
(二)多因素方差分析(Univariate过程)
实验内容:
某城市从4个排污口取水,经两种不同方法处理后,检测大肠杆菌数量,单位面积内大肠杆菌数量如下表所示,请检验它们是否有差别。
排污口
1
2
3
4
处理方法1
9,12,7,5
20,14,18,12
12,7,6,10
23,13,16,21
处理方法2
13,7,10,8
17,10,9,15
11,5,7,6
18,14,19,11
实验步骤:
1.建立数据文件。
定义变量名:
编号、大肠杆菌数量、处理方法和排污口的变量名分别为x1、x2、x3和x4,之后输入原始数据。
2.选择菜单“Analyze→GeneralLinearModel→Univariate”,弹出“多因素方差分析”对话框。
在对话框左侧的变量列表中选择变量“大肠杆菌数量”进入“D