常用统计方法的SPSS过程.docx
《常用统计方法的SPSS过程.docx》由会员分享,可在线阅读,更多相关《常用统计方法的SPSS过程.docx(27页珍藏版)》请在冰点文库上搜索。
常用统计方法的SPSS过程
常用统计方法的SPSS过程
1.统计描述
(1)描述统计量
(用于计量资料)
求①描述统计量,如均数,中位数,标准差,标准误,最大值,最小值,第、25、50、75、百分位数;②求偏度和峰度系数及其标准误;③绘制直方图。
数据格式:
1个反应变量,变量名为“y”。
Analyze
DescriptiveStatistics
Frequencies…
Variable(s):
y
Statistics…(描述统计量)
① PercentileValues(百分位数)
Percentiles:
2.5/25/50/75/(5个百分位点)
CentralTendency(集中趋势)
Mean Median(均数和中位数)
Dispersion离散趋势指标
Std.deviation .mean(标准差和标准误)
② Distribution(分布形态)
Skewness(偏度系数及其标准误)
Kurtosis(峰度系数及其标准误)
③Charts…(绘制统计图)
ChartType
Histogram(直方图)
WithNormalCurve(正态曲线)
(2)几何均数
数据格式:
1个反应变量,变量名为“x”
Transform
Compute…
Targetvariable:
lgx
NumericExpression:
LG10(x)(常用对数变换)
Analyze
DescriptiveStatistics
Descriptives…
Variable(s):
lgx
Savestandardizedvaluesasvariables
Option
Mean Std.deviation .mean
Skewness Kurtosis
将求得的均数再求反常用对数,即几何均数。
另一种方法:
Analyze
Reports
CaseSummaries…
Variable(s):
lgx
Statistics…
GeometricMean
(3)统计图
a.条图
数据格式:
1个分类变量“死因”,1个反应变量“死亡率”
Graphs
Bar
Simple & Valuesofindividualcases
Define
Barsrepresent:
死亡率
CategoryLabels
Variable:
死因
b.圆图与构成比条图
(a)圆图
数据格式:
1个分类变量“死因”,1个反应变量“构成比”
Graphs
Pie
Summariesforgroupsofcases
Define
Othersummeryfunction(Mean)
Variable:
构成比
DefineSlices:
死因(分类变量)
(b)构成比条图
数据格式:
2个分类变量,“肿瘤”和“year”;1个反应变量“构成比”。
Graphs
Bar
Stacked & Summariesforgroupsofcases
Define
Othersummaryfunction(Mean)
Variable:
构成比
CategoryAxis:
year
DefineClustersby:
肿瘤
c.线图
数据格式:
1个时间变量(分类变量)“year”,1个反应变量“rate”。
Graphs
Line
Simple & Summariesforgroupsofcases
Define
Othersummaryfunction(Mean)
Variable:
rate
CategoryAxis:
year
d.直方图
数据格式:
1个频数变量“cases”,1个反应变量“age”
Data
WeightCases
Weightcasesby
FrequencyVariable:
cases
Graphs
Histogram
Variable:
age
Displaynormalcurve
e.箱图
数据格式:
1个分类变量“state”,1个标识变量“city”,1个反应变量“popu”。
Graphs
Boxplot
Simple & Summariesforgroupsofcases
Define
Variable:
popu
Category:
state
LabelCases:
city
f.散点图
数据格式:
2个源变量“so2”和“mort”,1个残差变量“zre_1”
Graphs
Scatter
Simple
Define
YAxis:
zre_1
XAxis:
so2
2.计量资料的统计分析
(1)两样本均数比较的t检验
Analyze
CompareMeans
Independent-SamplesTTest
TestVariable x
GroupingVariable(s) group
(2)配对t检验
Analyze
CompareMeans
Paired-SamplesTTest
PairedVariables x1-x2
(3)样本均数与总体均数
Analyze
CompareMeans
One-SamplesTTest
TestVariable x
TestValue
(4)完全随机设计资料的方差分析
Analyze
GeneralLinearModels…
Univariate…
(1) Dependent:
因变量。
本例选“沉降率”;
FixedFactors:
固定因素。
可选多个因素,本例只有一个因素“抗凝剂”。
(2) Model…
• SpecifyModel
Fullfactorial:
包括所有因素的主效应及所有因素不同水平各种组合的交互效应分析。
系统默认。
Statistics:
自定义模型。
用户根据需要确定交互作用项。
本例选此项,并将“抗凝剂”选入Model框。
• BuildTerms:
分析效应选项。
Interaction:
考虑因素不同水平各种组合的交互效应分析。
Maineffects:
只考虑主效应,不考虑交互效应。
All2-way:
考虑所有2个因素的交互效应。
以下同理。
(3) PostHoc…:
多重比较。
多重比较方法以是否满足方差齐性要求(EqualVariancesAssumed/notAssumed)分为两大类。
(5)随机单位组设计资料的方差分析
Analyze
GenerallinearModels Univariate…;
DependentVariablex
• 选Model…,选Custom,选“批次”、“测量条件”入Model,点BuildTerms并选Maineffects;
• 选Continue,然后点击Ok。
(6)重复测量资料的方差分析
a.单因素
数据格式:
1个标识变量“no”,4个重复测量变量“t0”,“t45”,“t90”,“t145”
Analyze
GeneralLinearModels
RepeatedMeasures…
NumberofLevels:
4→Add→Define
Within-SubjectsVariables(factor1):
t0/t45/t90/t145
Options…
EstimatedMarginalMeans
DisplayMeansfor:
group/factor1/group*factor1
Comparemaineffects
Confidenceintervaladjustment:
LSD(none)
b.多因素
数据格式:
1个分组变量“group”,5个重复测量变量“t0”,“t1”,“t2”,“t3”,“t4”
Analyze
GeneralLinearModels
RepeatedMeasures…
NumberofLevels:
5→Add→Define
Within-SubjectsVariables(factor1):
t0/t1/t2/t3/t4
Between-SubjectsFactor(s):
group
Options…
EstimatedMarginalMeans
DisplayMeansfor:
group/factor1/group*factor1
Comparemaineffects
Confidenceintervaladjustment:
LSD(none)
(7)析因分析
数据格式:
2分组变量“druga”和“drugb”,1个反应变量“y”
Analyze
GenerallinearModels
Univariate…
Dependent:
y
FixedFactor(s):
druga/drugb
Model…
FullFactorial
Includeinterceptinmodel
Options…
Display
Descriptivestatistics
PostHoc…
PostHocTestsfor:
druga/drugb
EqualVariancesAssumed
LSD
Plots…
HorizontalAxis:
druga
SeparateLines:
drugb
(8)二阶段交叉设计资料的方差分析
数据格式:
3分组变量“treat”,“stage”和“block”,1个反应变量“x”
Analyze
GeneralLinearModels
Univariate…
DependentVariable(s):
x
FixedFactor(s):
treat/stage/block
Model…
Custom
Model:
treat/stage/block
3.计数资料的统计分析
(1)样本率与总体率比较
数据格式:
1个分组变量“受孕”,1个频数变量“freq”
Data
WeightCases…
Weightcasesby:
freq
Analyze
NonparametricTest
Binomial…
TestVariableList:
受孕
TestProportion:
(2)两样本率的比较
数据格式:
2个分类变量,“肿瘤类型”和“淋巴转移”;1个频数变量“freq”
Data
WeightCases…
Weightcasesby:
freq
Analyze
DescriptiveStatistics
Crosstabs…
Row(s):
肿瘤类型
Column(s):
淋巴转移
Statistics… Chi-square
Cells Row
配对计数资料比较(McNemar检验)
数据格式:
2个分类变量,“免疫荧光”和“乳胶凝集”;1个频数变量“freq”
Data
WeightCases…
Weightcasesby:
freq
Analyze
DescriptiveStatistics
Crosstabs…
Row(s):
免疫荧光
Column(s):
乳胶凝集
Statistics… McNemar
(4)多个样本率比较的χ2检验
数据格式:
2个分类变量,“检测方法”和“检测结果”;1个频数变量“freq”
Data
WeightCases…
Weightcasesby:
freq
Analyze
DescriptiveStatistics
Crosstabs…
Row(s):
检测方法
Column(s):
检测结果
Statistics… Chi-square
Cells Row
4.非参数统计分析
(1)配对计量资料比较的秩和检验
数据格式:
2个反应变量分别为“原法”和“新法”
Analyze
NonparametricTests
2RelatedSamples…
TestPair(s)List:
原法—新法
TestType:
Wilcoxon
(2)两独立样本比较的秩和检验
数据格式:
1个分组变量“group”,1个反应变量“r1值”
Analyze
NonparametricTests
2IndependentSamples…
TestVariableList:
r1值
GroupingVariable:
group
TestType:
Mann-WhitneyU
(3)两组等级资料比较的秩和检验
数据格式:
1个分组变量“group”,1个反应变量“含量”,1个频数变量“freq”
Data
WeightCases…
Weightcasesby:
freq
Analyze
NonparametricTests
2IndependentSamples…
TestVariableList:
含量
GroupingVariable:
group
TestType:
Mann-WhitneyU
(4)多个独立样本比较的秩和检验
数据格式:
1个分组变量“药物”,1个反应变量“死亡率”
Analyze
NonparametricTests
KIndependentSamples…
TestVariableList:
死亡率
GroupingVariable:
药物
TestType:
KruskalWallisH
(5)多组等级资料比较的秩和检验
数据格式:
1个分组变量“疾病”,1个反应变量“白细胞”,1个频数变量“freq”
Data
WeightCases…
Weightcasesby:
freq
Analyze
NonparametricTests
2IndependentSamples…
TestVariableList:
白细胞
GroupingVariable:
疾病
TestType:
KruskalWallisH
(6)随机单位组设计资料的秩和检验
数据格式:
4个反应变量分别为“频率a”,“频率b”,“频率c”和“频率d”
Analyze
NonparametricTests
KRelatedSamples…
TestVariables:
频率a频率b/频率c/频率d
TestType:
Friedman
5.多元统计分析
(1)直线回归分析
数据格式:
1个分组变量“g”,1个自变量“x”,个因变量“y”(将两组拆分,分别做回归分析)
Data
SplitFiles
Organizeoutputbygroups
GroupsBasedon:
g)
Analyze
Regression
Linear…
Dependent:
y
Independent(s):
x
(2) 直线相关分析
数据格式:
2个列变量分别为“x”和“y”
Analyze
Correlate
Bivariate…
Variables:
x/y
CorrelationCoefficients
Pearson Spearman
(3)曲线拟合
先变换(以常用对数变换为例),然后按
(一)直线回归分析处理
Transform
Compute…
TargetVariable:
x
NumericExpression:
LG10(x)
Type&Label…
Useexpressionaslabel
Analyze
Regression
Linear…
Dependent:
y
Independent(s):
x
(4)多重回归分析
a.所有变量放入放入模型
数据格式:
3个列变量
Analyze
Regression
Linear…
Dependent:
diam
Independent(s):
temp/time
Method:
Enter
Statistics…
Estimates
Confidenceinterval
Modelfit
Descriptives
b.逐步回归
数据格式:
3个列变量
Analyze
Regression
Linear…
Dependent:
y
Independent(s):
x1/x2/x3/x4/x5/x6
Method:
Stepwise/Backward(前进/后退法)
Statistics…
Estimates
Confidenceinterval
Modelfit
Descriptives
(5)协方差分析
数据格式:
1个分组变量“treat”,1个反应变量“post”,1个协变量“pre”
Analyze
GeneralLinearModels
Univariate…
DependentVariable(s):
post
FixedFactor(s):
treat
Covariate(s):
pre
Options…
Descriptivestatistics
(6)判别分析
数据格式:
1个分类变量“group”,3个自变量
Analyze
Classify
Discriminant…
GroupingVariable:
group(1/2)
Independents:
x1/x2/x3
Enterindependentstogether
Statistics…
Fisher's
Unstandardized
Classify…
PriorProbabilities
Computefromgroupsize
Display
Casewiseresults
Summarytable
Save…
Predictedgroupmembership
Discriminantscores
(7)聚类分析
a. 样品聚类
数据格式:
10列数据,其中1个标识变量“no”
Analyze
Classify
HierarchicalCluster…
Variable(s):
x1~x9
Cluster
Cases
Display
Statistics/Plots
Statistics…
Agglomerationschedule
Plots…
Dendrogram
Allclusters
Vertical
Method…
Cluster:
Between-groupslinkage
Measure:
Interval:
SquaredEuclideandistance
Save…
Clustermembership
Singlesolution:
2 Clusters
b. 指标聚类
将9个变量聚类
Analyze
Classify
HierarchicalCluster…
Variable(s):
x1~x9
Cluster
Variables
Display
Statistics/Plots
Plots…
Dendrogram
Allclusters
Vertical
Method…
Cluster:
Between-groupslinkage
Measure:
Interval:
SquaredEuclideandistance
(8)主成分分析
数据格式:
3个列变量
Analyze
DataReduction
Factor…
Variables:
sgpt/f/znt/afp
Descriptives…
KMOandBartlett'stestofsphericity
(9)因子分析
数据格式:
10个列变量,其中1个为标识变量“t”
Analyze
DataReduction
Factor…
Variables:
x1~x9
Descriptives…
Initialsolution
KMOandBartlett'stestofsphericity