整理logistic回归分析实例操作.docx
《整理logistic回归分析实例操作.docx》由会员分享,可在线阅读,更多相关《整理logistic回归分析实例操作.docx(10页珍藏版)》请在冰点文库上搜索。
整理logistic回归分析实例操作
(完整版)logistic回归分析实例操作
编辑整理:
尊敬的读者朋友们:
这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望((完整版)logistic回归分析实例操作)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为(完整版)logistic回归分析实例操作的全部内容。
(完整版)logistic回归分析实例操作
编辑整理:
张嬗雒老师
尊敬的读者朋友们:
这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布到文库,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是我们任然希望(完整版)logistic回归分析实例操作这篇文档能够给您的工作和学习带来便利.同时我们也真诚的希望收到您的建议和反馈到下面的留言区,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请下载收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为<(完整版)logistic回归分析实例操作〉这篇文档的全部内容.
Logistic回归分析
二分类(因变量Y有(如发病1与未发病0)两种可能出现的结果)资料的Logistic回归分析,至于多分类Logistic回归分析,与二分类操作过程类似,只是在数据编制及分析方法选择处不同。
分析的一般步骤:
变量的编码
哑变量的设置和引入
各个自变量的单因素分析
变量的筛选
交互作用的引入
建立多个模型
选择较优的模型
模型应用条件的评价
输出结果的解释
实例操作
11.1某研究人员在探讨肾细胞癌转移的有关临床病理因素研究中,收集了一批行根治性肾切除术患者的肾癌标本资料,现从中抽取26例资料作为示例进行logistic回归分析.
1。
各变量及其赋值说明
x1:
确诊时患者的年龄(岁)
x2:
肾细胞癌血管内皮生长因子(VEGF),其阳性表述由低到高共3个等级(1—3)
x3:
肾细胞癌组织内微血管数(MVC)
x4:
肾癌细胞核组织学分级,由低到高共4级(1-4)
x5:
肾细胞癌分期,由低到高共4期(1-4)
y:
肾细胞癌转移情况(有转移y=1;无转移y=0)。
为二分类变量.
若作单因素的Logistic回归分析,也就是分别作Y与各自变量间的回归分析,如Y与X1、Y与X2等的单因素Logistic回归分析。
2.建立数据库
3。
分析步骤
(1)
(2)
上图中若为单因素回归分析,只需在Covariates协变量框内导入单一自变量如X1即可。
(3)
4。
分析结果
(1)数据描述
CaseProcessingSummary
UnweightedCasesa
N
Percent
SelectedCases
IncludedinAnalysis
26
100.0
MissingCases
0
.0
Total
26
100.0
UnselectedCases
0
。
0
Total
26
100.0
a。
Ifweightisineffect,seeclassificationtableforthetotalnumberofcases。
DependentVariableEncoding
OriginalValue
InternalValue
无转移
0
转移
1
(2)Block1:
Method=ForwardStepwise(LikelihoodRatio)
OmnibusTestsofModelCoefficients
Chi—square
df
Sig。
Step1
Step
15.538
1
.000
Block
15。
538
1
.000
Model
15。
538
1
。
000
Step2
Step
6.178
1
。
013
Block
21.716
2
。
000
Model
21。
716
2
。
000
表示两步变量的引入均有统计学意义,方法合理。
ModelSummary
Step
-2Loglikelihood
Cox&SnellRSquare
NagelkerkeRSquare
1
18.004a
。
450
。
621
2
11.826b
.566
。
781
a。
Estimationterminatedatiterationnumber6becauseparameterestimateschangedbylessthan.001。
b.Estimationterminatedatiterationnumber7becauseparameterestimateschangedbylessthan。
001.
可见第二步比第一步变量引入后决定系数有所增加,表明第二步变量引入后模型的拟合效果更好.
(3)
ClassificationTablea
Observed
Predicted
肾细胞癌转移情况
PercentageCorrect
无转移
转移
Step1
肾细胞癌转移情况
无转移
15
2
88。
2
转移
2
7
77。
8
OverallPercentage
84.6
Step2
肾细胞癌转移情况
无转移
16
1
94.1
转移
0
9
100.0
OverallPercentage
96.2
a。
Thecutvalueis。
500
VariablesintheEquation
B
S。
E。
Wald
df
Sig.
Exp(B)
95%C。
I.forEXP(B)
Lower
Upper
Step1a
X2
2。
563
。
916
7。
829
1
.005
12。
978
2.155
78。
154
Constant
-6。
256
2。
289
7。
468
1
。
006
。
002
Step2b
X2
2。
413
1。
196
4.072
1
.044
11。
172
1。
072
116.454
X4
2。
096
1.088
3。
713
1
.054
8.136
。
965
68。
623
Constant
-12。
328
5。
431
5.154
1
.023
。
000
a。
Variable(s)enteredonstep1:
X2.
b。
Variable(s)enteredonstep2:
X4.
模型最后引入X2(肾细胞癌血管内皮生长因子(VEGF))和X4(肾癌细胞核组织学分级)两个变量,虽然X4引入后的参数检验显示P=0。
54>0.05且其OR值的95%CI中包括1,但是考虑到其OR=8.136较大,且由上一表可知引入变量X4后,用模型进行预测时的PercentageCorrect从84.6%提高到96.2%,因此综合考虑后还是应将变量X4引入模型。
(4)
VariablesnotintheEquation
Score
df
Sig.
Step1
Variables
X1
。
806
1
。
369
X3
.188
1
.664
X4
6.199
1
。
013
X5
3。
689
1
。
055
OverallStatistics
8.876
4
.064
Step2
Variables
X1
1。
398
1
。
237
X3
.726
1
。
394
X5
1.662
1
.197
OverallStatistics
5.097
3
。
165
可见当其他变量引入模型后的参数检验均无统计学意义。
(5)
由以上第一步和第二步的预测判别结果可见,在(PredictedProbabilityisofMembershipfor转移TheCutValueis.50)中,经第二步后,预测判别发生错误的例数在转移和非转移中均有下降,由此也可以得知引入变量X4是正确且必要的,同上面得出的结论是一致的.