1、 Beginning BlockClassification Tablea,bObservedPredicted是否购买Percentage Correct不购买购买Step 0269100.0162.0Overall Percentage62.4a. Constant is included in the model.b. The cut value is .500上表显示了Logistic分析初始阶段(第零步)方程中只有常数项时的错判矩阵。可以看到:269人中实际没购买且模型预测正确,正确率为100;162人中实际购买了但模型均预测错误,正确率为0%。模型总的预测正确率为62.4。消费的二
2、项Logistic分析结果(三)(强制进入策略)Variables in the EquationBS.E.WalddfSig.Exp(B)Constant-.507.09926.0021.602上表显示了方程中只有常数项时的回归系数方面的指标,各数据项的含义依次为回归系数,回归系数标准误差,Wald检验统计量的观测值,自由度,Wald检验统计量的概率p值,发生比。由于此时模型中未包含任何解释变量,因此该表没有实际意义。消费的二项Logistic分析结果(四)(强制进入策略)Variables not in the EquationScoreVariablesage1.268.260gende
3、r(1)4.667.031income10.6402.005income(1)2.935.087income(2).001Overall Statistics18.2734上表显示了待进入方程的各个变量的情况,各数据项的含义依次为Score检验统计量的观测值,自由度和概率p值。可以看到,如果下一步Age进入方程,则Score检验统计量的观测值为1.268,概率p值为0.26。如果显著性水平a为0.05,由于Age的概率p值大于显著性水平a,所以是不能进入方程的。但在这里,由于解释变量的筛选策略为Enter,所以这些变量也被强行进入方程。消费的二项Logistic分析结果(五)(强制进入策略)B
4、lock 1: Method = EnterOmnibus Tests of Model CoefficientsChi-squareStep 1Step18.441BlockModel上表显示了Logistic分析第一步时回归方程显著性检验的总体情况,各数据项的含义依次为似然比卡方的观测值,自由度和概率p值。可以看到,在本步所选变量均进入方程(Method=Enter)。与前一步相比,似然比卡方检验的观测值18.441,概率p值为0.001。如果显著性水平a为0.05,由于概率p值小于显著性水平a,应拒绝零假设,认为所有回归系数不同时为0,解释变量的全体与Logit P之间的线性关系显著,采
5、用该模型是合理的。在这里分别输出了三行似然比卡方值。其中,Step行是本步与前一步相比的似然卡方比;Block行是本块(Block)与前一块相比的似然卡方比;Model行是本模型与前一模型相比的似然卡方比。在本例中,由于没有设置解释变量块,且解释变量是一次性强制进入模型,所以三行结果都相同。消费的二项Logistic分析结果(六)(强制进入策略)Model Summary-2 Log likelihoodCox & Snell R SquareNagelkerke R Square552.208a.042.057a. Estimation terminated at iteration num
6、ber 4 because parameter estimates changed by less than .001.上表显示了当前模型拟合优度方面的指标,各数据项的含义依次为-2倍的对数似然函数值,Cox&SnellR2。-2倍的对数似然函数值越小则模型的拟合优度越高。这里该值较大,所以模型的拟合优度并不理想。从NagelkerkeR2也可以看到其值接近零,因此拟合优度比较低。消费的二项Logistic分析结果(七)(强制进入策略)Classification Tablea2363387.71313119.161.9a. The cut value is .500上表显示了当前所得模型的错
7、判矩阵。可以看到,脚注中的The Cut value is .500意味着:如果预测概率值大于0.5,则认为被解释变量的分类预测值为1,如果小于0.5,则认为被解释变量的分类预测值为0.;在实际没购买的269人中,模型正确识别了236人,识别错误了131人,正确率为19.1%。模型总的预测正确率为61.9%。与前一步相比,对未购买的预测准确度下降了,对购买的预测准确度上升了,但总体预测精度仍下降了。因此模型预测效果并不十分理想。消费的二项Logistic分析结果(八)(强制进入策略)Step 1a.025.0181.974.1601.026.511.2095.954.0151.66712.30
8、5.002.101.263.146.7031.106.787.2539.6762.196-2.112.7547.843.121a. Variable(s) entered on step 1: age, gender, income.上表显示了当前所得模型中各个回归系数方面的指标。可以看出,如果显著性水平a为0.05,由于Age的Wald检验概率p值大于显著性水平a,不应拒绝零假设,认为该回归系数与0无显著差异,它与Logit P的线性关系是不显著的,不应保留在方程中。由于方程中包含了不显著的解释变量,因此该模型是不可用的,应重新建模。下面是对模型做进一步分析,解释变量的筛选采用基于极大似然估
9、计的逐步筛选策略(Forward:LR),分析的具体操作以及结果如下:(二)基本操作:(2)选择是否购买作为被解释变量到Dependent框中,选其余各变量为解释变量到Covariates框中,采用Forward:LR方法,在Option框中对模型做近一步分析,结果如下:消费的二项Logistic分析结果(一)(逐步筛选策略) Method = Forward Stepwise (Likelihood Ratio)10.543Step 25.91716.4593消费的二项Logistic分析结果(二)(逐步筛选策略)Model if Term RemovedVariableModel Log
10、LikelihoodChange in -2 Log LikelihoodSig. of the Change-285.325gender-280.053-282.97611.761.003上面第一个表显示了变量逐步筛选过程中对数似然比卡方检验的结果,用于回归方程的显著性检验。这里略去了第零步分析的结果。结果上面的两个表共同分析。在Step1中,模型中包含常数项和INCOME。如果此时剔除INCOME将使-2LL减少10.543,即10.543是INCOME进入模型引起的,-285.325即为零模型的对数似然比;在Step2中,模型中包含常数项,INCOME,GENDER。此时剔除GENDER
11、,即-2LL将减少5.917,即5.917是在Step1基础上GENDER所引起的,-280.053即为Step1模型的对数似然比,此时-2*285.325+2*280.053=10.543,即INCOME引起的。其他同理。可以看到,如果显著性水平a为0.05,由于各步的概率p值均小于显著性水平a,因此此时模型中的解释变量全体与Logit P的线性关系是显著,模型合理。消费的二项Logistic分析结果(三)(逐步筛选策略)95.0% C.I.for EXP(B)LowerUpper10.512.006.259.9821.006.6061.670.672.2477.4241.9581.2083
12、.174-.762.18716.634.467Step 2b.5045.824.0161.6561.0992.49311.669.096.134.7141.101.6581.843.761.2519.1472.1391.3073.502-1.113.24021.432.329 income.b. Variable(s) entered on step 2: gender.上表显示了解释变量筛选的过程和各解释变量的回归系数检验结果。可以看到,最终的模型(第二步)中包含了性别和收入变量,各自回归系数显著性检验的Wald观测值对应的概率p值都小于显著性水平a,因此均拒绝零假设,意味它们与Logit
13、P的线性关系是显著,应保留在方程中。表中的第七,第八列分别是发生比的95%的置信区间。最终年龄变量没有引入方程,因为如果引入则相应的Score检验的概率p值大于显著性水平a,不应拒绝零假设,它与Logit P的线性关系不显著,不应进入方程。具体结果如下:消费的二项Logistic分析结果(四)(逐步筛选策略)1.848.1745.8657.824.0201.984.159消费的二项Logistic分析结果(五)(逐步筛选策略)560.107a.024.033554.190b.037.051a. Estimation terminated at iteration number 3 becaus
14、e parameter estimates changed by less than .001.b. Estimation terminated at iteration number 4 because parameter estimates changed by less than .001.上表显示了模型拟合优度方面的测度指标。最终模型的-2倍的对数似然函数值为554.190,仍然较高,说明模型的拟合优度不甚理想。同时,NagelkerkeR2距1较远,也说明了模型的拟合优度不高。消费的二项Logistic分析结果(六)(逐步筛选策略)Hosmer and Lemeshow Test8.
15、943.063消费的二项Logistic分析结果(七)(逐步筛选策略)Contingency Table for Hosmer and Lemeshow Test是否购买 = 不购买是否购买 = 购买TotalExpected9090.0004242.0009898.0004646.0008181.0007474.0003532.363810.637435853.6021519.398735557.6373431.363894044.39826.6027153744.0353830.9657564436.9653643.03580上面是Hosmer-Lemeshow检验的结果。最终模型中,Hosmer-Lemeshow统计量的观测值为8.943,概率p值为0.063,大于显著性水平a,因此不应拒绝零假设,认为该组的划分与被解释变量的取值不相关,说明模型的拟合优度较低。它与NagelkerkeR2分析的结果是一致的。消费的二项Logistic分析结果(八)(逐步筛选策略)22583.612622.260.6Stepnumber:ObservedGroupsandPredictedProbabilities160FR120EQU180NC0Y40Prob:.1
copyright@ 2008-2023 冰点文库 网站版权所有
经营许可证编号:鄂ICP备19020893号-2