SPSS线性回归分析.ppt

上传人:wj 文档编号:17683745 上传时间:2023-07-30 格式:PPT 页数:55 大小:1.87MB
下载 相关 举报
SPSS线性回归分析.ppt_第1页
第1页 / 共55页
SPSS线性回归分析.ppt_第2页
第2页 / 共55页
SPSS线性回归分析.ppt_第3页
第3页 / 共55页
SPSS线性回归分析.ppt_第4页
第4页 / 共55页
SPSS线性回归分析.ppt_第5页
第5页 / 共55页
SPSS线性回归分析.ppt_第6页
第6页 / 共55页
SPSS线性回归分析.ppt_第7页
第7页 / 共55页
SPSS线性回归分析.ppt_第8页
第8页 / 共55页
SPSS线性回归分析.ppt_第9页
第9页 / 共55页
SPSS线性回归分析.ppt_第10页
第10页 / 共55页
SPSS线性回归分析.ppt_第11页
第11页 / 共55页
SPSS线性回归分析.ppt_第12页
第12页 / 共55页
SPSS线性回归分析.ppt_第13页
第13页 / 共55页
SPSS线性回归分析.ppt_第14页
第14页 / 共55页
SPSS线性回归分析.ppt_第15页
第15页 / 共55页
SPSS线性回归分析.ppt_第16页
第16页 / 共55页
SPSS线性回归分析.ppt_第17页
第17页 / 共55页
SPSS线性回归分析.ppt_第18页
第18页 / 共55页
SPSS线性回归分析.ppt_第19页
第19页 / 共55页
SPSS线性回归分析.ppt_第20页
第20页 / 共55页
亲,该文档总共55页,到这儿已超出免费预览范围,如果喜欢就下载吧!
下载资源
资源描述

SPSS线性回归分析.ppt

《SPSS线性回归分析.ppt》由会员分享,可在线阅读,更多相关《SPSS线性回归分析.ppt(55页珍藏版)》请在冰点文库上搜索。

SPSS线性回归分析.ppt

SPSS线性回归,回归(Regression,或LinearRegression)和相关都用来分析两个定距变量间的关系,但回归有明确的因果关系假设。

即要假设一个变量为自变量,一个为因变量,自变量对因变量的影响就用回归表示。

如年龄对收入的影响。

由于回归构建了变量间因果关系的数学表达,它具有统计预测功能。

一、回归的原理,线性回归的统计原理:

两个定距变量的回归是用函数y=f(x)来分析的。

我们最常用的是一元回归方程,其中x为自变量;y为因变量;a为截距,即常量;b为回归系数,表明自变量对因变量的影响程度。

Y=350+20x,在统计学中,这一方程中的系数是靠x与y变量的大量数据拟合出来的。

X,Y,Y=a+bx,(x,y),由图中可以看出,回归直线应该是到所有数据点最短距离的直线。

该直线的求得即使用“最小二乘方法”,使:

在拟合的回归直线方程中,回归系数:

表示x每变化一个单位时,x与y共同变化的程度。

常数:

比如通过上学年数和工资的关系计算得出下列的回归公式:

y=472+14.8x可知上学年数每增长1年,工资会增加14.8元;也可推测,上学年数为15年的人,工资收入应为472+14.8*15=694元。

二、线性回归的适用条件,线性趋势:

即自变量与因变量的关系是线性的。

独立性:

因变量Y的取值相互独立。

反映在方程中即残差独立。

正态性:

即自变量的任何一个线性组合,Y应该服从正态分布。

反映在方程中即残差Ei服从正态分布。

方差齐性:

自变量的任何一个线性组合,Y的方差相同。

三、线性回归菜单简介,LinearRegression对话框,Enter:

进入法。

默认选项。

所有所选自变量都进入回归模型,不作任何筛选。

Stepwise:

逐步法。

根据在Option框中设顶的纳入和排除标准进行变量筛选。

具体做法是首先分别计算各自变量X对Y的贡献大小,按由大到小的顺序挑选贡献最大的一个先进入方程;随后重新计算各自变量X对Y的贡献,引入方程,同时考察已在方程中的变量是否由于新变量的引入而不再有统计意义。

如果是,则将它剔除。

如此重复,直到方程内没有变量可剔除,方程外没有变量可引入为止。

Remove:

剔除法(移去法)。

只出不进。

注意其筛选以Block为单位。

Backward:

向后法。

步骤类逐步法,但只出不进。

即对已纳入方程的变量按对Y贡献的由小到大依次剔除,每剔除一个变量,重新计算对Y贡献的大小。

直到方程中所有变量都符合选入的标准为止。

Forward:

向前法。

与逐步法类似,但只进不出。

即对纳入方程的变量不再考察它的显著性。

直到方程外变量均达不到进入标准,没有自变量引入方程为止。

变量筛选方法的选择应注意,1.变量选择不仅仅是数学问题,不能脱离研究的目的进行。

2.最好多做尝试,对不同方法之间所结果的差异认真思考。

Statistics对话框,Plots对话框,X轴或Y轴中有一个是因变量标准化的预测值标准化的残差删除的残差修正后的预测值。

用户的残差用户的删除的残差,输出带有正态曲线的标准化残差的直方图。

输出标准化残差的正态概率图。

对每一个自变量,会产生一个自变量与因变量残差的散点图,主要用于回归诊断。

Options对话框,如一个变量的F统计量的p值是小于Entry值的,这个变量就进入模型。

如一个变量的F统计量的p值是大于Removal值的,这个变量就从模型中删除。

Entry值必须小于Removal值且都为正。

如想模型中有更多的变量就提高Entry值;如想模型中减少变量就减少Removal值。

用F统计量的值,同上,选择此项不显示回归方程中常数项。

Save对话框,四、回归分析的步骤,1.做出散点图,观察变量间的趋势;2.考察数据的分布,进行必要的预处理;3.进行直线回归分析;4.残差分析;5.强影响点的诊断及多重共线性问题的判断。

例1:

以SPSS自带的数据文件“1991U.S.GeneralSocialSurvey.sav”为例分析影响职业声望的因素。

例2:

请分析SPSS自带数据文件plastic.sav中变量挤压(extrusn)、附加(addition)、光泽(gloss)、不透明度(opacity)对变量拉扯强度(tear_res)的大小有无影响?

已知挤压对拉扯强度的大小有影响。

已知压对拉扯强度有影响,故不需筛选,可用进入法。

其他变量不知道有无影响,需要用逐步法进行筛选。

衡量多元线性回归方程的标准,1.复相关系数R与校正复相关系数Rad2.剩余标准差S,强影响点的诊断及对策,诊断方法:

1.散点图2.残差诊断指标3.稳健回归方法的使用对策:

1.去除2.变量变换3.非参数分析4.采用加权最小二乘法,多重共线性问题及对策,确认:

1.求相关系数矩阵,系数在0.9以上的将会存在共线性问题,0.8以上可能会有问题;2.容忍度(Tolerance):

指标越小,共线性可能越严重。

如果小于0.1,可认为共线性严重。

对策:

1.增大样本,可能部分解决2.采用多种方法相结合来建立方程3.从专业角度判断,去除在专业上比较次要的,或缺失值较多、测量误差较大的共线性因子4.进行主成分分析或路径分析,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > PPT模板 > 商务科技

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2