spss回归分析1.ppt

上传人:wj 文档编号:8773695 上传时间:2023-05-14 格式:PPT 页数:26 大小:429.50KB
下载 相关 举报
spss回归分析1.ppt_第1页
第1页 / 共26页
spss回归分析1.ppt_第2页
第2页 / 共26页
spss回归分析1.ppt_第3页
第3页 / 共26页
spss回归分析1.ppt_第4页
第4页 / 共26页
spss回归分析1.ppt_第5页
第5页 / 共26页
spss回归分析1.ppt_第6页
第6页 / 共26页
spss回归分析1.ppt_第7页
第7页 / 共26页
spss回归分析1.ppt_第8页
第8页 / 共26页
spss回归分析1.ppt_第9页
第9页 / 共26页
spss回归分析1.ppt_第10页
第10页 / 共26页
spss回归分析1.ppt_第11页
第11页 / 共26页
spss回归分析1.ppt_第12页
第12页 / 共26页
spss回归分析1.ppt_第13页
第13页 / 共26页
spss回归分析1.ppt_第14页
第14页 / 共26页
spss回归分析1.ppt_第15页
第15页 / 共26页
spss回归分析1.ppt_第16页
第16页 / 共26页
spss回归分析1.ppt_第17页
第17页 / 共26页
spss回归分析1.ppt_第18页
第18页 / 共26页
spss回归分析1.ppt_第19页
第19页 / 共26页
spss回归分析1.ppt_第20页
第20页 / 共26页
亲,该文档总共26页,到这儿已超出免费预览范围,如果喜欢就下载吧!
下载资源
资源描述

spss回归分析1.ppt

《spss回归分析1.ppt》由会员分享,可在线阅读,更多相关《spss回归分析1.ppt(26页珍藏版)》请在冰点文库上搜索。

spss回归分析1.ppt

第十三章相关与回归,1/26,第十三章线性关系的分析:

相关与回归,AnalysisofLinearRelationship:

CorrelationandRegression,第十三章相关与回归,2/26,课程目标,了解线性关系的概念了解相关系数的原理了解其他类型的相关系数的概念了解回归分析的原理了解回归分析的假设熟习相关与回归的SPSS统计应用,第十三章相关与回归,3/26,线性关系的分析原理,线性关系(linearrelationship)指两个变项的关系呈现直线般的共同变化数据的分布可以被一条最具代表性的直线来表达的关联情形。

该直线之方程式为Y=bx+a,b为斜率(即y/x,每单位的X变动时,在Y轴上所变动的量)线性关系可以散布图来表现,第一节,第十三章相关与回归,4/26,五种不同的相关情形,完全正相关(perfectpositivecorrelation)完全负相关(perfectnegativecorrelation)正相关(positivecorrelation)负相关(negativecorrelation)零相关(zerocorrelation),第二节,第十三章相关与回归,5/26,相关分析的图示,第二节,第十三章相关与回归,6/26,积差相关的假设考验,相关系数是否具有统计上的意义,则必须透过统计考验(t-test)来判断从样本得到的r是否来自于相关为0的母体,即H0:

XY=(0=0)相关系数的t检定的自由度为N-2,因为两个变项各取一个自由度进行样本变异数估计,第二节,第十三章相关与回归,7/26,相关系数的特质,随着共变量的大小与正负向,相关系数可以分为正相关(完全正相关)、负相关(完全负相关)、零相关五种情形。

相关的大小需经显著性检定来证明是否显著(是否有统计上的意义)。

相关系数介于-1至1之间。

相关情形的大小非与r系数大小成正比相关并不等于因果相关系数没有单位,可以进行跨样本的比较,第二节,第十三章相关与回归,8/26,相关系数的强度大小与意义,第二节,第十三章相关与回归,9/26,点二系列相关系数,适用于二分变量的相关系数计算rpb的系数数值介于1.0之间,绝对值越大,表示两个变项的关系越强当rpb系数为正时,表示二分变项数值大者,在连续变项上的得分越高当rpb系数为负时,表示二分变项数值小者,在连续变项上的得分越高当p与q数值为越接近0.5时,rpb的数值才有可能接近1.0二分变项也可以视为一种连续变项,其与其他任何连续变项的相关,即等于Pearsonsr,第三节,第十三章相关与回归,10/26,eta系数,适用于一个类别变项与连续变项的相关,可以反应非线性关系的强度原理是计算类别变项的每一个数值(类别)下,连续变项的离散情形占全体变异量的比例各类别中,在连续变项上的组内离均差平方和,占总离均差平方和的百分比(以X无法解释Y的误差部分),比例越小,表示两变项的关联越强系数数值类似积差相关系数,介于0至1之间,取平方后称为2,具有削减误差百分比(PRE)的概念,又称为相关比(correlationratio),第三节,第十三章相关与回归,11/26,偏相关与部分相关,偏相关(partialcorrelation)与部分相关(partcorrelation)计算两个变项的相关系数时,把第三变项的影响加以控制的技术,(b),Y,X,Y,X,(a),C,(c),Y,X,C,(d),Y,X,C,(e),Y,X,C,第三节,第十三章相关与回归,12/26,净相关与部份相关,线性关系的统计控制如果两个连续变项之间的关系,可能受到其他变项的干扰之时,或研究者想要把影响这两个变项的第三个变项效果排除,可以利用控制的方式,将第三变项的效果进行统计的控制。

净相关在计算两个连续变项X1与X2的相关之时,将第三变项(X3)与两个相关变项的相关r13与r23予以排除之后的纯净相关,以r123来表示。

部份相关计算X1与X2的单纯相关,如果在计算排除效果之时,仅处理第三变项与X1与X2当中某一个变项的相关之时,所计算出来的相关系数,称之为部份相关,或称为半净相关(semipartialcorrelation),第三节,第十三章相关与回归,13/26,均值回归(regressiontowardthemean),缘起1855年,英国学者Galton以“Regressiontowardmediocrityinhereditystature”,分析孩童身高与父母身高之间的关系父母的身高可以预测子女的身高:

当父母身高越高或越矮时,子女的身高会较一般孩童高或矮当父母亲身高很高或很矮(极端倾向)时,子女的身高会不如父母亲身高的极端化,而朝向平均数移动(regressiontowardmediocrity),第四节,第十三章相关与回归,14/26,回归原理,回归原理将连续变项的线性关系以一最具代表性的直线来表示,建立一个线性方程式Y=bX+a,b为斜率,a为截距透过此一方程式,代入特定的X值,求得一个Y的预测值。

此种以单一独变项X去预测依变项Y的过程,称为简单回归(simpleregression)最小平方法与回归方程式配对观察值(X,Y),将X值代入方程式,得到的数值为对Y变项的预测值,记为Y差值Y-Y称为残差(residual),表示利用回归方程式无法准确预测的误差最小平方法:

求取残差的平方和最小化的一种估计回归线的方法利用此种原理所求得的回归方程式,称为最小平方回归线,第四节,第十三章相关与回归,15/26,回归方程式与未标准化回归系数,回归方程式的斜率与截距,第四节,第十三章相关与回归,16/26,标准化回归系数(standardizedregressioncoefficient),标准化回归系数将b值乘以X变项的标准差再除以Y变项的标准差,即可去除单位的影响,得到一个不具特定单位的标准化回归系数标准化回归系数称为(Beta)系数。

系数是将X与Y变项所有数值转换成Z分数后,所计算得到的回归方程式的斜率系数具有与相关系数相似的性质,数值介于-1至+1之间绝对值越大者,表示预测能力越强,正负向则代表X与Y变项的关系方向,第四节,第十三章相关与回归,17/26,回归误差与可解释变异,观察值Y=bX+a+e回归方程式为误差为两者之差:

e=Y-Y,第四节,第十三章相关与回归,18/26,回归解释变异量,回归解释变异量(R2)表示使用X去预测Y时的预测解释力(独变项对于依变项的解释力)即Y变项被自变项所削减的误差百分比,第四节,第十三章相关与回归,19/26,调整回归解释变异量,R2无法反应模型的复杂度(或简效性)简效性(parsimony)问题不断增加独变项,R2不会减低(R2为独变项数目的非递减函数)研究者为了提高模型的解释力,不断的投入独变项,每增加一个独变项,损失一个自由度,最后模型中无关的独变项过多,自由度变项,失去了简效性调整后R2(adjustedR2)为了处罚增加独变项所损失的简效性,将自由度的变化作为分子与分母项的除项加以控制,可以反应因为独变项数目变动的简效性损失的影响当独变项数目(p)越多,adjR2越小当样本数越大,对于简效性处罚的作用越不明显,第四节,第十三章相关与回归,20/26,回归模型的显著性考验,R2的基本原理是变异数,因此对于R2的检定可利用F考验来进行,第四节,第十三章相关与回归,21/26,估计标准误,预测误差e是一个呈现常态分配的随机变量,平均数为0,标准差为se估计标准误的计量性质是标准差,因此可用以反应误差分配的离散情形标准误越大,估计误差越大标准误越小,估计误差越小估计标准误取误差变异的平方和除以自由度(N-k-1)的开方,亦即F考验当中的误差均方(MSe)的开方,第四节,第十三章相关与回归,22/26,回归模型的参数估计,个别的回归系数b或可以用以说明预测变项对于依变项的解释力回归系数数值的统计意义需经过假设考验来检验R2的显著性考验是回归分析的整体考验(overalltest)回归系数的考验可视为事后考验(posthoctest)回归系数的考验H0:

=0利用t检定,自由度为N-p-1:

第四节,第十三章相关与回归,23/26,回归系数的区间估计,b系数为未标准化系数,用以反应独变项对于依变项的影响程度b系数可以得知独变项的变动在依变项的变动情形利用模型的回归系数标准误,b系数的区间估计可用来推估母数出现的范围利用b系数的95%信心估计区间是否涵盖0,来检验b系数是否显著不等于0,第四节,第十三章相关与回归,24/26,回归分析的基本假设,

(一)固定自变项假设(fixedvariable)特定自变数的特定数值应可以被重复获得,然后得以此一特定的Xi代入方程式而得到预测值。

(二)线性关系假设(linearrelationship)当X与Y的关系被纳入研究之后,回归分析必须建立在变项之间具有线性关系的假设成立上。

(三)常态性假设(normality)回归分析中的所有观察值Y是一个常态分配,即Y来自于一个呈常态分配的母群体。

因此经由回归方程式所分离的误差项e,即由特定Xi所预测得到的与实际Yi之间的差距,也应呈常态分配。

误差项e的平均数为0。

(四)误差独立性假设(independence)误差项除了应呈随机化的常态分配,不同的X所产生的误差之间应相互独立,无相关存在,也就是无自我相关(nonautocorrelation)。

(五)误差等分散性假设(homoscedasticity)多元共线性假设特定X水平的误差项,除了应呈随机化的常态分配,且其变异量应相等,称为误差等分散性,第四节,第十三章相关与回归,25/26,等分散性假设图示,第四节,第十三章相关与回归,26/26,Timeforrest,Chapter13isdonehere.Seeyoulater!

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 经管营销 > 财务管理

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2