1、spss思考与练习解析1、(1)操作:分析-回归-线性,因变量y,自变量x1,x2-确定。得方程y=209.875+0.292x1-87.647x2。系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)209.87567.3503.116.010x1.292.089.3563.286.007x2-87.64712.443-.763-7.044.000a. 因变量: y(2)对回归方程的显著性检验:采用P值法做检验,提出原假设H0:1=2=0,构造统计量F=,p是自变量个数此时是2,n是样本个数14。F服从分布:FF(2,11)。Anovab模型平方和df均方FSig.1回归46
2、788.618223394.30942.155.000a残差6104.59611554.963总计52893.21413a. 预测变量: (常量), x2, x1。b. 因变量: y从上图最后两列看出,在显著性水平=0.05的条件下,p值=sig,从而拒绝原假设,即在显著性水平=0.05的条件下,认为y与x1,x2有显著的线性关系。对回归系数的显著性检验:采用P值法做检验,提出原假设H0:i=0(i=1,2),构造统计量,其中。系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)209.87567.3503.116.010x1.292.089.3563.286.007x2-87
3、.64712.443-.763-7.044.000a. 因变量: y从上图最后两列看出,在显著性水平=0.05的条件下,ti(i=1,2)值(即看p值=sig),从而拒绝原假设,即在显著性水平=0.05的条件下,认为xi(i=1,2)对因变量y的线性效果显著。(3)操作:分析-回归-线性,因变量y,自变量x1,x2-统计量-回归系数-置信区间、估计。得到i的1-的置信区间为()系数a1模型非标准化系数标准系数tSig.B 的 95.0% 置信区间B标准 误差试用版下限上限1(常量)209.87567.3503.116.01061.639358.111x1.292.089.3563.286.00
4、7.096.488x2-87.64712.443-.763-7.044.000-115.034-60.261a. 因变量: y1的置信水平为0.95的置信区间是(0.096,0.488);2的置信水平为0.95的置信区间是(-115.034,-60.261);(4)回归方程的复相关系数=0.885,比较接近1,说明回归方程拟合效果较好。模型汇总模型RR 方调整 R 方标准 估计的误差1.941a.885.86423.55766a. 预测变量: (常量), x2, x1。(5)操作:先把待预测的数据输入表格,分析-回归-线性,因变量y,自变量x1,x2,保存-预测值、残差项选择“未标准化”-预测
5、区间(“均值”)。得到E(y)的点估计值是165.9985,置信水平为0.95的置信区间是(150.61813,181.37887)3、(1)操作:分析-回归-线性,因变量y,自变量x,确定。得方程y=0.004x-0.831。模型汇总模型RR 方调整 R 方标准 估计的误差1.839a.705.6991.57720a. 预测变量: (常量), x。Anovab模型平方和df均方FSig.1回归302.6331302.633121.658.000a残差126.866512.488总计429.49952a. 预测变量: (常量), x。b. 因变量: y系数a模型非标准化系数标准系数tSig.B
6、标准 误差试用版1(常量)-.831.442-1.882.065x.004.000.83911.030.000a. 因变量: y(2)诊断该问题是否存在异方差性,两种方法。残差图法:分析-回归-线性,因变量y,自变量x。保存-残差、预测值-未标准化。得到残差值:图形-旧对话框-散点-简单分布-定义-y轴是e(RES_1),x轴是(PRE_1)-确定:从残差图看出误差项具有明显的异方差性,因为误差随x轴增加呈现明显的增加态势。第二种方法:等级相关系数法操作:分析-回归-线性,因变量y,自变量x。保存-残差-未标准化。求|ei|:转换-计算变量-如图-确定:然后,分析-相关-双变量-操作如图:得到
7、结果:相关系数e绝对值xSpearman 的 rhoe绝对值相关系数1.000.318*Sig.(双侧).021N5353x相关系数.318*1.000Sig.(双侧).021.N5353*. 在置信度(双测)为 0.05 时,相关性是显著的。用SPSS软件进行等级相关系数的检验,计算出等级相关系数为0.318,p值=0.021普通二乘法方程的复相关系数R方(0.705),说明用加权法得到的回归方程更好。另:此题属于一元加权最小二乘估计建立回归方程的方法,若为多元的(比如多一个x2),其操作的区别在于分析-相关-双变量时,变量一栏里是x1,x2,e绝对值,得出等级相关系数,再进行权重估计操作时
8、,用等级相关系数最大的那个自变量(比如是x2)作为“权重变量”。4、(1)用普通最小二乘法建立y关于x的回归方程。操作:分析-回归-线性,因变量y,自变量x,确定。得方程y=0.176x-1.427(2)用残差图及DW检验诊断序列相关性。(误差项独立性的检验,目的是消除自相关)残差图(etet-1):首先计算残差e:分析-回归-线性-保存-残差(未标准化),计算出残差RES_1(et-1)。从第二行复制该列粘贴到下一列,作为et。图形-旧对话框-散点-简单分布-定义-y轴是RES_1,x轴是res_2-确定:这些点落在一(三)象限,说明存在正自相关性。DW检验:分析-回归-线性-统计量-DW:
9、模型汇总b模型RR 方调整 R 方标准 估计的误差Durbin-Watson1.999a.998.998.09813.683a. 预测变量: (常量), x。b. 因变量: y0.683在(0,2)范围内,是正自相关。(3)分别用迭代法和一阶差分法建立回归方程;迭代法:借助上一小题,求得一元线性回归方程并求得残差间的一阶自相关系数=0.683。转换-计算变量,令y=yi+1yi,x=xi+1xi。分析-回归-线性自变量x*,因变量y*统计量-DW-得到回归方程:y*=0.172x*-0.274,即系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)-.274.179-1.528
10、.145x星.172.004.99647.051.000a. 因变量: y星模型汇总b模型RR 方调整 R 方标准 估计的误差Durbin-Watson1.996a.992.992.074321.430a. 预测变量: (常量), x星。b. 因变量: y星Anovab模型平方和df均方FSig.1回归12.226112.2262213.750.000a残差.09417.006总计12.32018a. 预测变量: (常量), x星。b. 因变量: y星此时DW=1.430,表明y*之间不相关,从而迭代结束。可用下列方程做预测:y*=0.172x*-0.274,即yi+1=0.683*yi-0.
11、274+0.172*(xi+10.683xi)一阶差分法(p47):先分别从第二行复制x,y作为xi+1,yi+1。转换-计算变量,求y=yi+1-yi,x=xi+1-xi:分析-回归-线性自变量x,因变量y得到回归方程:y=0.161x+0.032,即yi+1=yi+0.161(xi+1-xi)+0.032,以下三表说明该方程通过了各种检验。系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量).032.0271.199.247x.161.009.97718.915.000a. 因变量: y模型汇总模型RR 方调整 R 方标准 估计的误差1.977a.955.952.07687
12、a. 预测变量: (常量), x。Anovab模型平方和df均方FSig.1回归2.11412.114357.762.000a残差.10017.006总计2.21418a. 预测变量: (常量), x。b. 因变量: y(4)比较上述几种不同方法所得的回归方程的优良性。普通最小二乘法建立的方程:y=0.176x-1.427,R方=0.998,残差平方和SSE=0.173。迭代法建立的方程:y*=0.172x*-0.274,即yi+1=0.683*yi-0.274+0.172*(xi+10.683xi),R方=0.992,残差平方和SSE=0.094一阶差分法建立的方程:y=0.161x+0.032,即yi+1=yi+0.161(xi+1-xi)+0.032。R方=0.955,残差平方和SSE=0.100
copyright@ 2008-2023 冰点文库 网站版权所有
经营许可证编号:鄂ICP备19020893号-2