实验报告二Word文档格式.docx
《实验报告二Word文档格式.docx》由会员分享,可在线阅读,更多相关《实验报告二Word文档格式.docx(19页珍藏版)》请在冰点文库上搜索。
实验楼1
实验日期
2013.6.2
实验时数
指导教师
何志锋
同组其他成员
梁焯辉、刘德胜
成绩
一、实验目的及要求
第一题:
利用外来工数据,完成下列问题:
(1)使用t检验,比较(目前从事行业中)制造业和服务业的总体平均年龄是否有显著差异;
(2)使用多因素方差分析研究教育程度和月收入对家庭花费(V2_2c),说明两个因素的影响是否显著,有没有显著的交互作用;
(3)如果因素影响显著而交互作用不显著,建立非饱和模型,并利用多重比较比较(snk)各因素水平的高低;
第二题:
应用waste.sav数据,研究固体垃圾排放量与宾馆、餐饮业用地、零售业用地、运输、批发企业用地、金属制造业用地、工业企业用地的关系。
(1)、通过散点图观察变量间的相关关系,使用Enter建立模型,判断各自变量间是否存在多重共线性,写出回归方程,说明T检验和F检验的结果
(2)、利用Stepwise建立模型,通过计算D-W统计量和作出残差分布图、pp图等方法初步判断是否存在序列相关、异方差和正态性,保存模型的预测值。
第三题:
完成P283,例题9-3,画出外出就餐和年份的散点图,利用复合函数,指数函数和三次函数进行拟合,选择最好的拟合模型,写出曲线方程,并对之后两年年的数据进行预测。
二、实验环境及相关情况(包含使用软件、实验设备、主要仪器及材料等)
SPSS18.0,电脑一台
三、实验内容及步骤(包含简要的实验步骤流程)
1.1打开“外来工调查数据.sav”
点击【Analyze】-【CompareMeans】-【IndependentSamplesTtest】,如图设置
按“OK”输出。
1.2
点击【Analyze】-【GeneralLinearModel】-【Univariate】,如图设置
按“OK”输出
1.3
点击【Analyze】-【GeneralLinearModel】-【Univariate】,在弹出来的窗口点击【Model】,
如图设置,按“Continue”
返回后,点击【PostHoc】,如图设置
2.1
点击【Graphs】-【LegacyDialogs】-【Scatter/Dot】,在弹出来的窗口点击【MatrixScatter】,
如图设置,点击”OK”确定。
点击【Analyze】-【Regression】-【Linear】,在弹出来的窗口点击【Model】,如图设置
点击【Statistics】,如图勾选
2.2
点击【Plots】,如图设置
点击【Save】,如图勾选
3.
点击【Analyze】-【Regression】-【CurveEstimation】,在弹出来的窗口,如图设置
按“OK”,输出
四、实验结果(包括程序或图表、结论陈述、数据记录及分析等,可附页)
1.1
IndependentSamplesTest
Levene'
sTestforEqualityofVariances
t-testforEqualityofMeans
F
Sig.
t
df
Sig.(2-tailed)
MeanDifference
Std.ErrorDifference
95%ConfidenceIntervaloftheDifference
Lower
Upper
年龄
Equalvariancesassumed
3.516
.062
2.427
264
.016
2.466
1.016
.466
4.466
Equalvariancesnotassumed
2.524
224.367
.012
.977
.541
4.390
结论:
由图可知,Levene’sTest得到P=0.062>
0.05,我们可以知道两总体方差无显著差异。
则选择Equalvariancesassumed中的双尾概率P=0.016进行观察,因为P<
0.05,则我们可以认为制造业和服务业的总体平均年龄存在显著差异。
由图可知,教育程度P值为0.003,P<
0.05,拒绝原假设,则可以认为不同教育程度对家庭花费产生显著影响。
月收入的P值为0,P<
0.05,则可以认为不同月收入对家庭花费产生显著影响。
而教育程度*月收入的P值为0.882,P>
0.05,不可以拒绝原假设,则可以知道不同教育程度和不同的月收入没有对家庭花费产生显著的交互作用。
在剔除了教育程度和月收入对家庭花费的交互效用后建立的模型还是可以看出,不同教育程度和不同的收入还是分别对家庭花费产生显著影响。
经过多重比较,我们可以知道不同教育程度对家庭消费的影响可以分为三组,由图我们可以看出,“大学及以上”的影响明显大于其余两组,而“中专或高中”的影响次之,“初中及以下”的影响不显著。
由图可以看出,月收入对家庭花费的影响被分为三组,“3000元以上”对家庭花费的影响最明显,而“2001~3000”的效果次之,而800~2000月收入的被分为一组,它们之间没有显著差异,对家庭花费的影响也是最小的。
图一
图二
图三
图四
接上图
由散点图可以看出,固体垃圾排放量与宾馆、餐饮业用地、零售业用地、运输、批发企业用地呈线性关系,而宾馆、餐饮业用地与零售业用地呈线性关系。
由图四可知,Tolerance离0比较远和VIF小于10,所以可以判断各自变量间不存在多重共线性。
同时由图四可以写出回归方程,
y=0.122-5.24X1+4.34X2-0.001X4+0.013X5(X1~X5依次分别代表五个自变量)。
由图二可知,调整后的拟合优度为0.827接近于1,则说明回归方程对样本数据点的拟合优度较高。
DW=1.694,我们可以认为序列不存在明显的自相关。
由图三可知,F检验的P=0<
0.05,拒绝原假设,则可以认为偏回归系数不同时为零,因变量y与自变量x的全体的线性关系显著。
由图四可知,T检验中,除了金属制造业用地的P=0.779>
0.05,其余自变量的P值都小于0.05,则可以认为金属制造用地的偏回归系数与0无显著差异,金属制造用地与固体垃圾排放量的线性关系是不显著的。
图一:
由图一可知,经过四次方程剔除后,金属制造业用地的P值为0.779>
0.05,我们可以认为金属制造业用地对固体垃圾排放量的影响不显著,而其他用地对固体垃圾排放量的影响都是显著的。
由图二可知,DW=1.698,在[1.5,2.5]之间,我们可以认为序列不存在明显的自相关。
由图三可知,点与线基本接近,残差基本符合正态。
而由图四可知,标准化残差随着预测值的增加而增加,所以存在异方差。
基本不存在异常点。
由图一可以看出随着年份的增加,外出就餐的人数呈曲线增长,拟合模型最好的是复合函数和指数函数,基本与点相接近。
复合函数方程:
y=1.031*1.166x
指数函数方程:
y=1.031*e0.154*X
由图三可知,2003年和2004年的预测值
五、实验总结(包括心得体会、问题回答及实验改进意见,可附页)
黄均同心得体会:
在做实验报告的过程中,我学会了如何正确地使用单因素方差分析和多因素方差分析,还有就是如何辨别两个变量之间是否有交互作用,和通过多重比较,可以知道哪些变量对因变量的影响较高。
在对数据进行线性回归分析的时候,我进行了T检验和F检验,并通过观察容忍度和VIF来判断自变量之间是否存在多重共线性,还学会了用不同的方法对解释变量进行筛选,并能对数据是否能进行线性回归分析进行必要的检验。
最后,就是学会了对曲线进行线性回归分析。
但是,通过实验报告,还是可以发现,我在很多方面还是不熟悉的,例如如何判断异方差、正态性,并且有得出的图表不知道含义的情况。
梁焯辉心得体会:
从第一题的第一小题中,通过对题目了解,以及选择T检验方式,进一步从认识到T检验的作用,提高了从题干中提炼信息的能力以及spss软件的操作的熟练程度。
第二、三小题则通过实际的做题,从题目中深入了解到交互作用的意思及影响。
在交互作用不明显的时候,把交互作用放到SSE中,建立非饱和模型,能更好地找出各个变量单独对观测变量的影响。
第二题的难道有所提升,要通过散点图来分析各个变量间是否存在相关关系,也要懂得如何通过建立正确的模型来的获得回归方程和判断变量间是否存在多从共线性。
刘德胜心得体会:
六、教师评语
□优、很好地满足实验内容要求,实验结果分析详实、合理,实验心得深刻,很好的达到实验预期效果。
□良、较好地满足实验内容要求,实验结果分析合理,有一点的实验心得,较好地达到实验预期效果。
□中、基本地满足实验内容要求,实验结果分析完整,实验心得不够深刻,基本达到实验预期效果。
□差、不满足实验内容要求,实验结果分析不完整、不合理,实验心得不够深刻,没达到实验预期效果。