1、3811120169期望的计数户口 中的 %22.5%65.7%11.8%100.0%未来收入情况 中的 %73.1%77.6%51.3%72.2%总数的 %16.2%47.4%8.5%农村户口1432196521.5%49.2%29.2%26.9%22.4%48.7%27.8%6.0%13.7%8.1%521433923422.2%61.1%16.7%卡方检验值df渐进 Sig. (双侧)Pearson 卡方a2.005似然比.007线性和线性组合1.043有效案例中的 Na. 0 单元格(0.0%) 的期望计数少于 5。最小期望计数为 10.83。因为卡方值小于0.05拒绝原假设,认为行列
2、变量之间相关,户口对未来收入看法有影响,说明城镇和农村储户对“未来收入状况的变化趋势持不同的态度。3、分析储户一次存款金额的分布,并对不同年龄段的储户进行比拟。由于存款金额数据为定距型变量,直接采用频数分析不利于对其分布形态的把握,因此考虑依据第三章中的数据分组功能对数据分组后再编制频数分布表。转换重新编码为不同变量选择存取款金额,输出变量名称填存款金额分组,单击旧值和新值,对数据进行分组,分为0-500、501-2000、2001-3500、3501-5000、5000以上五个组。最后点击确定。再分析描述统计频率变量:存款金额分组,图表选择直方图,选择显示正态曲线。最后输出以下图表:存款金额
3、分组频率百分比有效百分比累积百分比有效8577122349246进行数据拆分,并计算不同年龄段储户的一次存款金额的四分位数,并通过四分位数比拟分布上的差异。步骤:数据拆分文件分组方式:年龄确定。分析描述统计频率统计量四分位数前打勾确定。输出如以下图表:统计量20岁以下N缺失百分位数255075.2035岁1333550岁7850岁以上33分析储户一次存款金额的分布,并对不同年龄段的储户进行比拟。存款在500以下所占百分比最大,有34.6%,其次是500-1000的人数。而存款在5000以上的也有19.9%,说明存款数额悬殊较大。从输出图表中看出20-35年龄段的储户最多,其次是35-50岁年龄
4、段,这两局部的人群存款意识比拟强,20岁以下的储户只有2人,人数特别少,因为这一年龄段的人群大局部是学生,而50岁以上的老人可能更愿意把钱藏在家里而不是拿到银行去存。第5题:方差分析2:(1)给出SPSS数据集的格式(列举前4个样本即可);(2)浓度对收率有无显著影响,并进行多重比拟检验(只选用第1个检验指标) ;(3)浓度、温度以及它们间的交互作用对收率有无显著影响。本道题重点考察我们对于在SPSS 应用过程中对于方差分析的应用情况。先将这组数据输入SPSS,然后进行两个方面的计算:单因素方差分析和多因素方差分析。利用SPSS的非必须功能,从而得出它们的方差数据,进而进行分析和结果的得出。多
5、重比拟检验的方法: LSD方法适用于各总体方差相等的情况,特点是比拟灵敏;Tukey方法和S-N-K方法适用于各水平下观测变量个数相等的情况;Scheffe方法比Tukey方法不灵敏。分别定义分组变量A、X、B,在变量视图与数据视图中输入表格数据分析-比拟均值-单因素ANOVA-因变量列表:收率,因子列表:浓度-确定。单因素方差分析收率平方和均方F显著性组间.041组内21总数显著性=0.41小于0.05说明拒绝原假设浓度对收益无显著影响,证明浓度对收益有显著影响。分析-比拟均值-单因素ANOVA-两两比拟:LSD-选项:描述性-确定输出:描述均值标准差标准误均值的 95% 置信区间极小值极大
6、值下限上限8.52610.64780324.49262多重比拟因变量: 收率 LSD(I) 浓度(J) 浓度均值差 (I-J)95% 置信区间*.032.2438.909.025.12500.3688*. 均值差的显著性水平为 0.05。上面有星号的说明有显著差异,即根据LCD算法,浓度1与浓度2 具有显著差异,浓度3与浓度2有显著性差异,浓度1与浓度3差异性较小。分析-一般线性模型-单变量-因变量:收率,固定因子:浓度、温度,-模型选择全因子-确定。主体间因子浓度温度64主体间效应的检验 收率源III 型平方和Sig.校正模型11.391截距.000A.074B.917.462A * B.6
7、07.721误差总计校正的总计a. R 方 = .519调整 R 方 = .077结果说明,只有因子A浓度是显著的,即浓度不同将对收率产生显著影响,而温度及交互作用的影响都不显著,这说明要提高收率必须把浓度控制好。方差分析可以很好的去区分两个事物之间存在联系的紧密性。通过数据,我们可以分辨出浓度的影响更加显著,从而做出调整。第11题:曲线回归3根据收集的1981年至2000年的数据,分析教育支出受年人均可支配收入的影响。 提示:首先绘制两者的散点图。再尝试选择二次、三次曲线、复合函数和幂函数模型,利用曲线估计进行本质线性模型分析。思路:此题主要考察曲线回归的内容,先绘制两者散点图,再用二次、立
8、方、复合、幂函数模型,进行分析。图形旧对话框散点/点状简单分布Y轴:教育支出,X轴:年人均可支配收入确定。得到散点图如下:分析回归曲线估计因变量:教育支出,自变量:年人均可支配收入,个案标签:年份,模型二次项、立方、幂、复合前打勾确定。得到以以下图表:模型汇总和参数估计值 教育支出方程模型汇总参数估计值R 方df1df2常数b1b2b3二次.963三次.9647复合.9859幂.946自变量为 年人均可支配收入。在二次、三次、复合、幂函数的模型中复合函数的R方是最大、最接近1的。所以应用复合函数来表示年人均可支配收入与教育支出的函数关系。根据函数图象看出,教育支出是随年人均可支配收入增长而增长
9、的,说明随着人们可支配收入增加,对教育的关注更多,投入更多。第12题:聚类分析19个学生的数学、物理、化学、语文、历史、英语的成绩如下表。 要求做K-Means聚类分析,分成3类,初始类中心点由SPSS自行确定。此题考察K聚类快速聚类的内容,根据题目只要指定聚类数目K和确定K个初始类中心即可。先把表格数据输入数据编辑器中。分析分类K-均值聚类变量中把数学、物理、化学、语文、历史、英语选进,聚类数为3选项初始聚类中心和ANOVA表前打勾确定。初始聚类中心聚类数学8367物理6110063化学7279语文8441历史81英语57迭代历史记录a迭代聚类中心内的更改a. 由于聚类中心内没有改动或改动较小而到达收敛。任何中心的最大绝对坐标更改为 .000。当前迭代为 2。初始中心间的最小距离为 39.724。最终聚类中心747068927164606956ANOVA.234.017.926.446.022.009.031F 检验应仅用于描述性目的,因为选中的聚类将被用来最大化不同聚类中的案例间的差异。观测到的显著性水平并未据此进行更正,因此无法将其解释为是对聚类均值相等这一假设的检验。每个聚类中的案例数
copyright@ 2008-2023 冰点文库 网站版权所有
经营许可证编号:鄂ICP备19020893号-2