spss统计软件期末作业Word文件下载.docx

上传人:b****6 文档编号:8582179 上传时间:2023-05-11 格式:DOCX 页数:20 大小:697.76KB
下载 相关 举报
spss统计软件期末作业Word文件下载.docx_第1页
第1页 / 共20页
spss统计软件期末作业Word文件下载.docx_第2页
第2页 / 共20页
spss统计软件期末作业Word文件下载.docx_第3页
第3页 / 共20页
spss统计软件期末作业Word文件下载.docx_第4页
第4页 / 共20页
spss统计软件期末作业Word文件下载.docx_第5页
第5页 / 共20页
spss统计软件期末作业Word文件下载.docx_第6页
第6页 / 共20页
spss统计软件期末作业Word文件下载.docx_第7页
第7页 / 共20页
spss统计软件期末作业Word文件下载.docx_第8页
第8页 / 共20页
spss统计软件期末作业Word文件下载.docx_第9页
第9页 / 共20页
spss统计软件期末作业Word文件下载.docx_第10页
第10页 / 共20页
spss统计软件期末作业Word文件下载.docx_第11页
第11页 / 共20页
spss统计软件期末作业Word文件下载.docx_第12页
第12页 / 共20页
spss统计软件期末作业Word文件下载.docx_第13页
第13页 / 共20页
spss统计软件期末作业Word文件下载.docx_第14页
第14页 / 共20页
spss统计软件期末作业Word文件下载.docx_第15页
第15页 / 共20页
spss统计软件期末作业Word文件下载.docx_第16页
第16页 / 共20页
spss统计软件期末作业Word文件下载.docx_第17页
第17页 / 共20页
spss统计软件期末作业Word文件下载.docx_第18页
第18页 / 共20页
spss统计软件期末作业Word文件下载.docx_第19页
第19页 / 共20页
spss统计软件期末作业Word文件下载.docx_第20页
第20页 / 共20页
亲,该文档总共20页,全部预览完了,如果喜欢就下载吧!
下载资源
资源描述

spss统计软件期末作业Word文件下载.docx

《spss统计软件期末作业Word文件下载.docx》由会员分享,可在线阅读,更多相关《spss统计软件期末作业Word文件下载.docx(20页珍藏版)》请在冰点文库上搜索。

spss统计软件期末作业Word文件下载.docx

做生意

10

5.6

5.7

85.2

买证券及单位集资

8

4.5

89.8

买房或建房

94.3

支付孩子教育费

6

3.4

97.7

养老金

4

2.3

100.0

合计

176

99.4

缺失

系统

1

.6

177

农村户口

14.5

11.6

26.1

34

49.3

75.4

5

7.2

82.6

购买农业生产资料

3

4.3

87.0

7

10.1

97.1

防以外事故

2

2.9

69

分析:

从表格中,我们能够看见城镇户口和农村户口的储户的不同储蓄目的所占百分比数量,而从条形图上我们能够更直观的看见各种百分比的高低多少。

取消拆分文件操作。

(2)思路:

该问题列联表的行变量为户口,列变量为未来收入状况,在列联表中输出各种百分比、期望频数、剩余、标准化剩余,显示各交叉分组下频数分布柱形图,并利用卡方检验方法,对城镇和农村储户对该问题的态度是否一致进行分析。

步骤:

分析,描述分析,交叉表,行设为户口,列设为未来收入情况,

点击确定,得到下表:

案例处理摘要

案例

有效的

N

户口*未来收入情况

246

100.0%

.0%

户口*未来收入情况交叉制表

未来收入情况

增加

基本不变

减少

计数

40

116

21

期望的计数

40.3

108.6

28.1

177.0

户口中的%

22.6%

65.5%

11.9%

未来收入情况中的%

71.4%

76.8%

53.8%

72.0%

总数的%

16.3%

47.2%

8.5%

16

35

15.7

42.4

10.9

69.0

23.2%

50.7%

26.1%

28.6%

46.2%

28.0%

6.5%

14.2%

7.3%

56

151

39

56.0

151.0

39.0

246.0

22.8%

61.4%

15.9%

卡方检验

df

渐进Sig.(双侧)

Pearson卡方

8.117a

.017

似然比

7.608

.022

线性和线性组合

2.409

.121

有效案例中的N

a.0单元格(.0%)的期望计数少于5。

最小期望计数为10.94。

原假设是:

城镇和农村储户对“未来收入状况的变化趋势”持相同的态度,由于卡方检验中,p=0.017<

0.05拒绝原假设,认为行列变量之间相关,户口对未来收入看法有影响,即城镇储户和农村储户有不同的态度。

(3)思路:

数据分组,将存(取)款金额重新分成五组,五组区间分布为,少于500元,500-2000元,2000-3500元,3500-5000元,5000元以上。

分组后进行频数分析并绘制带正态曲线的直方图。

利用SPSS的频数分析计算所有样本的存(取)款金额的四分位数;

然后,按照年龄段对数据进行拆分(Splitfile)并重新计算分位数,分别得到不同年龄段的储户的存(取)款金额的四分位数。

转换,重新编码为其他变量,选中存(取)款金额,名称设为“存款金额分组”,更改,旧值与新值按如下设置

继续,确定。

分析,描叙分析,频率,选中存款金额分组,图标,直方图,在直方图上显示正态曲线。

得图如下:

存款金额分组

1.00

87

35.4

2.00

76

30.9

66.3

3.00

14

72.0

4.00

20

8.1

80.1

5.00

49

19.9

 

数据,拆分文件,选取年龄,比较组,确定。

分析,描述分析,频率,选取存(取)款金额,统计量———>

四分位,继续,确定。

如下图:

得到结果如下:

统计量

存(取)款金额

20岁以下

百分位数

25

212.50

50

850.00

75

37750.00

20~35岁

127

500.00

1000.00

5000.00

35~50岁

82

4925.00

50岁以上

33

2000.00

分位数是变量在不同分位点上的取值。

分位点在0-100之间,四分位即是各年龄段的储户的存款金额在0,25%,50%,75%,100%各点的取值,从表中中可以清晰地看见各年龄段的差异。

第十一题:

思路:

先选择出从1981年至2000年的数据,然后绘制教育支出和年人均可支配收入两者的散点图,观察散点图发现两变量之间呈非线性关系,再尝试选择二次、三次曲线、复合函数和幂函数,指数函数模型,利用曲线估计进行本质线性模型分析。

其中,教育支出为被解释变量,年人均可支配收入为解释变量。

数据,选择个案,基于时间或个案全距,从第4到第23个个案,

绘制散点图:

图形,旧对话框,散点/点状,简单分布,将Y变量设为教育支出,X变量设为年人均可支配收入。

确定,得到如下图形:

从上图中,可以看出,该图可能是二次,三次,指数,幂函数,复合函数的图像,故作曲线拟合。

曲线拟合:

分析,回归,曲线估计,按如下设置好对话框,

点击确定,得如下图形:

模型描述

模型名称

MOD_4

因变量

教育支出

方程

二次

三次

复合a

幂a

指数a

自变量

年人均可支配收入

常数

包含

其值在图中标记为观测值的变量

未指定

用于在方程中输入项的容差

.0001

a.该模型要求所有非缺失值为正数。

个案处理摘要

个案总数

已排除的个案a

9

已预测的个案

新创建的个案

a.从分析中排除任何变量中带有缺失值的个案。

变量处理摘要

变量

正值数

11

零的个数

负值数

缺失值数

用户自定义缺失

系统缺失

模型汇总和参数估计值

因变量:

模型汇总

参数估计值

R方

F

df1

df2

Sig.

b1

b2

b3

.963

104.027

.000

116.057

-.053

9.784E-6

.964

62.555

190.569

-.102

1.831E-5

-4.370E-10

复合

.985

611.315

21.659

1.000

.946

156.436

1.633

指数

自变量为年人均可支配收入。

SPSS自动完成模型的参数估计,并输出回归方程显著性检验的F值和概率p值、判定系数R2等统计量。

根据“模型汇总和参数估计值”表格,可以判断出各种曲线与散点图的拟合程度(匹配程度),比较R方和F的值来看,复合函数和指数函数的拟合度最高。

观察曲线图,可以清楚地看出,拟合程度最好的也是指数函数和复合函数,两者都已经重合为一条曲线了。

第十二题:

思路:

先将数据输入(变量视图定义变量,再用数据视图输入数据),根据所得数据进行K—Means聚类分析。

数据输入:

(1)定义变量

(2)输入数据:

K—Means聚类分析:

(1)指定聚类数目K

(2)有系统默认K个初始聚类中心

(3)根据距离最近原则进行分类

(4)重新确定K个类中心

(5)判断是否已满足中止聚类分析的条件

分析,分类,K—均值聚类,然后按如下操作

分别点击迭代,保存,选项得到上面的三个会话框,按照会话框设置。

完成上述操作后,确定,得到以下的图表:

初始聚类中心

聚类

数学

65.00

83.00

67.00

物理

61.00

100.00

63.00

化学

72.00

79.00

49.00

语文

84.00

41.00

历史

81.00

英语

50.00

57.00

迭代历史记录a

迭代

聚类中心内的更改

14.513

15.411

17.474

a.由于聚类中心内没有改动或改动较小而达到收敛。

任何中心的最大绝对坐标更改为.000。

当前迭代为2。

初始中心间的最小距离为39.724。

最终聚类中心

74.00

80.50

70.00

67.75

92.00

71.00

77.00

64.00

78.50

51.50

60.33

69.00

67.33

71.75

56.33

ANOVA

误差

均方

66.194

35.417

1.869

.234

426.069

46.125

9.237

.015

105.000

113.333

.926

.446

570.028

74.694

7.631

175.278

15.611

11.228

.009

255.292

39.236

6.507

.031

F检验应仅用于描述性目的,因为选中的聚类将被用来最大化不同聚类中的案例间的差别。

观测到的显著性水平并未据此进行更正,因此无法将其解释为是对聚类均值相等这一假设的检验。

每个聚类中的案例数

4.000

2.000

3.000

9.000

初始聚类中心表:

第二类的各指数几乎都是最有的,第一类次之,第三类最不理想。

迭代历史记录:

展示3个类中心每次迭代时的偏移情况。

最终聚类中心:

展示第二类几乎各指数依然都是最有的,第一类次之,第三类还是最不理想的。

ANOVA:

展示物理,语文,历史,英语的指数的均值在3类中的差异是显著的,而数学与化学并不显著。

每个聚类中的案例数:

展示三个类的成员情况。

第五题:

(1)

思路及步骤:

定义一个分组变量为group1(即在变量视图中/名称列中的第一行输入group1,并设置小数的值为0),该变量表示因子A的3个不同水平,其值1,2,3分别表示A1,A2,A3.定义一个变量为data(即在变量视图中名称列中的第二行输入data),定义另一个分组变量为group2(即在变量视图中名称列中的第三行输入group2,并设置小数的值为0),该变量表示因子B的四个不同水平,其值1,2,3,4分别表示B1,B2,B3,B4.按照行的顺序(即先输入A1行的数据,然后输入A2行的数据,依此类推)依次输入SPSS(在数据变量中的数据列中输入表中的24个数据。

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 农林牧渔 > 林学

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2