SPSS统计软件期末作业Word下载.docx

上传人:b****2 文档编号:1138848 上传时间:2023-04-30 格式:DOCX 页数:24 大小:818.71KB
下载 相关 举报
SPSS统计软件期末作业Word下载.docx_第1页
第1页 / 共24页
SPSS统计软件期末作业Word下载.docx_第2页
第2页 / 共24页
SPSS统计软件期末作业Word下载.docx_第3页
第3页 / 共24页
SPSS统计软件期末作业Word下载.docx_第4页
第4页 / 共24页
SPSS统计软件期末作业Word下载.docx_第5页
第5页 / 共24页
SPSS统计软件期末作业Word下载.docx_第6页
第6页 / 共24页
SPSS统计软件期末作业Word下载.docx_第7页
第7页 / 共24页
SPSS统计软件期末作业Word下载.docx_第8页
第8页 / 共24页
SPSS统计软件期末作业Word下载.docx_第9页
第9页 / 共24页
SPSS统计软件期末作业Word下载.docx_第10页
第10页 / 共24页
SPSS统计软件期末作业Word下载.docx_第11页
第11页 / 共24页
SPSS统计软件期末作业Word下载.docx_第12页
第12页 / 共24页
SPSS统计软件期末作业Word下载.docx_第13页
第13页 / 共24页
SPSS统计软件期末作业Word下载.docx_第14页
第14页 / 共24页
SPSS统计软件期末作业Word下载.docx_第15页
第15页 / 共24页
SPSS统计软件期末作业Word下载.docx_第16页
第16页 / 共24页
SPSS统计软件期末作业Word下载.docx_第17页
第17页 / 共24页
SPSS统计软件期末作业Word下载.docx_第18页
第18页 / 共24页
SPSS统计软件期末作业Word下载.docx_第19页
第19页 / 共24页
SPSS统计软件期末作业Word下载.docx_第20页
第20页 / 共24页
亲,该文档总共24页,到这儿已超出免费预览范围,如果喜欢就下载吧!
下载资源
资源描述

SPSS统计软件期末作业Word下载.docx

《SPSS统计软件期末作业Word下载.docx》由会员分享,可在线阅读,更多相关《SPSS统计软件期末作业Word下载.docx(24页珍藏版)》请在冰点文库上搜索。

SPSS统计软件期末作业Word下载.docx

11.8%

100.0%

未来收入情况中的%

73.1%

77.6%

51.3%

72.2%

总数的%

16.2%

47.4%

8.5%

农村户口

14

32

19

65

14.4

39.7

10.8

65.0

21.5%

49.2%

29.2%

26.9%

22.4%

48.7%

27.8%

6.0%

13.7%

8.1%

52

143

39

234

52.0

143.0

39.0

234.0

22.2%

61.1%

16.7%

 

卡方检验

df

渐进Sig.(双侧)

Pearson卡方

10.622a

2

.005

似然比

9.844

.007

线性和线性组合

4.077

1

.043

有效案例中的N

a.0单元格(0.0%)的期望计数少于5。

最小期望计数为10.83。

因为卡方值小于0.05拒绝原假设,认为行列变量之间相关,户口对未来收入看法有影响,说明城镇和农村储户对“未来收入状况的变化趋势”持不同的态度。

3、分析储户一次存款金额的分布,并对不同年龄段的储户进行比较。

由于存款金额数据为定距型变量,直接采用频数分析不利于对其分布形态的把握,因此考虑依据第三章中的数据分组功能对数据分组后再编制频数分布表。

转换→重新编码为不同变量→选择存(取)款金额,输出变量名称填存款金额分组,单击旧值和新值,对数据进行分组,分为0-500、501-2000、2001-3500、3501-5000、5000以上五个组。

最后点击确定。

再分析→描述统计→频率→变量:

存款金额分组,图表选择直方图,选择显示正态曲线。

最后输出下列图表:

存款金额分组

频率

百分比

有效百分比

累积百分比

有效

1.00

85

34.6

2.00

77

31.3

65.9

3.00

12

4.9

70.7

4.00

23

9.3

80.1

5.00

49

19.9

100.0

246

进行数据拆分,并计算不同年龄段储户的一次存款金额的四分位数,并通过四分位数比较分布上的差异。

步骤:

数据→拆分文件→分组方式:

年龄→确定。

分析→描述统计→频率→统计量→四分位数前打勾→确定。

输出如下图表:

统计量

20岁以下

N

缺失

百分位数

25

1.0000

50

3.0000

75

.

20~35岁

133

2.0000

4.0000

35~50岁

78

50岁以上

33

1.5000

分析储户一次存款金额的分布,并对不同年龄段的储户进行比较。

存款在500以下所占百分比最大,有34.6%,其次是500-1000的人数。

而存款在5000以上的也有19.9%,说明存款数额悬殊较大。

从输出图表中看出20-35年龄段的储户最多,其次是35-50岁年龄段,这两部分的人群存款意识比较强,20岁以下的储户只有2人,人数特别少,因为这一年龄段的人群大部分是学生,而50岁以上的老人可能更愿意把钱藏在家里而不是拿到银行去存。

第5题:

方差分析2

在某化工生产中为了提高收率,选了三种不同浓度,四种不同温度做试验。

在同一浓度与温度组合下各做两次试验,其收率数据如下面计算表所列(数据均已减去75)。

试在α=0.05显著性水平下分析:

(1)给出SPSS数据集的格式(列举前4个样本即可);

(2)浓度对收率有无显著影响,并进行多重比较检验(只选用第1个检验指标);

(3)浓度、温度以及它们间的交互作用对收率有无显著影响。

本道题重点考察我们对于在SPSS应用过程中对于方差分析的应用情况。

先将这组数据输入SPSS,然后进行两个方面的计算:

单因素方差分析和多因素方差分析。

利用SPSS的非必须功能,从而得出它们的方差数据,进而进行分析和结果的得出。

多重比较检验的方法:

LSD方法适用于各总体方差相等的情况,特点是比较灵敏;

Tukey方法和S-N-K方法适用于各水平下观测变量个数相等的情况;

Scheffe方法比Tukey方法不灵敏。

分别定义分组变量A、X、B,在变量视图与数据视图中输入表格数据

分析-比较均值-单因素ANOVA-因变量列表:

收率,因子列表:

浓度-确定。

单因素方差分析

收率

平方和

均方

F

显著性

组间

35.083

17.542

3.726

.041

组内

98.875

21

4.708

总数

133.958

显著性=0.41小于0.05说明拒绝原假设(浓度对收益无显著影响),证明浓度对收益有显著影响。

分析-比较均值-单因素ANOVA-两两比较:

LSD-选项:

描述性-确定

输出:

描述

均值

标准差

标准误

均值的95%置信区间

极小值

极大值

下限

上限

8

11.2500

1.48805

.52610

10.0060

12.4940

9.00

13.00

8.7500

1.83225

.64780

7.2182

10.2818

6.00

11.00

3

11.3750

2.92465

1.03402

8.9299

13.8201

14.00

24

10.4583

2.41335

.49262

9.4393

11.4774

多重比较

因变量:

收率

LSD

(I)浓度

(J)浓度

均值差(I-J)

95%置信区间

2.50000*

1.08493

.032

.2438

4.7562

-.12500

.909

-2.3812

2.1312

-2.50000*

-4.7562

-.2438

-2.62500*

.025

-4.8812

-.3688

.12500

-2.1312

2.3812

2.62500*

.3688

4.8812

*.均值差的显著性水平为0.05。

上面有星号的说明有显著差异,即根据LCD算法,浓度1与浓度2具有显著差异,浓度3与浓度2有显著性差异,浓度1与浓度3差异性较小。

分析-一般线性模型-单变量-因变量:

收率,固定因子:

浓度、温度,-模型选择全因子-确定。

主体间因子

浓度

温度

6

4

主体间效应的检验

收率

III型平方和

Sig.

校正模型

69.458a

11

6.314

1.175

.391

截距

2625.042

488.380

.000

A

3.264

.074

B

14.792

4.931

.917

.462

A*B

19.583

.607

.721

误差

64.500

5.375

总计

2759.000

校正的总计

a.R方=.519(调整R方=.077)

结果表明,只有因子A(浓度)是显著的,即浓度不同将对收率产生显著影响,而温度及交互作用的影响都不显著,这说明要提高收率必须把浓度控制好。

方差分析可以很好的去辨别两个事物之间存在联系的紧密性。

通过数据,我们可以分辨出浓度的影响更加显著,从而做出调整。

第11题:

曲线回归3

根据收集的1981年至2000年的数据,分析教育支出受年人均可支配收入的影响。

(提示:

首先绘制两者的散点图。

再尝试选择二次、三次曲线、复合函数和幂函数模型,利用曲线估计进行本质线性模型分析。

思路:

本题主要考察曲线回归的内容,先绘制两者散点图,再用二次、立方、复合、幂函数模型,进行分析。

图形→旧对话框→散点/点状→简单分布→Y轴:

教育支出,X轴:

年人均可支配收入→确定。

得到散点图如下:

分析→回归→曲线估计→因变量:

教育支出,自变量:

年人均可支配收入,个案标签:

年份,模型二次项、立方、幂、复合前打勾→确定。

得到以下图表:

模型汇总和参数估计值

教育支出

方程

模型汇总

参数估计值

R方

df1

df2

常数

b1

b2

b3

二次

.963

104.027

116.057

-.053

9.784E-006

三次

.964

62.555

7

190.569

-.102

1.831E-005

-4.370E-010

复合

.985

611.315

9

21.659

1.000

.946

156.436

1.633

自变量为年人均可支配收入。

在二次、三次、复合、幂函数的模型中复合函数的R方是最大、最接近1的。

所以应用复合函数来表示年人均可支配收入与教育支出的函数关系。

根据函数图象看出,教育支出是随年人均可支配收入增长而增长的,说明随着人们可支配收入增加,对教育的关注更多,投入更多。

第12题:

聚类分析1

9个学生的数学、物理、化学、语文、历史、英语的成绩如下表。

要求做K-Means聚类分析,分成3类,初始类中心点由SPSS自行确定。

本题考察K聚类(快速聚类)的内容,根据题目只要指定聚类数目K和确定K个初始类中心即可。

先把表格数据输入数据编辑器中。

分析→分类→K-均值聚类→变量中把数学、物理、化学、语文、历史、英语选进,聚类数为3→选项→初始聚类中心和ANOVA表前打勾→确定。

初始聚类中心

聚类

数学

83

67

物理

61

100

63

化学

72

79

语文

84

41

历史

81

英语

57

迭代历史记录a

迭代

聚类中心内的更改

14.513

15.411

17.610

a.由于聚类中心内没有改动或改动较小而达到收敛。

任何中心的最大绝对坐标更改为.000。

当前迭代为2。

初始中心间的最小距离为39.724。

最终聚类中心

74

70

68

92

71

64

60

69

56

ANOVA

66.194

35.417

1.869

.234

422.292

48.236

8.755

.017

105.000

113.333

.926

.446

570.028

74.694

7.631

.022

175.278

15.611

11.228

.009

255.292

39.236

6.507

.031

F检验应仅用于描述性目的,因为选中的聚类将被用来最大化不同聚类中的案例间的差别。

观测到的显著性水平并未据此进行更正,因此无法将其解释为是对聚类均值相等这一假设的检验。

每个聚类中的案例数

4.000

2.000

3.000

9.000

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 法律文书 > 调解书

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2