统计SPSS实习.docx
《统计SPSS实习.docx》由会员分享,可在线阅读,更多相关《统计SPSS实习.docx(36页珍藏版)》请在冰点文库上搜索。
统计SPSS实习
实验报告二
实验项目:
描述性统计分析
实验目的:
掌握数据集中趋势和离中趋势的分析方法,并熟练掌握各个分析过程的基本步骤以及彼此之间的联系和区别。
实验内容及其步骤:
统计分析的第一步是描述性统计分析,这第一步是进行以下步骤的开始。
我用的方法是:
Frequencies过程。
它的特色是产生频数表;Descriptives过程是进行一般性的统计描述;Explore过程是对数据概况不清时的探索性分析;Crosstabs过程是完成计数资料,和等级资料的统计描述和一般的统计检验,也就是卡方检验。
一、频数分析(Frequencies过程)
数据集1]E:
\excel安装\2011统计模拟实习资料\数据资料\数据集\第二章\2.4、高考[录取\数据集\数据-SPSS格式\交大机械工程.sav
统计量
名次
N
有效
62
缺失
2
名次
频率
百分比
有效百分比
累积百分比
有效
1.00
7
10.9
11.3
11.3
2.00
4
6.3
6.5
17.7
3.00
4
6.3
6.5
24.2
4.00
4
6.3
6.5
30.6
5.00
4
6.3
6.5
37.1
6.00
3
4.7
4.8
41.9
7.00
3
4.7
4.8
46.8
8.00
2
3.1
3.2
50.0
9.00
2
3.1
3.2
53.2
10.00
2
3.1
3.2
56.5
11.00
2
3.1
3.2
59.7
12.00
2
3.1
3.2
62.9
13.00
2
3.1
3.2
66.1
14.00
2
3.1
3.2
69.4
15.00
2
3.1
3.2
72.6
16.00
2
3.1
3.2
75.8
17.00
2
3.1
3.2
79.0
18.00
2
3.1
3.2
82.3
19.00
2
3.1
3.2
85.5
20.00
2
3.1
3.2
88.7
21.00
2
3.1
3.2
91.9
22.00
2
3.1
3.2
95.2
23.00
2
3.1
3.2
98.4
24.00
1
1.6
1.6
100.0
合计
62
96.9
100.0
缺失
系统
2
3.1
合计
64
100.0
分析:
由上图的调查结果中,可以看出,名次第一的频率最高,百分比为11.3.其次为2、3、4、5名的百分比为6.5.。
可以看出,随着名次靠后,频率也随之下降。
二、描述性分析(Descriptives过程)
[数据集1]E:
\excel安装\2011统计模拟实习资料\数据资料\数据集\第二章\2.4、高考录取\数据集\数据-SPSS格式\交大机械工程.sav
描述统计量
N
极小值
极大值
均值
标准差
招生人数
51
1.00
78.00
9.6471
12.23899
有效的N(列表状态)
51
上图的调查结果可以看出,极大值为78,极小值为1。
标准差为12.239,较小。
说明招生人数对交大机械工程的影响不怎么显著。
三、探索分析(Explore过程)
[数据集1]E:
\excel安装\2011统计模拟实习资料\数据资料\数据集\第二章\2.4、高考录取\数据集\数据-SPSS格式\交大机械工程.sav
学校
案例处理摘要
学校
案例
有效
缺失
合计
N
百分比
N
百分比
N
百分比
重点线
西安交通
60
96.8%
2
3.2%
62
100.0%
描述
学校
统计量
标准误
重点线
西安交通
均值
526.6333
7.54688
均值的95%置信区间
下限
511.5321
上限
541.7346
5%修整均值
526.2593
中值
526.5000
方差
3417.321
标准差
58.45786
极小值
400.00
极大值
650.00
范围
250.00
四分位距
78.25
偏度
.218
.309
峰度
-.307
.608
重点线
茎叶图
重点线Stem-and-LeafPlotfor
学校=西安交通
FrequencyStem&Leaf
4.02234
4.55677777788899
5.000011111222233333334444
5.556677899
6.0012334
6.5
Stemwidth:
100.00
Eachleaf:
1case(s)
分析:
由上图可以得出,西安交通大学的重点分数线主要集中在525分左右。
四、交叉列联表分析(Crosstabs过程)
原假设:
招生人数在年度之间无差异
备择假设:
招生人数在年度之间有差异。
[数据集1]E:
\excel安装\2011统计模拟实习资料\数据资料\数据集\第二章\2.4、高考录取\数据集\数据-SPSS格式\交大机械工程.sav
案例处理摘要
案例
有效的
缺失
合计
N
百分比
N
百分比
N
百分比
年度*招生人数
51
82.3%
11
17.7%
62
100.0%
年度交叉制表
招生人数
合计
1.00
2.00
3.00
4.00
5.00
6.00
7.00
8.00
9.00
10.00
12.00
14.00
17.00
18.00
21.00
22.00
24.00
37.00
78.00
年度
2000.00
2
4
4
1
4
0
1
1
1
1
0
0
2
1
1
1
0
1
0
25
2001.00
0
3
1
6
1
3
0
2
1
2
2
1
1
0
0
1
1
0
1
26
合计
2
7
5
7
5
3
1
3
2
3
2
1
3
1
1
2
1
1
1
51
卡方检验
值
df
渐进Sig.(双侧)
Pearson卡方
22.303a
18
.219
似然比
28.369
18
.057
线性和线性组合
.446
1
.504
有效案例中的N
51
38单元格(100.0%)的期望计数少于5。
最小期望计数为.49。
由卡方检验可以得出:
P值为0.219,大于0.05,则接受原假设,则,招生人数在年度之间无差异。
实验报告三
均数间的比较实验
实验项目:
均数间的比较实验
基本操作训练
实验的目的:
运用SPSS软件进行均数之间的比较。
并能掌握运用SPSS软件的进行假设检验
实验内容:
1、描述统计(Means过程)
2、单样本T检验(One-SampleTTest过程)
3、两个独立样本T检验(Independent-SamplesTTest过程)
4、配对样本T检验(Paired-SamplesTTest过程)
1.描述统计(Means过程)
数据选取:
操作步骤:
输出结果:
案例处理摘要
案例
已包含
已排除
总计
N
百分比
N
百分比
N
百分比
投入证券市场总资金(万元)*受教育程度
381
91.8%
34
8.2%
415
100.0%
报告
投入证券市场总资金(万元)
受教育程度
均值
N
标准差
初中及以下
42.4730
37
37.05869
高中
34.5663
83
32.45342
大专
35.0941
101
31.08188
大学
42.2769
121
31.73694
硕士
42.6563
32
31.49973
博士
50.9286
7
41.38279
总计
38.9029
381
32.47079
分析与结论:
从以上数据中可以得出,学历越高的人在证券市场的投资额越高,其中,学历在初中及以下的平均投资42.4730万元,高中平均投资34.5663,大专平均35.0941万元,硕士平均42.6563,博士平均50.9286.
2.单样本T检验(One-SampleTTest过程)
数据选取:
操作步骤:
输出结果:
单个样本统计量
N
均值
标准差
均值的标准误
投入证券市场总资金(万元)
405
38.9000
32.37486
1.60872
单个样本检验
检验值=38.9
t
df
Sig.(双侧)
均值差值
差分的95%置信区间
下限
上限
投入证券市场总资金(万元)
.000
404
1.000
.00000
-3.1625
3.1625
分析与结论:
对于投入证券市场总资金的样本均值与已知的总体均值进行比较,看样本均值是否具有代表性,由此进行假设检验:
H0:
投入证券市场总资金的均值=38.9000;
H1:
投入证券市场总资金的均值≠38.9000;
因为P=1.000>0.05
所以接受原假设。
因此可以得出结论:
总资金的均值显著为38.9
3、独立样本T检验
操作步骤:
输出结果:
组统计量
投入证券市场总资金(万元)
男
213
40.8967
32.71855
2.24184
女
189
36.8016
32.15238
2.33874
独立样本检验
方差方程的
Levene检验
均值方程的t检验
F
Sig.
t
df
Sig.
(双侧)
均值
差值
标准误
差值
差分的95%置信区间
下限
上限
投入证
券市场
总资金
(万元)
假设方差相等
1.622
.204
1.263
400
.207
4.09513
3.24307
-2.28046
10.47072
假设方差不相等
1.264
395.843
.207
4.09513
3.23968
-2.27401
10.46426
分析与结论:
第一部分为方差齐性检验,用于判断两总体方差是否齐,结果为F=1.622,P=0.204,可见在本例中方差是齐性的
第二部分是对男性和女性进行独立样本检验,检验男性和女性的投入证券市场总资金(万元)是否相等;
检验如下:
H0:
男性的投入证券市场总资金=女性的投入证券市场总资金;
H1:
男性的投入证券市场总资金≠女性的投入证券市场总资金;
方差检验:
p=0.204>0.05
所以方差显著相等,说明样本值来自同一个大样本。
均值检验:
p=0.207>0.05;
所以接受原假设,男性和女性的投入证券市场总资金是相等的。
4.配对样本T检验(Paired-SamplesTTest过程)
数据选取:
:
操作步骤:
输出结果:
成对样本统计量
均值
N
标准差
均值的标准误
对1
问卷A下的得分
149.60
20
2.542
.568
问卷B下得得分
148.90
20
2.654
.593
成对样本相关系数
N
相关系数
Sig.
对1
问卷A下的得分&问卷B下得得分
20
.711
.000
成对样本检验
成对差分
t
df
Sig.
(双侧)
均值
标准差
均值的
标准误
差分的95%置信区间
下限
上限
对1
问卷A下的得分–
问卷B下得得分
.700
1.976
.442
-.225
1.625
1.584
19
.130
分析与结论:
因为t=1.584>t(0.025),且Sig.=0.130所以A卷与B卷没有差别。
实验四相关与回归分析
一、实验目的
学习利用SPSS进行相关分析、偏相关分析、距离分析、线性回归分析和曲线回归。
二、实验内容及实验步骤
(一)双变量的相关分析(Bivariate过程)
1.分析实例:
年人均食品支出与年人均收入是否相关
2.提出假设:
H0:
R=0
H1:
R≠0
描述性统计量
均值
标准差
N
人均食品支出
794.81
185.814
31
人均收入
2002.84
405.256
31
相关性
人均食品支出
人均收入
人均食品支出
Pearson相关性
1
.921**
显著性(双侧)
.000
平方与叉积的和
1035808.839
2080550.032
协方差
34526.961
69351.668
N
31
31
人均收入
Pearson相关性
.921**
1
显著性(双侧)
.000
平方与叉积的和
2080550.032
4926978.194
协方差
69351.668
164232.606
N
31
31
**.在.01水平(双侧)上显著相关。
3.分析结果:
R=0.921显著性=0.000<0.01处于拒绝域拒绝原假设
4.得出结论:
年人均食品支出与年人均收入相关,且是高度相关。
(二)偏相关分析(Partial过程)
1.分析实例:
分析年人均可支配收入与教育支出是否都对年人均消费性支出有影响
2.提出假设:
控制人均可支配收入时,
H0:
教育支出与年人均消费性支出不相关
H1:
教育支出与年人均消费性支出相关
相关性
年人均可支配收入
年人均消费性支出
教育支出
年人均可支配收入
Pearson相关性
1
.997**
.921**
显著性(双侧)
.000
.000
N
25
25
13
年人均消费性支出
Pearson相关性
.997**
1
.914**
显著性(双侧)
.000
.000
N
25
25
13
教育支出
Pearson相关性
.921**
.914**
1
显著性(双侧)
.000
.000
N
13
13
13
**.在.01水平(双侧)上显著相关。
相关性
控制变量
年人均消费性支出
教育支出
年人均可支配收入
年人均消费性支出
相关性
1.000
.002
显著性(双侧)
.
.996
df
0
10
教育支出
相关性
.002
1.000
显著性(双侧)
.996
.
df
10
0
3.分析结果:
当不剔除年人均可支配收入时,教育支出与年人均消费性支出相关性达0.914,显著性小于0.01,处于拒绝域,是相关的。
当剔除年人均可支配收入时,教育支出与年人均消费性支出相关性为0.002,显著性等于0.996大于0.05,不处于拒绝域不拒绝原假设。
4.得出结论:
当控制人均可支配收入时,教育支出与年人均消费性支出
(三)距离分析(Distances过程)
1.分析实例:
比较各组心脏病猝死人数近似程度
案例处理摘要
案例
有效
缺失
合计
N
百分比
N
百分比
N
百分比
16
100.0%
0
.0%
16
100.0%
近似矩阵
Euclidean距离
1
2
3
4
5
6
7
8
10
11
12
13
14
15
16
1
.000
3.000
3.000
1.000
2.000
4.000
3.000
3.000
2.000
3.000
3.000
1.000
3.000
4.000
3.000
2
3.000
.000
.000
2.000
1.000
1.000
.000
.000
1.000
.000
.000
2.000
.000
1.000
.000
3
3.000
.000
.000
2.000
1.000
1.000
.000
.000
1.000
.000
.000
2.000
.000
1.000
.000
4
1.000
2.000
2.000
.000
1.000
3.000
2.000
2.000
1.000
2.000
2.000
.000
2.000
3.000
2.000
5
2.000
1.000
1.000
1.000
.000
2.000
1.000
1.000
.000
1.000
1.000
1.000
1.000
2.000
1.000
6
4.000
1.000
1.000
3.000
2.000
.000
1.000
1.000
2.000
1.000
1.000
3.000
1.000
.000
1.000
7
3.000
.000
.000
2.000
1.000
1.000
.000
.000
1.000
.000
.000
2.000
.000
1.000
.000
8
3.000
.000
.000
2.000
1.000
1.000
.000
.000
1.000
.000
.000
2.000
.000
1.000
.000
这是一个不相似性矩阵
2.分析结果:
1组和4组相似性最小,和6组相似性最大;
2组和3组相似性最小,和1组相似性最大;
3组和2组相似性最小,和1组相似性最大;
4组和5组相似性最小,和6组相似性最大;
5组和4组相似性最小,和1,6组相似性最大;
6组和3组相似性最小,和4组相似性最大;
7组和1组相似性最小,和3组相似性最大;
8组和1组相似性最小,和3组相似性最大.、
(四)线性回归分析(Linear过程)
(1)一元线性回归
1.分析实例:
分析粮食单价与人均食用支出是否具有一元线性关系
2.提出假设:
H0:
β1=0
H1:
β1≠0
输入/移去的变量b
模型
输入的变量
移去的变量
方法
1
粮食平均单价
.
输入
a.已输入所有请求的变量。
b.因变量:
人均食品支出
模型汇总
模型
R
R方
调整R方
标准估计的误差
1
.730a
.532
.516
129.230
a.预测变量:
(常量),粮食平均单价。
Anovab
模型
平方和
df
均方
F
Sig.
1
回归
551497.958
1
551497.958
33.023
.000a
残差
484310.880
29
16700.375
总计
1035808.839
30
a.预测变量:
(常量),粮食平均单价。
b.因变量:
人均食品支出
系数a
模型
非标准化系数
标准系数
t
Sig.
B
标准误差
试用版
1
(常量)
260.227
95.878
2.714
.011
粮食平均单价
640.586
111.473
.730
5.747
.000
a.因变量:
人均食品支出
3.分析结果:
由模型汇总表R方=0.532具有相关性
再看系数表sig=0.00<0.05处于拒绝域拒绝原假设
4.得出结论:
论粮食单价与人均食用量具有一元线性关系
可得出一元线性回归函数关系式:
y=260.227+640.586x
(2)多元线性回归
1.分析实例:
分析服装消费与价格服装指数,金融资产,可支配收入是否具有多元线性关系。
2.提出假设:
H0:
β1=β2=…=β6=0
H1:
β1,β2,…β6不全为0
输入/移去的变量b
模型
输入的变量
移去的变量
方法
1
服装价格指数,95=100,金融资产,百万美元,可支配收入,百万美元
.
输入
a.已输入所有请求的变量。
b.因变量:
服装消费,百万美元
模型汇总
模型
R
R方
调整R方
标准估计的误差
1
.998a
.996
.994
.33508
b.预测变量:
(常量),服装价格指数,95=100,金融资产,百万美元,可支配收入,百万美元。
Anovab
模型
平方和
df
均方
F
Sig.
1
回归
165.826
3
55.275
492.297
.000a
残差
.674
6
.112
总计
166.500
9
a.预测变量:
(常量),服装价格指数,95=100,金融资产,百万美元,可支配收入,百万美元。
b.因变量:
服装消费,百万美元
系数a
模型
非标准化系数
标准系数
t
Sig.
B
标准误差
试用版
1
(常量)
.940
5.180
.181
.862
可支配收入,百万美元
.139
.025
1.174
5.585
.001
金融资产,百万美元
-.038
.057
-.114
-.668
.529
服装价格指数,95=100
-.034
.070
-.065
-.494
.639
a.因变量:
服装消费,百万美元
3.分析结果:
可支配收入sig=0.001<0.05不应剔除
金融资产sig=0.529>0.05应剔除
服装价格指数sig=0.639>0.05应剔除
4.得出结论:
根据向后剔除法,最后剩下可支配收入,一般价格指数具有多重共线性。
可得出多元线性关系