spass软件与统计分析实验报告.docx
《spass软件与统计分析实验报告.docx》由会员分享,可在线阅读,更多相关《spass软件与统计分析实验报告.docx(25页珍藏版)》请在冰点文库上搜索。
![spass软件与统计分析实验报告.docx](https://file1.bingdoc.com/fileroot1/2023-7/27/ba23654a-de4e-4839-a5d0-987a806457ca/ba23654a-de4e-4839-a5d0-987a806457ca1.gif)
spass软件与统计分析实验报告
Spass16.0与统计数据分析
实验报告
实验课程:
专业统计软件运用
上课时间:
2012学年上学期16周(2012年06月04日—07日)
姓名:
花满楼
学号:
2010201101
班级:
0301008班
学院:
经济管理学院
上课地点:
经管实验室五楼
指导教师:
刘进
第六章实验
一实验1及目的
1.某农场为了比较4种不同品种的小麦产量的差异,选择土壤条件基本相同的土地,分成16块,将每一个品种在4块试验田上试种,测得小表亩产量(kg)的数据如表6.17所示(数据文件为data6-4.sav),试问不同品种的小麦的平均产量在显著性水平0.05和0.01下有无显著性差异。
(数据来源:
《SPSS实用统计分析》郝黎仁,中国水利水电出版社)
表6.17小麦产量的实测数据
品种
A1
A2
A3
A4
产量
277.5
244.2
249.2
273
276.4
249.5
244.2
240.9
271
236.8
252.8
257.4
272.4
239
251.4
266.5
二实验内容
解决问题1的原理:
单因素方差分析
实验步骤:
1.打开数据文件data6-4.sav
2.选择analyze—comparemeans—one-wayANOVA
3.dependentlist框里为产量,factor为品种
4.在options中选择homogeneityofvariancetest和excludecasesanalysisbyanalysis
5.在posthoc按钮里选择LSD方法,改变相关系数为0.05和0.01
6.得出结果
三结果分析
1.实验结果图如下
TestofHomogeneityofVariances
产量
LeveneStatistic
df1
df2
Sig.
3.593
3
12
.046
ANOVA
产量
SumofSquares
df
MeanSquare
F
Sig.
BetweenGroups
2263.482
3
754.494
12.158
.001
WithinGroups
744.715
12
62.060
Total
3008.197
15
2.数据分析:
在0.05和0.01显著性水平下,H0假设都是:
方差相等,从上表中可以看出Sig.=0.046,小于0.05大于0.01,所以在0.05的显著性水平下不接受H0假设,即有显著性差异,但是在0.01的显著性水平下接受H0假设,即无显著性差异。
一实验2及目的
2.某公司希望检测四种类型的轮胎A,B,C,D的寿命(由行驶的里程数决定),见表6.18(单位:
千英里)(数据文件为data6-5.sav),其中每种轮胎应用在随机选择的6辆汽车上。
在显著性水平0.05下判断不同类型轮胎的寿命间是否存在显著性差异?
(数据来源:
《统计学(第三版)》,M.R.斯皮格尔,科学出版社)
表6.18四种轮胎的寿命数据
A
33
38
36
40
31
35
B
32
40
42
38
30
34
C
31
37
35
33
34
30
D
29
34
32
30
33
31
二实验内容
解决问题2的原理:
单因素方差分析
实验步骤:
1.打开数据文件data6-5.sav
2.选择analyze—comparemeans—one-wayANOVA
3.方差相等的齐性检查。
将“历程”、“轮胎”分别移入DependentList以及Factor。
点击Options按钮,选中Homogeneityofvariancetest(方差齐性检验),而后运行
4.多重分析比较。
在One-wayNOVA中单击PostHoc…按钮,选择LSD方法,显著性水平取0.05,单击Options按钮,选中Descripive和Meansplot,对数据进行整体描绘
5.得出结果。
三结果分析
1.数据截图
TestofHomogeneityofVariances
里程
LeveneStatistic
df1
df2
Sig.
3.088
3
20
.050
ANOVA
里程
SumofSquares
df
MeanSquare
F
Sig.
BetweenGroups
77.500
3
25.833
2.388
.099
WithinGroups
216.333
20
10.817
Total
293.833
23
2:
数据分析:
在0.05显著性水平下,H0假设是:
方差相等,从上表中可以看出Sig.=0.050,等于于0.05,所以在0.05的显著性水平下接受H0假设,说明没有显著性差异。
一实验3及目的
3.某超市将同一种商品做3种不同的包装(A)并摆放在3个不同的货架区(B)进行销售试验,随机抽取3天的销售量作为样本,具体资料见表6.20。
要求检验:
在显著性水平0.05下商品包装、摆放位置及其搭配对销售情况是否有显著性影响。
(数据来源:
《应用统计学》耿修林,科学出版社;数据文件:
data6-7.sav)
表6.20销售样本资料
B1
B2
B3
A1
5,6,4
6,8,7
4,3,5
A2
7,8,8
5,5,6
3,6,4
A3
3,2,4
6,6,5
8,9,6
二实验内容
解决问题3的原理:
多因素方差分析原理
实验步骤:
1.分析,需要研究不同包装的产品A和不同货架区对销售量的影响。
这是一个多因素方差分析问题。
2.数据组织,按表6.20的变量名组织成4列数据。
3.变量设置,按Analyze→GeneralLinearModel→Univeariate的步骤打开Univariate对话框。
并将“销售量”变量移入DependentVariable框中作为观测变量,将“包装(A)”、“货架区(B)”移入FixedFactor(s)中作为控制变量。
4.设置方差齐性检验,单击Options按钮,由于方差分析要求不同组别数据方差相等,故应进行方差齐性检验,选中“Homogeneitytests
5.得出结果。
三结果分析
1.数据截图
Between-SubjectsFactors
ValueLabel
N
包装
1
A1
9
2
A2
9
3
A3
9
摆放位置
1
B1
9
2
B2
9
Levene'sTestofEqualityofErrorVariancesa
DependentVariable:
销量
F
df1
df2
Sig.
.754
8
18
.646
Teststhenullhypothesisthattheerrorvarianceofthedependentvariableisequalacrossgroups.
a.Design:
Intercept+casing+place+casing*place
TestsofBetween-SubjectsEffects
DependentVariable:
销量
Source
TypeIIISumofSquares
df
MeanSquare
F
Sig.
CorrectedModel
65.407a
8
8.176
7.612
.000
Intercept
822.259
1
822.259
765.552
.000
casing
.963
2
.481
.448
.646
place
3.185
2
1.593
1.483
.253
casing*place
61.259
4
15.315
14.259
.000
Error
19.333
18
1.074
Total
907.000
27
CorrectedTotal
84.741
26
a.RSquared=.772(AdjustedRSquared=.670)
MultipleComparisons
DependentVariable:
销量
(I)包装
(J)包装
MeanDifference(I-J)
Std.Error
Sig.
95%ConfidenceInterval
LowerBound
UpperBound
LSD
A1
A2
-.44
.489
.375
-1.47
.58
A3
-.11
.489
.823
-1.14
.92
A2
A1
.44
.489
.375
-.58
1.47
A3
.33
.489
.504
-.69
1.36
A3
A1
.11
.489
.823
-.92
1.14
A2
-.33
.489
.504
-1.36
.69
Tamhane
A1
A2
-.44
.778
.924
-2.52
1.63
A3
-.11
.915
.999
-2.58
2.36
A2
A1
.44
.778
.924
-1.63
2.52
A3
.33
.941
.980
-2.19
2.86
A3
A1
.11
.915
.999
-2.36
2.58
A2
-.33
.941
.980
-2.86
2.19
Basedonobservedmeans.
TheerrortermisMeanSquare(Error)=1.074.
2.数据分析:
从上图可以看出,所有的LSD方法的结果中,三组相伴概率Sig.均大于显著性性水平0.05,所以不能拒绝原假设,结果没有显著性影响。
一实验4及目的
4.研究杨树一年生长量与施用氮肥和钾肥的关系。
为了研究这种关系,一共进行了18个样地的栽培实验,测定杨树苗的一年生长量、初始高度、全部实验条件(包括氮肥量和钾肥量)及实验结果(杨树苗的生长量)数据如表6.21,请在显著水平0.05下检验氮肥量、钾肥量及树苗初始高度中哪些对杨树的生长有显著性影响。
(数据来源:
《生物数学模型的统计学基础》李勇,科学出版社;数据文件:
data6-8.sav)
表6.21杨树栽培试验数据
序号
氮肥量
钾肥量
树苗初高
生长量
序号
氮肥量
钾肥量
树苗初高
生长量
1
少
0
4.5
1.85
10
多
0
6.5
2.15
2
少
0
6
2
11
多
0
6
1.99
3
少
0
4
1.6
12
多
0
6.5
2.06
4
少
12.5
6.5
2
13
多
12.5
4
1.93
5
少
12.5
7
2.04
14
多
12.5
6
2.1
6
少
12.5
5
1.91
15
多
12.5
5.5
2.15
7
少
25
7
2.4
16
多
25
5
4.2
8
少
25
5
4.25
17
多
25
6
2.3
9
少
25
5
2.1
18
多
25
5.5
4.25
二实验内容
解决问题4的原理:
多因素方差分析原理
实验步骤:
1.打开数据源文件data6-8.sav
2.变量设置,按Analyze→GeneralLinearModel→Univeariate的步骤打开Univariate对话框。
并将“生长量”变量移入DependentVariable框中作为观测变量,将“氮肥量”、“钾肥量”、“树苗初高”移入FixedFactor(s)中作为控制变量。
3.设置方差齐性检验,单击Options按钮,由于方差分析要求不同组别数据方差相等,故应进行方差齐性检验,选中“Homogeneitytests
4.得出结果
三结果分析
1.数据截图
TestsofBetween-SubjectsEffects
DependentVariable:
生长量
Source
TypeIIISumofSquares
df
MeanSquare
F
Sig.
CorrectedModel
.574a
15
.038
5.006
.179
Intercept
69.453
1
69.453
9078.823
.000
N
6.429E-5
1
6.429E-5
.008
.935
K
.143
2
.072
9.378
.096
height
.144
6
.024
3.143
.261
N*K
.000
0
.
.
.
N*height
.000
0
.
.
.
K*height
.005
2
.003
.332
.751
N*K*height
.000
0
.
.
.
Error
.015
2
.008
Total
77.801
18
CorrectedTotal
.590
17
a.RSquared=.974(AdjustedRSquared=.779)
2.数据分析:
从表格中可以看出,“氮肥量”、“钾肥量”、“树苗初高”的相伴概率Sig.均大于0.05,所以他们对杨树的生长无显著性影响。
第八章实验
一实验3及目的
3.K.K.Smith在烟草杂交繁殖的花上收集到如表8.16所示的数据,要求对以上3组数据两两之间进行相关分析,以0.05的显著性水平检验相关系数的显著性。
(数据来源:
《统计软件SPSS系列应用实践篇》苏金明,电子工业出版社;数据文件:
data8-5.sav)
表8.16K.K.Smith所调查的长度资料
花瓣长
49
44
32
42
32
53
36
39
37
45
41
48
45
39
40
34
37
35
花枝长
27
24
12
22
13
29
14
20
16
21
22
25
23
18
20
15
20
13
花萼长
19
16
12
17
10
19
15
14
15
21
14
22
22
15
14
15
15
16
实验原理:
本章实验原理主要包括二元变量相关性分析(3、4、5题)和偏相关分析(6)以及距离分析(7)
实验步骤:
1.打开相应数据文件
2.运行Analyze—Correlate—bivariate,填好Variables框,选择Pearson相关系数;在testofsignificance中选择单尾或者双尾检验,单击options按钮,在打开对话框中选择Meansandstandarddeviations和cross-productdeviationandcovariances选项
3.运行,得出结果。
三结果分析
第3题实验结果图表
Correlations
花瓣长
花枝长
花瓣长
PearsonCorrelation
1
.955**
Sig.(2-tailed)
.000
SumofSquaresandCross-products
606.444
487.667
Covariance
35.673
28.686
N
18
18
花枝长
PearsonCorrelation
.955**
1
Sig.(2-tailed)
.000
SumofSquaresandCross-products
487.667
430.000
Covariance
28.686
25.294
N
18
18
**.Correlationissignificantatthe0.01level(2-tailed).
Correlations
花枝长
花萼长
花枝长
PearsonCorrelation
1
.678**
Sig.(2-tailed)
.002
SumofSquaresandCross-products
430.000
191.000
Covariance
25.294
11.235
N
18
18
花萼长
PearsonCorrelation
.678**
1
Sig.(2-tailed)
.002
SumofSquaresandCross-products
191.000
184.500
Covariance
11.235
10.853
N
18
18
**.Correlationissignificantatthe0.01level(2-tailed).
Correlations
花萼长
花瓣长
花萼长
PearsonCorrelation
1
.797**
Sig.(2-tailed)
.000
SumofSquaresandCross-products
184.500
266.667
Covariance
10.853
15.686
N
18
18
花瓣长
PearsonCorrelation
.797**
1
Sig.(2-tailed)
.000
SumofSquaresandCross-products
266.667
606.444
Covariance
15.686
35.673
N
18
18
**.Correlationissignificantatthe0.01level(2-tailed).
数据分析:
从上面三个图可以看出,Sig.值为0.00和0.002均小于0.05,所以,显著性很明显。
一试验4及目的
4.试确定1962-1988年安徽省国民收入与城乡居民储蓄存款余额两个变量间的线性相关性,数据如表8.17所示。
(数据来源:
《数据统计与管理》1990年第5期,中国商场统计研究会主办;数据文件:
data8-6.sav)
表8.171962-1988年安徽省国民收入数据表
年份
1962
1963
1964
1965
1966
1967
1968
1969
1970
1971
1972
1973
1974
1975
国民收入(亿元)
34.61
35.67
39.52
47.32
54.14
50.86
49.69
51.61
65.06
72.57
77.72
83.57
82
87.44
存款余额(亿元)
0.59
0.71
0.85
1
1.22
1.14
1.32
1.28
1.35
1.6
1.87
4.2
2.55
2.61
年份
1976
1977
1978
1979
1980
1981
1982
1983
1984
1985
1986
1987
1988
国民收入(亿元)
95.63
97.23
103.81
116.29
127.87
150.29
161.47
180.2
221.17
271.81
310.53
357.86
444.78
存款余额(亿元)
2.74
3.13
3.91
5.75
8.76
12.19
16.36
20.95
28.32
38.43
55.43
74.2
89.83
二实验步骤及内容
偏相关分析的步骤:
1.打开相应数据文件
2.选择Analyze→Correlate→Partial,指定分析变量和数据变量
3.运行,得出结果
第4题实验结果图表
Correlations
国民收入
存款余额
国民收入
PearsonCorrelation
1
.976**
Sig.(1-tailed)
.000
SumofSquaresandCross-products
293170.567
64137.265
Covariance
11275.791
2466.818
N
27
27
存款余额
PearsonCorrelation
.976**
1
Sig.(1-tailed)
.000
SumofSquaresandCross-products
64137.265
14723.639
Covariance
2466.818
566.294
N
27
27
**.Correlationissignificantatthe0.01level(1-tailed).
数据分析:
从上图可以看出,Sig.值为0.00小于0.05,所以,线性相关具有显著性。
一试验5及目的
5.某高校抽样得到10名短跑运动员,测出100米的名次和跳高的名次如表8.18,问这两个名次是否在0.05的显著性水平下具有相关性。
(数据来源:
《应用统计学:
数据统计方法、数据获取与SPSS应用》马庆国,科学出版社;数据文件:
data8-7.sav)
表8.1810名运动员的100米及跳高名次
百米名次
1
2
3
4
5
6
7
8
9
10
跳高名次
4
3
1
5
2
7
10
8
9
6
二实验步骤及内容
距离分析的步骤:
1.打开相应数据文件
2.运行按Analyze→Correlate→distance,在computerdistances中选择betweenvariables单选框,定义进行变量间的距离分析,在measure中选择dissmilarities,求解其不相似测度;单击measures按钮在interval下拉列表中选择euclideandista