spss实践题分析及答案二.docx
《spss实践题分析及答案二.docx》由会员分享,可在线阅读,更多相关《spss实践题分析及答案二.docx(36页珍藏版)》请在冰点文库上搜索。
spss实践题分析及答案二
期末实践考查
一、一家消费者调查有限公司,它为许多企业提供消费者态度和消费者行为的调查。
在一项研究中,客户要求调查消费者的消费特征,此特征可以用来预测用户使用信用卡的支付金额。
研究人员收集了50位消费者的年收入、家庭人口和每年使用信用卡支付的金额数据。
试按照客户要求进行分析,给出分析报告(数据见附表)。
DescriptiveStatistics
Mean
Std.Deviation
N
消费金额(元)
50
年收入(元)
50
家庭人口(人)
50
Correlations
消费金额(元)
年收入(元)
家庭人口(人)
PearsonCorrelation
消费金额(元)
.631
.753
年收入(元)
.631
.173
家庭人口(人)
.753
.173
Sig.(1-tailed)
消费金额(元)
.
.000
.000
年收入(元)
.000
.
.115
家庭人口(人)
.000
.115
.
N
消费金额(元)
50
50
50
年收入(元)
50
50
50
家庭人口(人)
50
50
50
VariablesEntered/Removedb
Model
VariablesEntered
VariablesRemoved
Method
1
家庭人口(人),年收入(元)
.
Enter
a.Allrequestedvariablesentered.b.DependentVariable:
消费金额(元)
ModelSummaryb
Model
R
RSquare
AdjustedRSquare
Std.ErroroftheEstimate
1
.909a
.826
.818
ANOVAb
Model
SumofSquares
df
MeanSquare
F
Sig.
1
Regression
2
.000a
Residual
47
Total
49
Coefficientsa
Model
UnstandardizedCoefficients
StandardizedCoefficients
t
Sig.
B
Std.Error
Beta
1
(Constant)
.000
年收入(元)
.033
.004
.516
.000
家庭人口(人)
.664
.000
结果分析:
由题目可知客户要求,是根据消费者年收入、家庭人口来预测其每年使用信用卡支付的金额数据,属于多元线性回归问题,其中年收入和家庭人口
看作两个自变量,每年信用卡支付金额看作因变量。
由分析得:
:
信用卡支付金额
:
年收入
:
家庭人口
拟合优度检验
为0.818,回归方程能很好的代表样本数据。
回归方程F检验和回归系数T检验的相伴概率都小于显著性水平,拒绝零假设即回归方程和回归系数都具显著型。
二、下表为运动员与大学生的身高(cm)与肺活量(cm3)的数据,考虑到身高与肺活量有关,而一般运动员的身高高于大学生,为进一步分析肺活量的差异是否由于体育锻炼所致,试作控制身高变量的协方差分析,并给出分析报告。
运动员
大学生
身高
肺活量
身高
肺活量
4300
3850
4100
4300
4800
4000
5400
4000
4800
4800
4500
4780
3700
5250
4250
4800
5000
3700
3600
4050
3450
4100
3800
3300
3450
3250
3600
3200
3950
4000
4150
3450
3250
4100
3650
3950
3500
3900
3450
3850
Between-SubjectsFactors
ValueLabel
N
类别
0
0
20
1
1
20
TestsofBetween-SubjectsEffects
DependentVariable:
肺活量
Source
TypeIIISumofSquares
df
MeanSquare
F
Sig.
CorrectedModel
a
2
.000
Intercept
1
.251
身高
1
.002
类别
1
.004
Error
37
Total
40
CorrectedTotal
39
a.RSquared=.553(AdjustedRSquared=.529
结果分析:
控制变量的相伴概率值是,小于显著性水平0.05,因此拒绝零假设,故在剔除身高对肺活量的影响前提下,是否经常进行体育锻炼对肺活量有显著影响;另外协变量相伴概率为,说明身高的不同水平对肺活量也有显著影响。
三、甲地区为大城市,乙地区为县城,丙地区为农村。
某地分别调查了上述三类地区8岁男生三项身体生长发育指标:
身高、体重和胸围,数据见下表,问:
三类地区之间男生三项身体生长发育指标的差异有无显著性?
试就此问题进行分析并给出分析报告。
结果分析:
由方差齐次性检验表可知,甲乙丙三个地区的的身高、体重和胸围的方差检验相伴概率都大于显著性水平,因此接受零假设,即三个地区的身高、体重和胸围方差相同没有显著性差异,即不同地区,身高、体总和胸围各总体均值服从方差相同的正态分布,因此可以用下面的单因素方差检验。
身高:
相伴概率为0.000小于显著性水平,则各地区身高有显著性差异。
体重:
相伴概率为0.000小于显著性水平,则各地区体重有显著性差异。
胸围:
相伴概率为0.001小于显著性水平,则各地区胸围有显著性差异。
再由LSD,S-N-K和图表分析可知,甲地区(城市)8岁男孩身高和胸围与乙(县城)、丙(农村)地区有显著性差异,乙地区(县城)8岁男孩体重与甲(城市)、丙(农村)地区有显著性差异。
四、某地区10名健康儿童头发和全血中的硒含量(1000ppm)如下,试作发硒与血硒的相关分析,并给出分析报告。
编号
发硒
血硒
1
2
3
4
5
6
7
8
9
10
74
66
88
69
91
73
66
96
58
73
13
10
13
11
16
9
7
14
5
10
DescriptiveStatistics
Mean
Std.Deviation
N
发硒
10
血硒
10
Correlations
发硒
血硒
发硒
PearsonCorrelation
1
.872**
Sig.(2-tailed)
.001
N
10
10
血硒
PearsonCorrelation
.872**
1
Sig.(2-tailed)
.001
N
10
10
结果分析:
由分析可知,要进行发硒和血硒两个定距变量的相关分析。
由上图表可得发硒和血硒的pearson相关系数为0.872,为高度相关。
假设检验得出的相伴概率0.001小于显著水平0.01,因此拒绝零假设,即可以用它们的样本相关系数r代替总体相关系数ρ。
五、某地29名13岁男童身高(cm)、体重(kg)和肺活量(ml)的数据如下表,试对该资料作控制体重影响作用的身高与肺活量相关分析,并给出分析报告。
编号
身高(cm)
体重(kg)
肺活量(ml)
编号
身高(cm)
体重(kg)
肺活量(ml)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
1750
2000
2750
2500
2750
2000
2750
1500
2500
2250
3000
1250
2750
1750
2250
16
17
18
19
20
21
22
23
24
25
26
27
28
29
1750
2000
2250
2750
2000
1750
2250
2750
2500
2000
1750
2250
2500
1750
Correlations
ControlVariables
体重(kg)
肺活量(ml)
身高(cm)
-none-a
体重(kg)
Correlation
.613
.719
Significance(2-tailed)
.
.000
.000
df
0
27
27
肺活量(ml)
Correlation
.613
.588
Significance(2-tailed)
.000
.
.001
df
27
0
27
身高(cm)
Correlation
.719
.588
Significance(2-tailed)
.000
.001
.
df
27
27
0
身高(cm)
体重(kg)
Correlation
.337
Significance(2-tailed)
.
.079
df
0
26
肺活量(ml)
Correlation
.337
Significance(2-tailed)
.079
.
df
26
0
a.Cellscontainzero-order(Pearson)correlations.
结果分析:
由上表分析可知,体重和肺活量的相关系数为0.613,身高和体重的相关系数为0.719,身高和肺活量的相关系数为0.588,三者之间为中度相关。
身高对体重和肺活量都有影响,剔除它的影响,采用偏相关分析,体重和肺活量相关系数为0.337,为低度相关,相伴概率值为0.079,大于显著性水平,因此接受原假设,即不可以用样本相关系数代替总体相关系数。
六、某医师测得10名3岁儿童的身高(cm)、体重(kg)和体表面积(cm2)资料如下。
试分析“体表面积”可能满足的数学模型,并给出分析报告。
儿童编号
体表面积(Y)
身高(X1)
体重(X2)
1
2
3
4
5
6
7
8
9
10
Correlations
体表面积(Y)
身高(X1)
体重(X2)
PearsonCorrelation
体表面积(Y)
.869
.943
身高(X1)
.869
.863
体重(X2)
.943
.863
Sig.(1-tailed)
体表面积(Y)
.
.001
.000
身高(X1)
.001
.
.001
体重(X2)
.000
.001
.
N
体表面积(Y)
10
10
10
身高(X1)
10
10
10
体重(X2)
10
10
10
VariablesEntered/Removedb
Model
VariablesEntered
VariablesRemoved
Method
1
体重(X2),身高(X1)
.
Enter
a.Allrequestedvariablesentered.
b.DependentVariable:
体表面积(Y)
ModelSummaryb
Model
R
RSquare
AdjustedRSquare
Std.ErroroftheEstimate
1
.950a
.902
.874
.143346
a.Predictors:
(Constant),体重(X2),身高(X1)
b.DependentVariable:
体表面积(Y)
ANOVAb
Model
SumofSquares
df
MeanSquare
F
Sig.
1
Regression
2
.661
.000a
Residual
.144
7
.021
Total
9
a.Predictors:
(Constant),体重(X2),身高(X1)b.DependentVariable:
体表面积(Y)
Coefficientsa
Model
UnstandardizedCoefficients
StandardizedCoefficients
t
Sig.
B
Std.Error
Beta
1
(Constant)
.649
身高(X1)
.069
.075
.215
.919
.389
体重(X2)
.184
.057
.758
.014
结果分析:
由题目要求可知,这是一个多元线性回归问题。
上述图表知,体表面积与身高体重的关系为
其中
:
体表面积
:
身高
:
体重
拟合优度检验
为0.874,回归方程能很好的代表样本数据。
回归方程F检验和回归系数T检验的相伴概率都小于显著性水平,拒绝零假设即回归方程和回归系数都具显著型。
七、某地1963年调查得儿童年龄(岁)X与锡克试验阴性率(%)Y的资料如下,试分析锡克试验阴性率,并给出分析报告。
年龄(岁)
X
锡克试验阴性率(%)
Y
1
2
3
4
5
6
7
ModelDescription
ModelName
MOD_2
DependentVariable
1
锡克试验阴性率(%)
Equation
1
Inverse
2
Cubic
3
Sa
IndependentVariable
年龄
Constant
Included
VariableWhoseValuesLabelObservationsinPlots
Unspecified
ToleranceforEnteringTermsinEquations
.0001
ModelSummaryandParameterEstimates
DependentVariable:
锡克试验阴性率(%)
Equation
ModelSummary
ParameterEstimates
RSquare
F
df1
df2
Sig.
Constant
b1
b2
b3
Inverse
.975
1
5
.000
Cubic
.994
3
3
.001
.381
S
.983
1
5
.000
Theindependentvariableis年龄.
结果分析:
首先由散点图可知,锡克试验阴性率与年龄为非线性关系,因此采用曲线拟合。
由表格可知,最佳拟合曲线为三次曲线(cubic),拟合优度
为0.994,最佳拟合曲线方程为:
:
:
锡克试验阴性率(%)
:
年龄
八、某单位研究饮食中缺乏维生素E与肝中维生素A含量的关系,将同种属的大白鼠按性别相同,年龄、体重相近者配成对,共8对,并将每对中的两头白鼠随机分到正常饲料组和维生素E缺乏组,过一定时期,测得其肝中维生素A含量。
试分析不同饲料的大白鼠肝中维生素A含量有无差别,给出分析报告(数据见附表)
结果分析:
同种属的大白鼠按性别相同,年龄、体重相近者配成对,该问题属于两配对样本t检验。
由分析得两配对样本t检验的相伴概率值为:
0.004,小于显著性水平0.05,因此拒绝零假设,即大白鼠食物中维生素E的不同含量与肝中维生素A的含量有显著性差异。
九、测得西北某城市1971~2007年1月份平均气温数据(见附表)。
分析该城市90年代前后的温度有无显著差异,给出分析报告。
结果分析:
由于90年代前后1月份平均气温之间相互独立,属于两独立样本t检验的问题。
由分析可得,方差齐次性性F检验的相伴概率是0.438,大于显著性水平0.05,因此接受零假设,即90年代前后方差相同。
,因此拒绝零假设,即该城市90年代前后的温度有显著差异。
《统计分析软件》试(题)卷
班级xxx班姓名xxx学号xxx
题号
一
二
三
四
五
六
总成绩
成绩
说明:
1.本试卷分析结果写在每个题目下面(即所留空白处);
2.考试时间为100分钟;
3.每个试题20分。
一、(20分)已经给出某个班的学生基本情况及其学习成绩的两个SPSS数据文件,学生成绩一.sav;学生成绩二.sav。
要求:
(1)将所给的两个SPSS数据文件“学生成绩一.sav”与“学生成绩二.sav”合并,并保存为“成绩.sav.”
(2)对所建立的数据文件“成绩.sav”进行以下处理:
1)按照性别求出男、女数学成绩的各种统计量(包括平均成绩、标准差等)。
2)计算每个学生的总成绩、并按照总成绩的大小进行排序
3)把数学成绩分成优、良、中三个等级,规则为优(
≥85),良(75≤
≤84),中(
≤74),并对优良中的人数进行统计。
分析:
(2)
描述统计量
性别
N
极小值
极大值
均值
标准差
男
数学
4
有效的N(列表状态)
4
女
数学
16
有效的N(列表状态)
16
注:
成绩优良表示栏位sxcj优为1良为2中为3
由表统计得,成绩为优的同学有4人,占总人数的20%;良的同学有12人,占总人数的60%;中的同学有4人,占总人数的40%。
二、(20分)为了解笔记本电脑的市场情况,针对笔记本电脑的3种品牌,进行了满意度调查,随机访问了30位消费者,让他们选出自己满意的品牌,调查结果见下表,其中变量“职业”的取值中,1表示文秘人员,2表示管理人员,3表示工程师,4表示其他人;3个品牌变量的取值中,1表示选择,0表示未选数据见Excel数据文件“e”。
根据所给数据完成以下问题
(1)将所给数据的Excel文件导入到SPSS中,要求SPSS数据文件写出数据结构(包括变量名,变量类型,变量值标签等)命,并保存为:
“调查.Sav”。
(2)试利用多选项分析,利用频数分析来分析消费者对不同品牌电脑的满意度状况;分析不同职业消费者对笔记本品牌满意度状况。
分析:
CaseSummary
Cases
Valid
Missing
Total
N
Percent
N
Percent
N
Percent
$set1a
29
96.7%
1
3.3%
30
100.0%
a.Group
$set1Frequencies
Responses
PercentofCases
N
Percent
消费者的不同品牌的满意程度a
未选
56
64.4%
193.1%
选择
31
35.6%
106.9%
Total
87
100.0%
300.0%
由表可得,Total项是应答次数,本例剔除缺失数据后为87次,第三列是应答百分比,分母87,第四列也是百分比,分母是样本29。
被调查者中有64.4%的人购买电脑未选择品牌,36.6%的人选择了电脑品牌。
CaseSummary
Cases
Valid
Missing
Total
N
Percent
N
Percent
N
Percent
职业*$set1
29
96.7%
1
3.3%
30
100.0%
职业*$set1Crosstabulation
消费者的不同品牌的满意程度a
Total
未选
选择
职业
文秘人员
Count
11
7
6
管理人员
Count
4
8
4
工程师
Count
16
8
8
其他人
Count
25
8
11
Total
Count
56
31
29
Percentagesandtotalsarebasedonrespondents.
a.Group
分析得,购买电脑未选择品牌的人为文秘人员的有11人,工程师有16人,管理人员的最少,大部分人员为其他人;而选择品牌的人数都差不多。
三、(20分)入户推销有五种方法。
某大公司想比较这五种方法有无显著的效果差异,设计了一项实验。
从尚无推销经验的应聘人员中随机挑选一部分,并随机地将他们分为五个组,每组用一种推销方法培训。
一段时期后得到他们在一个月内的推销额,如下表所示(SPSS数据见“”):
第一组
第二组
第三组
第四组
17.5
第五组
1.利用单因素方差分析方法分析这五种推销方式是否存在显著差异。
2.绘制各组的均值对比图,并利用LSD方法进行多重比较检验,说明那组推销方式最好?
分析:
TestofHomogeneityofVariances
销售额
LeveneStatistic
df1
df2
Sig.
4
30
.113
不同推销方式下销售额的方差齐性检验值为2.046,对应的P值为0.113,如果显著水平为0.05,由于P值大于显著水平
,因此应接受原假设,认为推销方式没有对销售额产生影响,不同推销方式对销售额的影响全为0.
ANOVA
销售额
SumofSquares
df
MeanSquare
F
Sig.
BetweenG