应用统计spss分析报告.docx
《应用统计spss分析报告.docx》由会员分享,可在线阅读,更多相关《应用统计spss分析报告.docx(22页珍藏版)》请在冰点文库上搜索。
应用统计spss分析报告
学生姓名:
肖浩鑫学号:
31407371
一、实验项目名称:
实验报告(三)
二、实验目的和要求
(一)变量间关系的度量:
包括绘制散点图,相关系数计算及显著性检验;
(二)一元线性回归:
包括一元线性回归模型及参数的最小二乘估计,回归方程的评价及显著性检验,利用回归方程进行估计和预测;
(三)多元线性回归:
包括多元线性回归模型及参数的最小二乘估计,回归方程的评价及显著性检验等,多重共线性问题与自变量选择,哑变量回归;
三、实验内容
1.从某一行业中随机抽取12家企业,所得产量与生产费用的数据如下:
企业编号
产量(台)
生产费用(万元)
企业编号
产量(台)
生产费用(万元)
1
40
130
7
84
165
2
42
150
8
100
170
3
50
155
9
116
167
4
55
140
10
125
180
5
65
150
11
130
175
6
78
154
12
140
185
(1)绘制产量与生产费用的散点图,判断二者之间的关系形态。
(2)计算产量与生产费用之间的线性相关系数,并对相关系数的显著性进行检验(
),并说明二者之间的关系强度。
2.下面是7个地区2000年的人均国内生产总值(GDP)和人均消费水平的统计数据:
地区
人均GDP(元)
人均消费水平(元)
北京
22460
7326
辽宁
11226
4490
上海
34547
11546
江西
4851
2396
河南
5444
2208
贵州
2662
1608
陕西
4549
2035
(1)绘制散点图,并计算相关系数,说明二者之间的关系。
(2)人均GDP作自变量,人均消费水平作因变量,利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。
(3)计算判定系数和估计标准误差,并解释其意义。
(4)检验回归方程线性关系的显著性(
)
(5)如果某地区的人均GDP为5000元,预测其人均消费水平。
(6)求人均GDP为5000元时,人均消费水平95%的置信区间和预测区间。
3.随机抽取10家航空公司,对其最近一年的航班正点率和顾客投诉次数进行调查,数据如下:
航空公司编号
航班正点率(%)
投诉次数(次)
1
81.8
21
2
76.6
58
3
76.6
85
4
75.7
68
5
73.8
74
6
72.2
93
7
71.2
72
8
70.8
122
9
91.4
18
10
68.5
125
(1)用航班正点率作自变量,顾客投诉次数作因变量,估计回归方程,并解释回归系数的意义。
(2)检验回归系数的显著性(
)。
(3)如果航班正点率为80%,估计顾客的投诉次数。
4.某汽车生产商欲了解广告费用(x)对销售量(y)的影响,收集了过去12年的有关数据。
通过计算得到下面的有关结果:
方差分析表
变差来源
df
SS
MS
F
SignificanceF
回归
2.17E-09
残差
40158.07
—
—
总计
11
1642866.67
—
—
—
参数估计表
Coefficients
标准误差
tStat
P-value
Intercept
363.6891
62.45529
5.823191
0.000168
XVariable1
1.420211
0.071091
19.97749
2.17E-09
(1)完成上面的方差分析表。
(2)汽车销售量的变差中有多少是由于广告费用的变动引起的?
(3)销售量与广告费用之间的相关系数是多少?
(4)写出估计的回归方程并解释回归系数的实际意义。
(5)检验线性关系的显著性(a=0.05)。
5.随机抽取7家超市,得到其广告费支出和销售额数据如下
超市
广告费支出/万元
销售额/万元
A
1
19
B
2
32
C
4
44
D
6
40
E
10
52
F
14
53
G
20
54
(1)用广告费支出作自变量
,销售额为因变量
,求出估计的回归方程。
(2)检验广告费支出与销售额之间的线性关系是否显著(a=0.05)。
(3)绘制关于
的残差图,你觉得关于误差项
的假定被满足了吗?
(4)你是选用这个模型,还是另寻找一个该更好的模型?
6.一家电气销售公司的管理人员认为,每月的销售额是广告费用的函数,并想通过广告费用对月销售额作出估计。
下面是近8个月的销售额与广告费用数据
月销售收入y(万元)
电视广告费用
(万元)
报纸广告费用
(万元)
96
5.0
1.5
90
2.0
2.0
95
4.0
1.5
92
2.5
2.5
95
3.0
3.3
94
3.5
2.3
94
2.5
4.2
94
3.0
2.5
(1)用电视广告费用作自变量,月销售额作因变量,建立估计的回归方程。
(2)用电视广告费用和报纸广告费用作自变量,月销售额作因变量,建立估计的回归方程,并说明回归系数的意义。
(3)上述
(1)和
(2)所建立的估计方程,电视广告费用的系数是否相同?
对回归系数分别解释。
(4)根据
(1)和
(2)所建立的估计方程,说明它们的R2的意义。
18
3700
450
2261
9880
19
5000
340
3595
10760
20
2240
150
578
9620
用SPSS进行逐步回归,确定估计方程,并给出销售价格的预测值及95%的置信区间和预测区间。
9.为分析某行业中的薪水有无性别歧视,从该行业中随机抽取15名员工,有关的数据如下
月薪y(元)
工龄
性别(1=男,0=女)
1548
3.2
1
1629
3.8
1
1011
2.7
0
1229
3.4
0
1746
3.6
1
1528
4.1
1
1018
3.8
0
1190
3.4
0
1551
3.3
1
985
3.2
0
1610
3.5
1
1432
2.9
1
1215
3.3
0
990
2.8
0
1585
3.5
1
进行回归并对结果进行分析。
四、实验数据记录与分析
(基本要求:
1.根据题号顺序记录软件输出结果并分析;2.结果可来自对SPSS或Excel进行操作的输出,二选一即可。
)
1、
(1)
由图可知,产量与生产费用呈正线性相关
(2)
相关性
产量
生产费用
产量
Pearson相关性
1
.920**
显著性(双侧)
.000
N
12
12
生产费用
Pearson相关性
.920**
1
显著性(双侧)
.000
N
12
12
**.在.01水平(双侧)上显著相关。
产量与生产费用之间的线性相关系数为0.0920,显著相关
2、
(1)
相关性
人均GDP
人均消费水平
人均GDP
Pearson相关性
1
.998**
显著性(双侧)
.000
N
7
7
人均消费水平
Pearson相关性
.998**
1
显著性(双侧)
.000
N
7
7
**.在.01水平(双侧)上显著相关。
人均GDP与人均消费水平呈正线性相关,相关系数为0.998
(2)
系数a
模型
非标准化系数
标准系数
t
Sig.
B
标准误差
试用版
1
(常量)
734.693
139.540
5.265
.003
人均GDP
.309
.008
.998
36.492
.000
a.因变量:
人均消费水平
回归方程:
y=734.693+0.309x
含义:
人均GDP每增加1元,人均消费就增加0.309元
(3)
模型汇总
模型
R
R方
调整R方
标准估计的误差
1
.998a
.996
.996
247.30347
a.预测变量:
(常量),人均GDP。
人均GDP对人均消费的影响达到99.6%
(4)F检验
Anovab
模型
平方和
df
均方
F
Sig.
1
回归
8.144E7
1
8.144E7
1331.692
.000a
残差
305795.034
5
61159.007
总计
8.175E7
6
a.预测变量:
(常量),人均GDP。
b.因变量:
人均消费水平
t检验
系数a
模型
非标准化系数
标准系数
t
Sig.
B
标准误差
试用版
1
(常量)
734.693
139.540
5.265
.003
人均GDP
.309
.008
.998
36.492
.000
b.因变量:
人均消费水平
(5)
y=734.693+0.309*5000=2279.693
如果某地区的人均GDP为5000元,预测其人均消费水平为2279.693元
(6)
人均GDP为5000元时,人均消费水平95%的置信区间为[2050.84067,2505.91078],预测区间为[1680.94287,2875.80857]。
3、
(1)
系数a
模型
非标准化系数
标准系数
t
Sig.
B
标准误差
试用版
1
(常量)
430.189
72.155
5.962
.000
航班正点率
-4.701
.948
-.869
-4.959
.001
a.因变量:
投诉次数
回归方程:
y=430.189-4.701x
回归系数的含义:
投诉次数每增加一次,航班正点率下降4.701%
(2)由于Sig=0.001<0.05显著
(3)80=430.189-4.701x=74
如果航班正点率为80%,估计顾客的投诉次数为74次
4、
(1)
3、
5、
变差来源
df
SS
MS
F
SignificanceF
回归
1
1602708.6
1602708.6
399.1000065
2.17E-09
残差
10
40158.07
4015.807
—
—
总计
11
1642866.67
—
—
—
(2)
R^2=SSR/SST=1602708.6/1642866.67=97.6%
汽车销售量的变差中有97.6%是由于广告费用的变动引起的
(3)
R=根号R^2=0.9877
销售量与广告费用之间的相关系数是0.9877
(4)
估计的回归方程:
y=363.6891+1.420211x
回归系数为1.420211,表示广告费用每增加一个单位,汽车销售量平均增加1.420211个单位
(5)
回归系数的检验:
p=2.17E-09<α,回归系数不等于0,显著回归直线的检验:
p=2.17E-09<α,回归直线显著
5、
(1)
系数a
模型
非标准化系数
标准系数
t
Sig.
B
标准误差
试用版
1
(常量)
29.399
4.807
6.116
.002
广告支出费用
1.547
.463
.831
3.339
.021
a.因变量:
销售额
回归方程估计是:
y=29.399+1.547x
(2)F检验
Anovab
模型
平方和
df
均方
F
Sig.
1
回归
691.723
1
691.723
11.147
.021a
残差
310.277
5
62.055
总计
1002.000
6
a.预测变量:
(常量),广告支出费用。
b.因变量:
销售额
Sig=0.021<0.05显著
t检验
系数a
模型
非标准化系数
标准系数
t
Sig.
B
标准误差
试用版
1
(常量)
29.399
4.807
6.116
.002
广告支出费用
1.547
.463
.831
3.339
.021
c.因变量:
销售额
Sig=0.002<0.05显著
(3)
残差不全相等
(4)应考虑其他模型,可考虑对数曲线模型:
y=b0+b1ln(x)=22.471+11.576ln(x)
6、
(1)
系数a
模型
非标准化系数
标准系数
t
Sig.
B
标准误差
试用版
1
(常量)
88.638
1.582
56.016
.000
电视广告费用
1.604
.478
.808
3.357
.015
a.因变量:
月销售收入
估计的回归方程:
y=88.64+1.6x
(2)、
系数a
模型
非标准化系数
标准系数
t
Sig.
B
标准误差
试用版
1
(常量)
83.230
1.574
52.882
.000
电视广告费用
2.290
.304
1.153
7.532
.001
报纸广告费用
1.301
.321
.621
4.057
.010
a.因变量:
月销售收入
估计的回归方程:
y=83.23+2.29x1+1.301x2
回归系数的意义:
报纸广告费用不变的情况下,电视广告费用每增加1万元,月销售额增加2.29万元;电视广告费用不变的情况下,报纸广告费用每增加1万元,月销售额增加1.301万元。
(3)不相同,
(1)中表示电视广告费用每增加1万元,月销售额增加1.6万元;
(2)中表示电视广告费用每增加1万元,月销售额增加2.29万元
(4)
(1)中的含义为电视广告费用对月销售额达到的影响程度,
(2)中的含义为电视广告费用和报纸广告费用对月销售额达到的影响程度
7、
系数a
模型
非标准化系数
标准系数
t
Sig.
B
标准误差
试用版
1
(常量)
-.591
505.004
-.001
.999
降雨量
22.386
9.601
.415
2.332
.080
温度
327.672
98.798
.590
3.317
.029
a.因变量:
收获量
Anovab
模型
平方和
df
均方
F
Sig.
1
回归
31226615.257
2
15613307.629
228.444
.000a
残差
273384.743
4
68346.186
总计
31500000.000
6
a.预测变量:
(常量),温度,降雨量。
b.因变量:
收获量
估计的回归方程:
y=-0.591+22.386x1+327.672x2
回归线性显著
降雨量的回归系数不显著,温度的显著x1与x2的相关系数rx1x2=0.965,存在多重共线性
8、
系数a
模型
非标准化系数
标准系数
t
Sig.
B
标准误差
试用版
1
(常量)
895.020
535.833
1.670
.112
房产估计
1.351
.140
.916
9.673
.000
2
(常量)
11.653
592.972
.020
.985
房产估计
.961
.200
.651
4.794
.000
使用面积
.163
.066
.336
2.470
.024
a.因变量:
销售价格
估计的回归方程:
y=11.653+0.163x1+0.961x2
销售价格的预测值及95%的置信区间和预测区间:
9、
SUMMARYOUTPUT
回归统计
MultipleR
0.943391
RSquare
0.889987
AdjustedRSquare
0.871652
标准误差
96.79158
观测值
15
方差分析
df
SS
MS
F
SignificanceF
回归分析
2
909488.4
454744.2
48.53914
1.77E-06
残差
12
112423.3
9368.61
总计
14
1021912
Coefficients
标准误差
tStat
P-value
Lower95%
Upper95%
下限95.0%
上限95.0%
Intercept
732.0606
235.5844
3.107425
0.009064
218.7664
1245.355
218.7664
1245.355
工龄
111.2202
72.08342
1.542937
0.148796
-45.8361
268.2765
-45.8361
268.2765
性别(1=男,0=女)
458.6841
53.4585
8.58019
1.82E-06
342.208
575.1601
342.208
575.1601
拟合优度良好,方程线性显著,工龄线性不显著,性别线性显著