探索影响工业GDP增长的因素.doc
《探索影响工业GDP增长的因素.doc》由会员分享,可在线阅读,更多相关《探索影响工业GDP增长的因素.doc(10页珍藏版)》请在冰点文库上搜索。
探索影响工业GDP增长的因素
统计学院2001级王明明郝夏
目前,我国经济正处在高速稳定增长的阶段。
而根据以前学过的知识,我们知道GDP主要是靠工业拉动的,因此,我们想探索一下哪些因素是影响工业GDP的主要因素。
考虑到目前工业的生产特点:
固定资产投资较大,需要能源的推动,我们猜想这是影响工业GDP的主要因素。
于是,我们尝试用计量经济学的知识验证我们的猜想,并力图建立一个简单的数量模型来解释它们之间的关系。
以下是数据分析:
1.分别探索固定资产投资和能源消费量对工业GDP的影响
首先,我们讨论单因素的模型,第一个是固定资产投资与工业GDP。
模型1:
INDUSG=C+β*FXA+u
DependentVariable:
INDUSG
Method:
LeastSquares
Date:
12/15/03Time:
17:
15
Sample:
19852002
Includedobservations:
18
Variable
Coefficient
Std.Error
t-Statistic
Prob.
C
1258.981
588.7161
2.138520
0.0482
FXA
1.118321
0.027486
40.68678
0.0000
R-squared
0.990427
Meandependentvar
20313.41
AdjustedR-squared
0.989829
S.D.dependentvar
15007.39
S.E.ofregression
1513.518
Akaikeinfocriterion
17.58670
Sumsquaredresid
36651784
Schwarzcriterion
17.68563
Loglikelihood
-156.2803
F-statistic
1655.414
Durbin-Watsonstat
0.841509
Prob(F-statistic)
0.000000
注释:
FXA――固定资产投资额(单位:
元)
INDUSG――工业GDP
t=2.13840.69
(R2=0.9904,F=1655.4DW=0.8415)
由t统计量可以看出,固定资产投资(FXA)对工业GDP的影响十分显著。
从R2和F统计量可以看出模型拟合得非常好。
但是D-W
下面我们接着做了能源消费量与工业GDP的模型
模型2:
INDUSG=C+β*POW_US+u
DependentVariable:
INDUSG
Method:
LeastSquares
Date:
12/15/03Time:
17:
14
Sample:
19852002
Includedobservations:
18
Variable
Coefficient
Std.Error
t-Statistic
Prob.
C
-51613.80
7585.126
-6.804607
0.0000
POW_US
0.626075
0.064895
9.647576
0.0000
R-squared
0.853313
Meandependentvar
20313.41
AdjustedR-squared
0.844145
S.D.dependentvar
15007.39
S.E.ofregression
5924.689
Akaikeinfocriterion
20.31608
Sumsquaredresid
5.62E+08
Schwarzcriterion
20.41501
Loglikelihood
-180.8447
F-statistic
93.07572
Durbin-Watsonstat
0.192529
Prob(F-statistic)
0.000000
注释:
POW_US――能源消费量(单位:
万吨标准煤)
INDUSG=-51613.79789+0.6260746823*POW_US
t=-6.8049.647
(R2=0.853,F=93.07DW=0.1925)
由t统计量可以看出,能源消费量(POW_US)对工业GDP的影响十分显著;
但从R2和F统计量可以看出模型整体拟合得不是很好;
同时D-W≈0表明残差存在严重的自相关性。
这样的结果说明在本模型中并没有包含影响工业GDP的关键因素。
由以上两个表可以看出,这两个因素对工业GDP的影响是比较显著的,证明我们的猜想是符合现实情况的。
但是这两个模型的D-W检验结果都相当差,说明了两个模型都漏掉了影响模型的重要因素。
于是我们考虑做二元模型。
2.建立二元模型,
探索固定资产投资和能源消费量对工业GDP的相对影响强弱
由以上一元模型的结果可知:
固定资产投资(FXA)和能源消费量(POW_US)对工业GDP的影响都很显著,所以尝试用这两个解释变量作二元模型,得到模型3。
模型3:
INDUSG=C+β1*FXA+β2*POW_US+u
DependentVariable:
INDUSG
Method:
LeastSquares
Date:
12/15/03Time:
17:
46
Sample:
19852002
Includedobservations:
18
Variable
Coefficient
Std.Error
t-Statistic
Prob.
C
-5810.148
3190.055
-1.821332
0.0886
FXA
0.999148
0.058451
17.09390
0.0000
POW_US
0.079206
0.035254
2.246735
0.0401
R-squared
0.992838
Meandependentvar
20313.41
AdjustedR-squared
0.991883
S.D.dependentvar
15007.39
S.E.ofregression
1352.116
Akaikeinfocriterion
17.40774
Sumsquaredresid
27423273
Schwarzcriterion
17.55614
Loglikelihood
-153.6697
F-statistic
1039.631
Durbin-Watsonstat
0.999447
Prob(F-statistic)
0.000000
解释变量相关系数矩阵:
FXA
POW_US
FXA
1.000000
0.907479
POW_US
0.907479
1.000000
INDUSG=-5810.148217+0.9991484399*FXA+0.07920588433*POW_US
t=1.821317.092.24
(R2=0.9928,F=1039DW=0.999)
Cov(FXA,POW_US)=0.9075
从以上数据可以看出:
模型总体拟合的很好(R2=0.9928),也比较可以。
但如果考虑二者的相关系数很大,模型具有多重共线性。
同时,dL=0.933因此这个模型不是很理想。
由于没办法扩大样本容量,我们只有变换模型形式,用取对数的方式来减弱多重共线性。
于是有模型4:
模型4:
Ln(INDUSG)=C+β1*Ln(FXA)+β2*Ln(POW_US)+u
DependentVariable:
LIN
Method:
LeastSquares
Date:
12/15/03Time:
19:
26
Sample:
19852002
Includedobservations:
18
Variable
Coefficient
Std.Error
t-Statistic
Prob.
C
-7.621748
3.210235
-2.374202
0.0314
LFX
0.758318
0.069112
10.97233
0.0000
LPOW
0.868523
0.329513
2.635778
0.0187
R-squared
0.995059
Meandependentvar
9.579689
AdjustedR-squared
0.994400
S.D.dependentvar
0.909086
S.E.ofregression
0.068030
Akaikeinfocriterion
-2.386719
Sumsquaredresid
0.069422
Schwarzcriterion
-2.238323
Loglikelihood
24.48047
F-statistic
1510.340
Durbin-Watsonstat
1.029314
Prob(F-statistic)
0.000000
解释变量相关系数矩阵:
LFX
LPOW
LFX
1.000000
0.969168
LPOW
0.969168
1.000000
做出来的效果和“模型3”从数值上看并没有明显的改善:
多重共线性依然十分严重;dL=0.933由模型3和模型4,我们看到,两个解释变量之间的相关性很强且不可通过数学上的变换减弱这种相关性,我们考虑将其中的一个因素替换掉。
从以上四个模型的t统计量来说,固定资产投资(FXA)对工业GDP的影响比能源消费量(POW_US)对工业GDP的影响要显著,而且从“能源消费量”本身的数据来说,也存在着异常波动,将能源消耗总量数据作图:
如图:
可以看到,从97年后,能源消费量都比较异常:
经济在增长,但能源消耗量却在下降。
因此,从这个意义上讲,能源消费量(POW_US)这个变量也不宜采纳到模型中。
3.更换模型的变量,再作探索
根据柯布——道格拉斯函数给我们的启示,我们推测工业企业效益不仅与固定资产投资额(资本)有关,还与劳动人数(劳动力)有一定的关系,于是做出了下面的模型:
模型5:
INDUSG=C+β1*FXA+β2*LAB+u
DependentVariable:
INDUSG
Method:
LeastSquares
Date:
12/15/03Time:
20:
03
Sample:
19852002
Includedobservations:
18
Variable
Coefficient
Std.Error
t-Statistic
Prob.
C
-7647.342
3337.044
-2.291652
0.0368
FXA
1.024353
0.041885
24.45656
0.0000
LAB
0.728371
0.269842
2.699254
0.0165
R-squared
0.993557
Meandependentvar
20313.41
AdjustedR-squared
0.992698
S.D.dependentvar
15007.39
S.E.ofregression
1282.424
Akaikeinfocriterion
17.30190
Sumsquaredresid
24669187
Schwarzcriterion
17.45030
Loglikelihood
-152.7171
F-statistic
1156.534
Durbin-Watsonstat
1.069234
Prob(F-statistic)
0.000000
解释变量相关系数矩阵:
FXA
LAB
FXA
1.000000
0.831158
LAB
0.831158
1.000000
注释:
LAB――第二产业劳动人数(单位:
万人)
FXA——固定资产投资额(单位:
元)
INDUSG=-7647.342+1.024353*FXA+0.728371*LAB
t=-2.29165224.456562.699254
(R2=0.993557,F=1156DW=1.069)
该模型与模型3和模型4相比,多重共线性有所减弱,但是残差自相关性依然存在:
dL=0.933再考虑到以上模型只在生产方面考虑对工业GDP的影响,没考虑消费对工业的影响,因为消费的增加会引起社会对工业产品的需求,进而促进厂家的生产积极性。
于是,我们将消费因素考虑进去,作出模型6。
模型6:
INDUSG=C+β1*FXA+β2*CMS+u
DependentVariable:
INDUSG
Method:
LeastSquares
Date:
12/15/03Time:
20:
23
Sample:
19852002
Includedobservations:
18
Variable
Coefficient
Std.Error
t-Statistic
Prob.
C
-1268.643
716.4589
-1.770713
0.0969
FXA
0.332958
0.184087
1.808693
0.0906
CMS
0.858164
0.200075
4.289220
0.0006
R-squared
0.995701
Meandependentvar
20313.41
AdjustedR-squared
0.995127
S.D.dependentvar
15007.39
S.E.ofregression
1047.590
Akaikeinfocriterion
16.89738
Sumsquaredresid
16461659
Schwarzcriterion
17.04578
Loglikelihood
-149.0764
F-statistic
1736.903
Durbin-Watsonstat
0.467099
Prob(F-statistic)
0.000000
解释变量相关系数矩阵:
FXA
CMS
FXA
1.000000
0.994645
CMS
0.994645
1.000000
注释:
CMS――社会消费品零售总额(单位:
亿元)
FXA——固定资产投资额(单位:
元)
固定资产投资与社会消费品零售总额居然存在着如此高度的相关性,这种情况我们完全没有想到。
出现这种现象的原因可能是消费品需求的增大会使得企业扩大规模,增加固定资产投资;而且由于中国正处在高速发展阶段,各种指标都在增长,在一定程度上也加重了模型的多重共线性。
自然,这个模型也是不合格的。
D-W
4.较优模型的得出
经过仔细的思考,我们觉得工业产品主要是用于国民生产的中间投入,所以本期的工业产出可能会影响今后若干期的工业GDP,因此,我们考虑采用滞后模型,同时考虑本期固定资产增加也会对工业GDP产生重要影响,所以我们得到模型7。
模型7:
INDUSG=C+β1*FXA+β2*INDUSG(-1)+u
DependentVariable:
INDUSG
Method:
LeastSquares
Date:
12/15/03Time:
20:
47
Sample(adjusted):
19862002
Includedobservations:
17afteradjustingendpoints
Variable
Coefficient
Std.Error
t-Statistic
Prob.
C
1270.111
474.7386
2.675391
0.0181
FXA
0.567903
0.148809
3.816317
0.0019
INDUSG(-1)
0.526077
0.141653
3.713843
0.0023
R-squared
0.994836
Meandependentvar
21305.45
AdjustedR-squared
0.994098
S.D.dependentvar
14848.44
S.E.ofregression
1140.681
Akaikeinfocriterion
17.07542
Sumsquaredresid
18216141
Schwarzcriterion
17.22246
Loglikelihood
-142.1411
F-statistic
1348.575
Durbin-Watsonstat
0.786842
Prob(F-statistic)
0.000000
INDUSG=1270.111499+0.5679025377*FXA+0.5260769592*INDUSG(-1)
t=2.6753.8163.714
(R2=0.9948,F=1348.57DW=0.7868)
用德宾h-检验法检验模型是否存在一阶自相关性:
显著性水平,查标准正态分布表得临界值=1.96,
=3.0805>=1.96,拒绝原假设,模型存在一阶自相关。
可以看出,模型7的参数除了h外,都是很好的,我们继续做滞后两期的模型。
模型8:
INDUSG=C+β1*FXA+β2*INDUSG(-1)+β3*INDUSG(-2)+u
DependentVariable:
INDUSG
Method:
LeastSquares
Date:
12/15/03Time:
19:
15
Sample(adjusted):
19872002
Includedobservations:
16afteradjustingendpoints
Variable
Coefficient
Std.Error
t-Statistic
Prob.
C
838.7794
385.0226
2.178520
0.0500
FXA
0.437429
0.108278
4.039881
0.0016
INDUSG(-1)
1.176130
0.192067
6.123527
0.0001
INDUSG(-2)
-0.571410
0.145066
-3.938953
0.0020
R-squared
0.997648
Meandependentvar
22389.11
AdjustedR-squared
0.997060
S.D.dependentvar
14624.66
S.E.ofregression
792.9241
Akaikeinfocriterion
16.40165
Sumsquaredresid
7544743.
Schwarzcriterion
16.59480
Loglikelihood
-127.2132
F-statistic
1696.898
Durbin-Watsonstat
1.938562
Prob(F-statistic)
0.000000
INDUSG=838.77+0.4374*FXA+1.176*INDUSG(-1)-0.5714*INDUSG(-2)
t=2.1784.0396.124-3.938
(R2=0.9976,F=1696.8DW=1.938h=0.1920)
模型7:
(R2=0.9948,F=1348.5DW=0.7868h=3.0805)
用德宾h-检验法检验模型是否存在一阶自相关性:
显著性水平,查标准正态分布表得临界值=1.96,
=0.1920<=1.96,接受原假设,模型不存在一阶自相关。
从任何一个参数上看,模型8都比模型7好,因此模型8应该比模型7好,不过INDUSG(-2)的系数为负数很难解释。
但是我们真的找不到更好的模型。
两期前的工业GDP会使得本期的工业GDP减少,这种情况几乎不可思议。
考虑其残差的异方差性,在Eviews里,将样本时间定义为1987――1992,然后用OLS方法求得下列结果:
INDUSG=-581.95+0.6083*FXA+0.6768*INDUSG(-1)+0.07769*INDUSG(-2)
t=-1.7966.302.570.303
=0.9967
将样本时间定义为1997――2002,然后用OLS方法求得下列结果:
INDUSG=15364.27+1.0895*FXA-0.247*INDUSG(-1)-0.132*INDUSG(-2)
t=1.1011.3365-0.1963-0.3138
=0.9801
求F统计量:
给定显著性水平,得临界值,,拒绝原假设,存在异方差。
用加权最小二乘法修正模型的异方差:
设权数,回归模型9:
模型9:
INDUSG=C+β1*FXA+β2*INDUSG(-1)+β3*INDUSG(-2)+u
DependentVariable:
INDUSG
Method:
LeastSquares
Date:
12/24/03