我国第三产业增加值的分析与预测--基于SARIMA模型Word下载.docx
《我国第三产业增加值的分析与预测--基于SARIMA模型Word下载.docx》由会员分享,可在线阅读,更多相关《我国第三产业增加值的分析与预测--基于SARIMA模型Word下载.docx(22页珍藏版)》请在冰点文库上搜索。
该数学模型就是季节乘积ARIMA模型,可以从时间序列的过去值及现在值来预测未来值。
(四)SARIMA定义
季节性时间序列呈现出周期性的特性。
不同的季节时间样本会拥有出不同的周期,假设s为周期的长度,那么一般月度样本的周期长度s是12,季度样本的一个周期长度s表示为一年的四个季度。
采用Box-Jenkins建模方法来建立SARIMA,首先需要辨明周期长度s的数值,然后通过差分后序列的相关图来辨别模型的类型,最后进行参数的估计和检验。
博克斯(Box)和詹金斯(JenKins)于70年代初推出一著名时间样本预测模型方法,也就是Box-Jenkins建模方法。
季节乘积ARIMA模型是由ARIMA模型演变而来的。
ARIMA模型是由3个进程组成;
自回归进程(AR(p));
单整(I(d));
移动平均进程(MA(q))。
AR(p)即自回归进程,是用线性函数的过去值表示当前值的进程。
假设后一时期的行为主要与其前一时期的行为有关联,而与其前一时期从前的行为没有直接关联,也就是Xt=1Xt-1+at,【4】也就是AR
(1)。
推广之,如果Xt不仅与前期值Xt-1有关联,而且与Xt-p相关联时,也就是Xt-pXt-p=at,【4】记作AR(p)。
MA(p),即移动平均过程。
假设一阶平均模型,如果体系的响应Xt仅与前一时期进入体系的扰动项at-1存有一定的相关关联,即Xt=at-θ1at-1,【4】也就是MA
(1)。
引申来说,如果体系在t时期的响应Xt不仅与其前一时期进入体系的扰动at-1有相关关联,而且与at-q也存在一定的相关关联,即Xt=at-θ1at-1-θqat-q,【4】也就是MA(q)。
单整(I),是差分非平稳序列为平稳序列进行差分的次数。
ARIMA(p,d,q)模型的一般表示如下:
(B)(1-B)dYt=θ(B)εt+c,【4】其中,d为差分的次数,p为平稳序列的自回归阶数,q为移动平均阶数。
季节性时间样本模型SARIMA(k,D,m)(p,d,q)可以变成,
(B)U(Bˢ)Xt=θ(B)V(Bˢ)at【4】
其中,U(Bˢ)=1-T1Bˢ-T2B²
ˢ-…-TvB
V(Bˢ)=1-H1Bˢ-H2B²
ˢ-…-HmB
=(1-B)
=(1-B)
(五)季节乘积ARIMA模型的建模步骤
1、观察原始序列y的时序图
看序列是否有明显的趋势性和季节性,对序列进行取对数后得到lny,消除数据的趋势性。
2、判断季节性时间序列周期
通过时间序列的序列图判断时间序列是否为一个季节性时间序列,其周期是多少。
一般来说季度数据的周期是4。
3、将时间序列平稳化
经过时间序列差分和季节差分以及单位根检验,以转成一个平稳序列。
只有经过恰当的差分,才可以使模型更有解释力。
4、对模型初估计
观测季节差分非季节差分样本的自相关函数以及偏自相关函数。
判断模型阶数,对比模型的拟合效果和t检验的效果,选择一个模型进行估计。
5、对模型作预估计处理
得到参数的估计初始值,观察DW值,是否有自相关。
6、对估计得到的模型残差进行适应性检验
观察相关图和偏相关图p值是否大于0.05,以便得出是否通过白噪声检验。
若为白噪声,则模型通过检验。
(六)时间样本平稳性的检查应用
以自相关函数为特征的传统应用和以单位根ADF检查为特征的现代应用。
(七)D阶单整样本的判断
如果不是平稳序列{yt}历经D次差分后平稳,D-1次差分不平稳,就称{yt}为D阶单整序列,也就是说D阶是差分的阶数。
(八)季节自回归以及移动平均阶数判断方法
季节时间样本自相关和偏自相关函数不呈现出线性衰减趋势,假设在延迟期为周期S的整倍数时出现峰值,则建立乘积季节模型是恰当的。
一般情况下季节自回归以及季节移动平均阶数的判断可以对比模型的参数估计效果来判断。
三、案例分析
(一)样本由来
本文使用的数据是我国1992第一季度到2014年第三季度第三产业增加值的数据。
数据样本起源于国家统计局官网公布的季度数据。
(详情见附录一)
(二)平稳化处理
SARIMA模型建模的基本条件是要求样本呈现出平稳性,图可以显示因变量随自变量而变化的大致走向,图中可以看出该序列呈上升走向和周期性,显著不平稳。
图1我国第三产业增加值Y序列图
下图是Y序列自相关以及偏自相关图
图2Y序列自相关以及偏自相关图
自相关系数随延迟期的扩大,减退向零的速度很慢,所以Y序列是不平稳序列。
一阶差分后dlny序列的自相关图如下:
图3一阶差分后dlny序列自相关和偏自相关图
自相关系数衰减到零的速率仍然很慢,所以一阶差分后的序列仍然是不平稳序列。
采用对原始序列取对数和差分的形式,在进行单位根检验。
呈现出在显著性水平1%下,单位根检验的临界值是-3.508326;
在显著性水平5%,单位根检验临界值是-2.895512;
在显著性水平10%,单位根检验的临界值是-2.584952,t检验统计量值是-1.141027,统计量值大于相应临界值,从而不能拒绝H0,表明我国第三产业增加值经过一阶差分后序列仍然存有单位根,是不平稳序列。
应该间接把不平稳时间序列转化为平稳时间序列后在进行回归分析。
关于原始序列Y取对数后一阶差分单位根检验结果如下:
表一一阶差分后dlny序列的单位根检验
NullHypothesis:
LNYhasaunitroot
Exogenous:
Constant
LagLength:
4(Automatic-basedonSIC,maxlag=11)
t-Statistic
Prob.*
AugmentedDickey-Fullerteststatistic
-1.141027
0.6963
Testcriticalvalues:
1%level
-3.508326
5%level
-2.895512
10%level
-2.584952
*MacKinnon(1996)one-sidedp-values.
进而对序列lny进行二阶差分,进行单位根检验如下:
表二二阶差分后dlny2序列的单位根检验
D(LNY,2)hasaunitroot
Constant,LinearTrend
2(Automatic-basedonSIC,maxlag=11)
-738.8537
0.0001
-4.068290
-3.462912
-3.157836
同样,由上表明显可以得到,在显著性水平1%下,单位根检验的临界值是-4.068290;
在显著性水平5%,单位根检验临界值为-3.462912;
在显著性水平10%,单位根检验的临界值为-3.157836,t统计量值为-738.8537,统计量值小于相应临界值,所以拒绝H0,表明我国第三产业增加值二阶差分后序列不存在单位根,是平稳的。
下图是二阶差分后的序列时序图
图4二阶差分后dlny2序列的时序图
从中可以看出差分后的序列在零相近处振动,无显明走向。
趋势性已经消除,不过仍存在季节周期性。
下图是差分二阶后的序列d2lny的自相关图以及偏自相关图
图5差分二阶后的序列d2lny自相关图以及偏自相关图
从图中可以看出,自相关系数在零相近振动,二阶差分后的序列是平稳的。
一次季节差分dlny4的时序图如下:
图6一次季节差分dlny4时序图
从图中可以看出,一阶季节差分后后的序列周期性已经消除,但仍存在趋势性。
一次季节差分自相关图如下:
图7一次季节差分后的时序图
图中显然可以得到,自相关系数衰减到零很慢,一阶季节差分后的序列仍是不平稳。
进而在序列lny取一阶季节差分的基础上,在对序列取2阶非季节差分,命令如下:
genrdlnys2=dlog(y,2,4),时序图如下:
图8一次季节差分后二阶差分时序图
从图中能够得出,曲线绕着零均值附近波动,经过一阶季节差分后在进行二阶非季节差分的序列是平稳的。
其自相关和偏自相关图如下:
图9一次季节差分后二阶差分相关图
通过对DLNY2s的相关和偏相关图分析,可以建立的模型。
理由如下:
因为相关图呈衰减特征,说明至少存在非季节3阶自回归。
不存在移动平均成分。
图中能够得出,难判断是否1阶季节自回归以及1阶季节移动平均同时存有,还是只存有它们当中的一个。
估计结果显示,1阶季节移动平均存在于模型中。
综合来说,经过序列dlnys2的自相关图和偏自相关图分析,可建立SARIMA模型。
(三)模型的识别和建立
模型的定阶过程,采用最小二乘估计法(OLS)拟合所考虑的模型,在eviews命令窗口中输入LSDLOG(Y,2,4)CAR
(1)AR
(2)AR(3)SMA(4)得
表3模型的参数估计表
DependentVariable:
DLOG(Y,2,4)
Method:
LeastSquares
Date:
03/24/15Time:
14:
31
Sample(adjusted):
1994Q22014Q3
Includedobservations:
82afteradjustments
Convergenceachievedafter11iterations
MABackcast:
1993Q21994Q1
Variable
Coefficient
Std.Error
Prob.
C
0.000146
9.08E-05
1.607779
0.1120
AR
(1)
-0.834473
0.070491
-11.83804
0.0000
AR
(2)
-0.814402
0.076099
-10.70187
AR(3)
-0.736548
0.079711
-9.240223
MA(4)
-0.946563
0.010802
-87.62882
R-squared
0.599385
Meandependentvar
-0.001131
AdjustedR-squared
0.578574
S.D.dependentvar
0.024758
S.E.ofregression
0.016072
Akaikeinfocriterion
-5.364421
Sumsquaredresid
0.019890
Schwarzcriterion
-5.217670
Loglikelihood
224.9413
Hannan-Quinncriter.
-5.305503
F-statistic
28.80113
Durbin-Watsonstat
1.887706
Prob(F-statistic)
0.000000
InvertedARRoots
.02-.92i
.02+.92i
-.87
InvertedMARoots
.99
.00+.99i
-.00-.99i
-.99
由表3可知,可判决系数R^2和调整后的可判决系数r^2都接近于0.6,拟合度还可以,模型对原始数据能解释的部分较多。
F统计值为28.80113,各回归系数显著为0,说明模型是显著。
在显著性水平0.05下,自变量k=4,n=90,查表得DL=1.566,DU=1.751,k=4,n=95时,DL=1.579,DU=1.755,所以,n=91时,1.751<
DU<
1.755,所以DU<
DW=1.8877<
4-DU,模型消除自相关。
SARIMA模型的估计成果:
(1+0.834473B+0.814402B2+0.736548B3(1-B)²
Yt=(1+0.946563B)at
(四)模型的适应性检验
模型的适应性检验是残差序列αt与Xt派生出预白化序列at是否互相关,残差序列是白噪声序列。
如果一个时间序列模型是恰当的,那么模型的残差序列{at}应该是白噪声序列,它应该完全或者大概说明了时间序列的相关性。
这里,运用χ2检验法进行模型的适应性检验。
图10模型的残差序列图
图10是模型估计结果显示残差序列的样本自相关函数绝大多数都在置信区间以内,图中呈现滞后5阶至32阶残差序列的自相关函数对应的概率p值几乎都大于显著性水平0.05,因此不能拒绝原假设,也就是认为残差序列{at}是白噪声序列,于是SARIMA
是符合要求的。
(五)模型的预测
利用所估计的SARIMA模型对2014年第四季度的第三产业增加值进行预测。
图111992-2014年我国第三产业增加值走向和预测图
图11可以清楚看到,预测数据与原始数据基本一致,表明模型的估计效果很好,符合预测我国第三产业增加值未来走势的要求。
同样,第三产业增长速率加快,呈现峰谷交替的态势。
我国第三产业增加值受季节性因素影响明显。
第一季度增加值到第四季度增加值逐步提高。
我们应该尽量维持第三产业增加值在第四季度的水平,在可能的情况下,提高第三产业增加值的增长速度;
在第一季度时,尽量不要让它落后于其它三个季度的增加值。
图12模型残差图
从该图中可以看出,模型的残差均值在零附近波动,拟合值和实际值相差不大,模型是可行的。
并且从残差图可以看出,之所以在2008年和2011年时偏离均值零最远,是因为2008年世界金融危机的影响和2011年第三产业内部结构的影响,导致第三产业发展受到的波动较大。
所以我们应该重视第一第二产业对第三产业的影响以及第三产业内部的制约作用,进而加快第三产业的发展。
计算相对误差,以表示模型效果相对误差=︱Yf-Y︱/Y*100%
(其中Yf为预测值Y为原始值)
通过对1992年第一季度至2014年第四季度相对误差的计算,我们可以发现相对误差小于1%的约占有69.6%,大于1%且小于5%的约占26.1%,余下的相对误差大于5%以上3.3%。
这一结果说明该理论模型的预测效果较好,用该模型进行静态预测,不会对所预测值产生很大的预测误差,也就是说能把预测误差控制在5%之内,乃至更低。
(见附录二)
运用SARIMA模型经过静态预测,得出2014年第四季度的预测值为306899.4,实际值306738.7,根据公式,相对误差=(306899.4-306738.7)/306738.7=0.05%,拟合效果很好。
同时,2013年第四季度增加值预测值为277333.5,所以2014年第四季度比上一年同期增长了10.7%。
四、结论
1、SARIMA模型估计的优势和劣势
本文辅助eview软件,对我国第三产业增加值进行季度时间序列分析与预测。
分析结果说明,用季节乘积ARIMA模型对我国2014年第四季度第三产业增加值进行建模和预测是可行且可靠的,这为国家宏观调控提供了一个重要的理论依据。
采用静态分析,能更好运用原始数据,并对预测值进行不断调整,能很好地控制预测的误差。
本文研究的不足之处是模型的拟合优度还有待提高,没有剔除通胀因素对第三产业增加值的影响。
如剔除通胀因素可使结果更贴近实际,更具有参考价值。
2、运用SARIMA模型对第三产业增加值预测是可行的
可以通过观察序列的时序图来判断数据是否存在趋势性和周期性,观察样本自相关函数是否快速趋向于零,判断数据是否平稳。
利用单位根检验进一步判断序列是否平稳。
先取对数,在采用差分或最小二乘法(本文采用差分的方法)消除数据的趋势性,采用季节差分消除数据的周期性。
通过观察相应的相关图进一步判断模型的阶数,对模型适应性检验看模型是否可行。
最后观察预测效果,发现采用季节乘积ARIMA模型产生的预测值与原始值是吻合的,也就是说模型是科学可靠的。
3、目前我国第三产业发展水平不高
在当前形势下,稳步发展的第三产业,对经济增长的创造力不断增强。
但综合来说,发展水平低,规模小、结构不均和数量少等因素,使得我国第三产业发展明显落后于发达国家和很多发展中国家,发展第三产业仍需全力以赴。
4、关于促进第三产业发展的途径有以下几点:
(1)依靠深化改革、扩大开放加快发展第三产业的步伐
吸收海外资金、技术和人才,积极进行各式各样的改革和试点,通过发行债券、股票等多种途径、方式筹集资金;
努力打破部门、地区、行业的界限,积极加快组建集团性、地区性和国际性企业集团的经营,加快第三产业发展。
(2)想尽办法增加资金投入,增强现代第三产业发展后劲
要逐步加大第三产业的投入力度,通过调整投资方向提升我国第三产业发展水平,使三大产业之间的方式变得更加合理。
同时,通过缩减审批程序改变近年来第三产业企业开业难境况。
放开第三产业企业自主经营权,批准他们采取更加灵活的手段,增加经营领域;
同时,要切实加强管理与监督。
(3)出台税费优惠扶持政策,提高现代第三产业发展水平
税费负担过重是导致第三产业发展不足的原因之一。
今后应逐步调节增值税和营业税的范围,使第三产业税费过多的状况向好的方向改变,出台有利于第三产业的财政税收政策,引领社会资本流向第三产业。
(4)提高服务业人员素质,吸收好和利用好服务业人才
有针对性地增加专业学校,培养与服务业对口专业的高职学生人才,改善相关各级高校的教育水平;
同时,使更多的服务业人员得到更多的进修和培训机会,提高在职人员素质。
(5)鼓励扩大国际化经营范围,给予大中型企业、物资企业更多进出口权
有条件的境外企业要积极创立海外中资企业。
同时,赋予国有大中型外贸企业国内销售的权利。
统筹经营国内外市场。
参考文献
[1]孔珊珊、李晓琳.我国人均主要工农产品产量与第三产业增加值关系的分析[J].问题研究,2010(3):
55
[2]曹跃群、胡新华.我国第三产业发展地区差异的演变(1985-2003)[J].统计观察,2005(3):
65~67
[3]乔咪.基于ARIMA模型对我国第三产业生产总值的分析与预测[D].北京林业大学经济管理学院2010,6
[4]王振龙、胡永宏.应用时间序列分析[M].北京.科学出版社.2007.142~174
[5]庞浩.计量经济学(第二版)[M]北京:
科学出版社.2010.6.275~279
[6]陈文玲.我国第三产业的发展状况及对策建议[J].对策建议,2000
(1):
75~78
[7]台冰.人均第三产业增加值与人口城市化水平关系研究[J].关系研究,2007(3):
24-27