1、V/S分析;有效性。Testing the Efficiency of Hurst Index Estimation Based on R/S Type MethodYirong HuangSchool of Business, Sun Yat-Sen University, Guangzhou 510275, ChinaAbstract: This paper studies the efficiency of estimating Hurst index with R/S type including classical rescaled range analysis, modified
2、rescaled range analysis and rescaled variance analysis by simulating FGN series with DHM. There are evident differences between the effects of the length of series, the type of dealing with short-rang dependence, strength of added white noise in series on three estimators, moreover, they have separa
3、te applicable interval of estimating Hurst index. Keywords: Hurst Index; Classical Rescaled Range Analysis; Modified Rescaled Range Analysis; Rescaled Variance analysis; Efficiency.1 引 言Hurst(1951)1在长期的水文研究工作中发现,河流流量存在较强的长记忆性。后来,许多研究发现,该特性不仅存在于自然界,而且广泛存在于经济与管理领域的数据中。金融时间序列长记忆性的检测与建模目前已经成为金融计量领域研究的重要
4、内容。长记忆性通常从具有双曲率缓慢衰减形式的自相关函数和在零频率处趋于无限值的谱密度函数等两个角度进行刻画,而且均通过Hurst指数(下文简称H指数)来表征长记忆性程度。因此,H指数的估计与检验是长记忆性研究的关键工作,其估计与检验的有效性直接影响对长记忆性的甄别。尽管现有文献提出多种估计H指数的方法,但是R/S类方法由于其简洁性而一直受到研究者的青睐,迄今为止仍是估计H指数最常用的方法。该类方法最早是由Hurst(1951)1和Mandelbrot & Wallis(1969)2提出的经典R/S分析方法(Classical Rescaled Range,下文简称CRS),后来Lo(1991)
5、3通过考虑序列的短期相关性对CRS进行了修正而提出修正 R/S分析方法(Modified Rescaled Range,下文简称MRS),Giraitis et al.(2003)4利用部分和序列的方差替代部分和序列的极差对CRS进行了修正而提出V/S分析方法(Rescaled Variance,下文简称VS)。虽然MRS和VS均是从不同方面对CRS进行了某种程度的修正,但是能否真正提高H指数的估计有效性呢?尽管许多研究文献对R/S类分析方法的有效性提出许多质疑,但是目前大多数的研究都是这些估计方法在某些领域的直接应用,而对它们估计H指数的有效性的关注和研究却很少。R/S类分析方法由于产生于H
6、urst的长期实践工作过程而没有严格的数学推导,因此,我们难以使用严格数学证明来检验其有效性,但是可以通过模拟研究方法来综合评价它们的有效性。鉴于此,为检验R/S类方法估计H指数的有效性,下面将通过预先设定不同的H真实值并模拟出一系列的FGN序列,然后利用CRS、MRS和VS三种方法分别估计H指数,从H估计值的均值和标准差两方面反映序列长度、短期相关性处理、白噪声成分等因素对H指数估计的影响,并综合比较三种估计量的有效性,为R/S类分析方法使用者提供有益的参考。2 研究方法2.1 R/S类分析方法通常将CRS、MRS和VS统称为R/S类分析方法,原因在于它们具有共同的基本原理,我们可将它们估计
7、H指数的基本步骤概括如下:第1步,将原始序列划分成若干子序列。合适选定某标度长度n,将原始序列划分成M个互不重叠的长度为n的子序列:,其中,表示取整,下同;第2步,计算出与标度长度n所对应的标度统计量。首先计算出根据标度长度n所划分出的所有子序列的局部统计量,然后利用所有局部统计量计算出标度长度n对应的标度统计量,此处标度统计量是所有局部统计量的平均值,即为;第3步,改变标度长度n,重复前面的步骤,这样得到一系列的标度长度n及其相应的标度统计量序列;第4步,若标度统计量序列与标度长度序列存在如下的标度关系:,其中,为某常数,则可以采用如下的双对数回归方式估计H指数:。 (1)CRS(Hurst
8、,19511;Mandelbrot,19692)使用如下的局部统计量为:, (2)其中,为第m个子样本的极差,为第m个子样本的标准差,为第m个子样本的均值。MRS(Lo,1991)3使用如下的局部统计量:, (3)其中,同上述CRS中的定义,由下式定义:,(3)其中,当时,为Bartlett权重,和为第m个子样本的样本方差和j阶样本自协方差。的选择至关重要,其直接影响到检验效果。Lo建议使用如下的q值最优选择公式:, (4)其中,n为子样本长度,为一阶自相关系数的估计值,表示取整。当时,MRS与CRS方法一致。VS(Giraitis et al.,2003)4使用的局部统计量为:, (5)其中
9、,为第m个子序列部分和序列的方差,具体展开形式为:,其它与上述MRS中的定义相同。2.2 模拟设计2.2.1 FGN和FBM序列的模拟算法由Mandelbrot & Van Ness(1968)5提出的分形高斯噪声(Fractional Gaussian Noise,简称FGN)是第一个完整的长记忆模型,通常定义为具有H指数的分形布朗运动的一阶差分过程,其第k阶自协方差函数为:, (6)其中,为任意正数,为H指数。为模拟上述定义的FGN序列,许多学者提出了多种模拟算法,比如,基于条件分布的Durbin-Levinson方法(Brockwell & Davis,19916)、基于循环嵌入矩阵和傅
10、立叶变换的模拟方法(Davies & Harte,19877;Wood & Chan,19948)、基于小波的合成模拟方法(Abtry & Sellan,19969)等。我们通过反复模拟比较发现,这些模拟方法的效果基本一致。因此,本文选择Davies & Harte(1987)7提出的算法(Davies & Harte Method,简称DHM)模拟FGN序列。在式(1)给定自协方差序列的条件下,DHM算法模拟长度为T的FGN样本序列的基本步骤如下:第1步,计算序列:, (7)其中,该步其实是对自协方差序列实施离散傅立叶变换(DFT);第2步,检查非负条件:对所有,该步也很重要,若不满足非负条
11、件,则模拟序列是无效的;第3步,模拟产生均值为0、方差为1的独立高斯随机变量序列;第4步,计算复值序列:, (8)其中,表示的共轭复数。第5步,通过离散傅里叶逆变换(IDFT)可得到模拟序列:,。 (9)2.2.2 模拟参数与程序的设定为综合对比3种估计量估计H指数的有效性,首先需要对模拟参数做出设定。我们选择0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9等9个数值作为H指数的真实值,这些取值范围基本覆盖了序列的各种特性:当H真实值介于0与0.5之间时,序列具有反持续性(或均值回复);当H真实值等于0.5时,序列没有记忆性;当H真实值介于0.5与1之间时,序列具有长记忆
12、性(或状态持续性)。当考察序列长度对H估计值的影响时,我们选定、等8种长度,这些长度基本可覆盖目前大多数分析数据的长度范围,当考察相关性处理、白噪声成分对H估计值的影响时,模拟序列长度均选择为,相关性处理仅考虑一阶短期相关性剔除的情况,白噪声成分考虑根据在FGN序列追加的白噪声成分标准差与FGN序列标准差之间的4个比值0、0.33、0.66、1.0划分的4种情况。本文的所有运行结果均是在Matlab7.0软件中自行编写程序得到的,如需源程序可向作者索取。首先,在上述模拟参数的设定下,每种情况均模拟出100个序列,利用3种估计量分别估计出每个序列的H估计值,这样每种情况均得到H估计值序列;其次,
13、分别估计出在每种情况下H估计值的均值、标准差和均方误差,分别定义为:、,从而评价序列长度、相关性处理和白噪声成分等每种因素对3种估计量估计H指数的影响;然后,利用统计分析中常用的直方图、JB和KS检验统计量对H估计量的正态分布特性进行统计检验。3 研究结果3.1 序列长度对估计结果的影响为反映序列长度对H估计值的影响,我们对于每个H真实值均模拟出100个序列,然后分别利用CRS、MRS和VS三种估计量估计出每个序列的H指数,并且计算其均值和标准差,分别如图1和图2所示。图1 序列长度对H估计值均值的影响从图中可看出,序列长度对H估计值的均值和标准差产生显著的影响。随着序列长度的增加,3种估计量
14、得到的H估计值均值将越来越接近于H真实值,H估计值的标准差显著降低,当序列长度为时,估计偏差和标准差最大。而且VS所得到的H估计值均值受序列长度的影响比CRS和MRS均要小得多,尤其是当H真实值介于0至0.6之间时,估计偏差较小,VS和MRS所得到的H估计值标准差没有显著差异,但均比CRS要小,因此表明,VS更具有小样本特性。图2 序列长度对H估计值标准差的影响3.2 相关性处理对估计结果的影响我们知道,MRS和VS均在估计标准差中考虑了序列的短期相关性,那么在估计前对序列进行短期相关性处理是否会对这些方法估计H指数仍产生显著的影响呢?这里我们仅考虑剔除一阶短期自相关性的情况。图3 相关性处理
15、对H估计值均值的影响从图3看出,当H真实值介于0.7至1.0之间时,剔除一阶相关性对CRS得到的H估计值均值产生显著影响,而对于其他的所有情况均没有显著影响。从图4看出,短期相关性处理对3种估计量得到的H估计值标准差的影响较小。图4 相关性处理对H估计值标准差的影响3.3 白噪声成分对估计结果的影响在考虑白噪声成分方面,在利用DHM方法模拟得到的FGN序列基础上追加各种白噪声成分,这里以白噪声成分标准差与FGN序列标准差之间的比值大小表明序列包含白噪声成分的强弱,选取0、0.33、0.66、1.0等4种情况作为研究对象。从图5可看出,随着白噪声成分标准差与FGN序列标准差的比值逐渐增加,三种估
16、计量得到的H估计值均值均逐渐随之发生显著变化,而且当H真实值处于低端时,序列所包含的白噪声成分越强,三种估计量高估H指数的程度将逐渐显著地变大,而当H真实值处于高端时,序列所包含的白噪声成分越强,低估H指数的程度将逐渐变大。从图6可看出,序列所包含的白噪声成分的增加将增大H估计值的标准差,从而使H指数的估计结果稳定性下降。总体上,三种估计量受白噪声成分的影响大致相同。图5 白噪声成分对H估计值均值的影响图6 白噪声成分对H估计值标准差的影响3.4 H估计量的分布特性本文以统计分析中常用的直方图、JB、KS为检验H估计量的正态分布特性。检验结果表明,几乎所有情况下的检验统计量均是显著的,具体检验
17、结果此处从略。三种H估计量的抽样分布形式均与正态分布存在较大差异,但是VS的H估计量的差异要小一些。由此表明,R/S类方法得到的H估计量并不具有正态分布特性,利用正态分布对H指数进行显著性检验将产生不正确的结论。3.5 三种方法估计结果的综合比较前面我们考察了各种因素对三种估计量估计H指数的影响。这里在选择序列长度为、不进行短期相关性处理和不追加白噪声成分的情况下,着重考察在H真实值的不同范围内三种估计量的有效性问题。H指数估计值的均值、标准差和均方误差如图7所示。从图可看出,在H真实值的不同范围内,三种估计方法的估计结果存在一定的差异。当H真实值在0至0.7之间时,CRS高估H值,而在0.8
18、至1时低估H值,仅在0.7至0.8之间时才能给出较好的估计。在H真实值在0至0.6之间时,MRS高估H值,而在0.7至1时低估H值,仅在0.6至0.7之间时才能给出较好的估计。VS在0至0.6之间时能给出比较接近于H真实值的估计,而当H真实值大于0.6时,却给出低估的估计结果。总体来看,三种估计量各自存在不同的适用范围,当H真实值介于0至0.6之间时,VS能做出较好的估计,当H真实值介于0.6至0.7时,MRS能做出较好的估计,而当H真实值介于0.7至0.8时,CRS能做出较好的估计,而当H真实值介于0.8至1时,三种方法均低估H指数,低估程度和估计误差由CRS、MRS和VS依次增大。图7 三
19、种估计方法的综合比较:均值、标准差和均方误差4 研究结论与建议本文在设定9个H真实值的条件下利用DHM方法模拟出一系列FGN序列,对序列长度、短期相关性处理和白噪声成分等因素对经典R/S分析方法、修正R/S分析方法和V/S分析方法估计H指数有效性的影响关系进行了研究。本文研究发现,VS受序列长度的影响最小,具有较好的小样本特性,CRS较容易受到短期相关性处理的影响,MRS、VS几乎不受其影响,而三种方法均受到序列含有的白噪声成分强弱的较大影响,三种估计量均不具有正态分布特性,各自存在不同的适用估计范围,CRS、MRS、VS能做出较好估计的H真实值范围分别为0.7至0.8、0.6至0.7、0至0
20、.6,而当H真实值介于0.8至1时,三种方法均低估H指数,低估程度由CRS、MRS、VS依次增大。因此,在选用R/S类分析方法估计H指数并对诸如长记忆性、自相似性等分形特征进行判定时,我们应根据不同的情况进行区别对待和慎重考虑。参考文献1 Hurst H.E. 1951. The long-Term Storage Capacity of Reservoirs. Transcactions of the American Society of Civil Engineers, 116: 87-92.2 Mandelbrot, B.B., Wallis, J.R., 1969. Robustne
21、ss of the Rescaled Range R/S in the Measurement of Noncyclic Long-run Statistical Dependence. Water Resour. Res. 5, 967-988.3 Lo A.W. 1991. Long-term Memory in Stock Prices. Econometrica, 59: 1279-1313.4 Giraitis, L., Kokoszka, P., Leipus, R., Teysierre, G. 2003. Rescaled Variance and Related Tests
22、for Long Memory in Volatilities and Levels. Journal of Econometrics, 112: 265-294.5 Mandelbrot B., Van Ness J. W. 1968. Fractional Brownian Motions: Fractional Noises and Applications. SIAM Review, 4: 422-437.6 Brockwell P. J., Davis R.A. 1991. Time Series: Theory and Methods. 2nd edition. Springer
23、Verlag, New York.7 Davis R.B., Harte D.S. 1987. Tests for Hurst Effect. Biometrika, 74: 95-101.8 Wood A., Chan G. 1994. Simulation of Stationary Gaussian Processes in 0, 1d. Journal of computational and graphical statistics, 4: 409-432.9 Abry P., Sellan F. 1996. The Wavelet-based Synthesis for Fractional Brownian Motion. Applied and computational harmonic analysis, 3: 377-383.- 11 -
copyright@ 2008-2023 冰点文库 网站版权所有
经营许可证编号:鄂ICP备19020893号-2