HHT的中文翻译Word格式.doc
《HHT的中文翻译Word格式.doc》由会员分享,可在线阅读,更多相关《HHT的中文翻译Word格式.doc(18页珍藏版)》请在冰点文库上搜索。
作为自适应意味着基础的定义,是依赖数据本身的,事后基础上定义的这种做法完全与当前用于数据分析的数学模式不同。
因此,所需的定义提出了一个数学界的巨大挑战,当然这种挑战,研究来从现实世界数据的新的方法是必要的。
最近发展的方法如希尔伯特黄变换(HHT)由黄等人(1996年,1998年,1999年)提出,似乎能满足一些挑战。
HHT方法由两部分组成:
经验模式分解(EMD)和Hilbert谱分析(HSA)的。
这种方法是有潜在的非线性非平稳数据分析可行性的,特别是对时频能量表现。
它已被彻底测试和验证,但只有经验性的。
在所有研究的情况下,给出的HHT的结果比从时频能量传统分析方法中的任何陈述都直接有效。
此外,HHT揭露了许多在数据检测方面的真实物理意义。
HHT是强大的,又完全是经验性的。
为了使该方法更加稳健和严谨,许多优秀的HHT方法相关的数学问题需要解决。
在本节中,有些必须面对的一些问题将被提出,希望能吸引了数学界关注这一有趣的具有挑战性和关键研究领域。
有些问题很简单,而可能在未来数年内解决,其他则更困难,可能会需要更多的努力。
在历史上的Fourier分析,是1807年发明的,直到1933年才得以充分证明(Plancherel1933年)。
同样可以预料,HHT也需要大量的时间和精力。
在讨论数学问题,首先考虑简要介绍了HHT的方法,对完整的细节感兴趣的读者可以参考黄等人的著作。
1.2希尔伯特黄变换
HHT发展的动机是需要详细地描述非平稳过程中的随着信号自发变化的非线性扭曲波。
众所周知,自然物理过程大多是非线性,非平稳,但数据分析方法提供了在检测数据等过程中非常有限的选择。
可用的方法无论是对上述线性非平稳的还是非线性平稳的及统计确定性随机进程都适用。
检测现实世界的非线性,非平稳随机过程的数据,急需新的办法来对非线性过程作特殊的处理。
过去对非线性系统的线性结构的做法是不够的。
其他例如周期性,数据详细的动态过程要被确定,因为作为非线性过程的典型特征之一的内部波的频率调制表明了一个振荡周期瞬时频率的变化。
作为一个例子,对一个非常简单的非线性系统进行检验,非耗散Duffing方程为
这里的ε是不必须很小的参数,γ是一个周期性频率ω的函数的振幅。
在(1.1),如果参数ε为零,该系统将是线性的,而且很容易找到解决办法。
然而,如果ε不为零,该系统将是非线性的。
在过去,任何这样的参数系统都可以用干扰的方法,只要ε《1。
然而,相对于整体上不那么小的ε,那么系统变得高度非线性,以及诸如分岔和混沌将导致新的现象。
然后干扰的方法不再是一种选择;
必须尝试其他大量的解决方法。
无论哪种方式,公式(1.1)代表了最简单的非线性系统之一,它也包含所有的非线性可能。
通过重写在一个稍微不同形式的方程
它的特征就可以更好拿来应用。
然后括号内的数量可以被视为一个变量的弹性系数或变量钟长。
单摆的频率(或周期)随着单摆的长度而定,很明显,(1.2)系统中的频率在一个振荡周期内也随着位置到位置,时间到时间的改变而改变。
如同黄等人(1998)指出,这同频的频率变化是非线性系统的标志。
在过去,当分析的线性傅里叶分析的基础上,内波频率的变化无法描述,只有通过谐波分析。
因此,任何非线性失真波形被称为“谐波失真。
”谐波失真是在对非线性系统线性结构的数学加工造成的。
他们可能有数学上的意义,但没有物理意义(黄等人。
1999年)。
例如,在水浪的情况下,谐波成分等不具备一个真正潮水的真正的物理特性之一。
用物理意义的方法来描述系统中的瞬时频率,能够揭示了内调制波频率范围。
最简单的方法来计算瞬时频率是使用希尔伯特变换,通过它的复共轭y(t)的任何实值函数x(t)的频域可被确定(例如,Titchmarsh1950年)提出
在这里PV代表奇异积分的主值。
随着希尔伯特变换,解析信号的定义为
这里a(t)是瞬时振幅,θ为相位函数,瞬时频率为
希尔伯特变换的描述中的许多数学上的重点方法是由Hahn(1996)提出的。
从本质上讲,公式(1.3)定义为希尔伯特变换的X(t)的卷积,因此,(1.3)强调x(t)的局部特性。
在(1.4)中,极坐标表达进一步阐明了这种局部特性表示的性质:
它是一个最好的局部适合幅度和相位变化的三角函数x(t)。
即使通过希尔伯特变换,定义的瞬时频率仍然饱含争议。
事实上,通过此方法获得一个任意函数,不能获得一个瞬时频率。
一个直接的应用(由哈恩在1996年主张)只会导致频率值对于任何给定数据集有可能会得到正值或负值的问题。
因此,在过去的希尔伯特变换的所有应用仅限于窄带的信号,在限定的频率范围内有着相同数量的的极点和零点。
然而,在频率空间滤波是一种线性的运作,而筛选的数据将被去掉他们的谐波,其结果将会是波形的失真。
希尔伯特变换的真正的优势越来越明显是在黄等人(1998)提出了经验模态分解法后。
1.2.1经验模态分解法(筛选的过程)
正如黄等人讨论(1996,1998,1999),在处理非平稳非线性过程的数据,经验模态分解法是必要的。
相较于以前的几乎所有方法,该方法与后定义的基础上直观,直接,适应性,分解方法是直接基于数据得出的。
分解是根据简单的假设,即任何数据由不同的简单的振荡固有模式。
每一个固有模式,线性或非线性,代表了一种有着相同数目极点和零点的简单的振荡。
此外,振荡也将与对称有关“局部的意思”对称有关。
在任何特定时间,数据可能有许多不同的振荡模式并存,一个在另一个上叠加,最后的结果是复杂的数据。
这些振荡模式,每个代表一个固有模态函数(IMF)有如下定义:
(1)在整个数据集,极值点的数目与零点数必须相等或最多相差一个
(2)在任何时候,由局部最大值和局部最小值确定的包络的平均值是零。
图1.1测试数据
固有模态函数相对于简谐函数表示的是简单振荡模式,但它更普遍:
不需要恒定的幅度和频率而这对一个简单的谐波分量是需要的,IMF可以把一个可变幅度和频率作为时间函数。
随着对IMF的上述定义,任何一个可以分解的功能如下:
如图1.1提供的数据,确认所有的局部极值,然后就可以用三次样条线将所有的局部最大值在包络上显示。
重复该过程来产生局部极小较低的包络。
上下包络应包括它们之间的所有数据,如图1.2所示。
他们的平均被指定为m1,也是在图1.2所示。
数据与m1之间的差异即第一个分量H1在图1.3所示。
也就是说,
这是由黄等人在1998年提出的。
图1.2数据(蓝色线)上下包络(绿色线)分别定义局部极大值和极小值,以及包络平均红色线;
图1.3数据(红色线)h1(蓝色线)
理想的情况下,h1应满足IMF的定义,应该表示为极大正值和极小负值的对称相等。
然而,即使这筛选过程再完美,柔和的斜坡上的一个波峰可以被放大成为局部端点,从而改变直角坐标系或曲线坐标系的局部零值。
经过第一轮的筛选,波峰可能成为局部最大值。
新的极值实际上以这种方式生成说明正确的方法也没有初步的检测。
事实上,通过反复筛,筛选过程也可以恢复信号,通过低振幅导行波表现。
在筛选过程中有两个目的:
消除导波,使波的轮廓更对称。
虽然、实现希尔伯特变换的首要目的是让得到一个有意义的瞬间频率,第二个目的,还必须在邻近的情况下取得的波动幅度有过大的差距。
为了实现这些目标,筛选过程必须尽可能重复多次使提取的信号达到IMF的标准。
在随后的筛选过程中,h1是可作为初始的IMF。
在接下来的一步,它是作为数据处理,然后
图1.4(顶部)H1与M2的反复筛选步骤。
(底部)H2与M3的反复筛选步骤。
如图1.4所示经过这种反复筛的方式,经过了k次筛选后的h1k成为了一个固定模态函数(IMF),即
这时,
图1.5经过15步筛选后的第一IMF分量c1
数据中的第一IMF分量如图1.5所示。
这时,必须确定一个关键的准则:
停止的标准。
从历史上看,两种不同的标准已使用:
第一种是在黄等人使用(1998年)的。
这个决定停止的标准是使用柯西收敛测试。
具体来说,测试需要计算连续两个筛选结果的标准差SDk的值来定义:
如果这个平方差SDK比预定值小,筛选过程将停止。
这个定义是如此地严格的,所以是非常难以执行的实践。
这里还必须解决两个关键问题:
第一,这个预定值是多么小的问题,就需要一个答案。
第二,这个标准并不取决于固定模态函数的定义。
比如,平方差可能很小,但是不能保证这个函数有相同的零极点数。
这些缺陷促使黄等人(1999,2003)提出的第二个标准以零点和极值点的关系为基础。
具体来说,一个筛选的次数是预先选定。
在S次连续筛选过程内,当零点数和极值数相等或最多相差一个,筛选过程将停止。
这第二个选择也有自己的困难:
如何设定筛选次数。
显然,任何选择是临时性的,但是一套严格的准则是必要的。
在最近对这个开放的筛选结束条件的研究中,黄等人(2003)使用了许多种可能性确定筛选次数从而形成整个IMF模型的方法,从全局平均到中心推导。
此外,通过局部值和平均的比较,黄等人建立了一种经验性的指导,即对于一般性的筛选,筛选的次数范围可以设定在4到8之间。
更多的细节会在后文介绍。
现在假设一个停止的标准,然后这个第一IMF分量c1被确定。
总体上讲,c1应该包含最好的频率范围或最短时间内信号的频率分量。
然后c1可以分离其余的信号成分,
图1.6原始数据(蓝线)剩余残量(红线)
然而如图1.6所示,剩余的r1仍然含有在长周期变换的数据。
它被视为新的数据,受到如上所述相同的筛选过程。
此过程可反复以后,所有的rj这样产生
筛选过程可以被任何预先确定的标准所停止:
要么当IMF分量cn或残余分量rn比预定值小时,或者rn成为单调函数不能从中提取任何固定模态函数。
即使是具有零均值数据,最终残留量仍然可以不是零均值的。
如果数据有一个趋势,最终残留量就表现了这一趋势。
通过总结(1.12)和(1.13),我们终于得到
因此,实现一个为N次经验模式的数据分解,并得到的残留rn可以是平均趋势或一个常数。
这里讨论的,适用EMD方法的均值或零值引用并非必需的,EMD技术只需要知道局部极值的位置。
每个分量的参考零点都在被筛选过程中产生的。
如果没有必要的零基准点,EMD在避免了消除非零均值数据的平均值等麻烦步骤上有意外收获。
图1.7一天长度的数据
EMD的成分通常是有物理意义的,它的特征尺度是由物理数据定义的。
要理解这一点,我们可以考虑图1.7中一天长度的数据,其中衡量自转周期偏差为固定的24小时。
在经历的不用筛选次数的筛选过程后得到的均值和IMF的标准偏差在图1.8a,b给出。
筛选结果如停止标准的选择好坏有一个准则,越低的标准偏差值表示筛选结果越好,因此,这些IMF结果是有其物理意义的。
第一分量代表短时间内大规模的风暴对地球的旋转速度造成的扰动,这种扰动直到90年代使用了全球卫星定位系统(GPS)才能被测量。
第二分量指半月潮汐变化的影响;
而第八个分量指每年的潮汐变化。
事实上,通过图1.9的自身年际变化图,年际变化实际上是与厄尔尼诺事件有关。
在厄尔尼诺发生的情况下,太平洋赤道水温回暖,而这变暖赋予更多能量到大气中。
这一结果,反过来,使大气层变得更加活跃。
在角动量产生的增加使得地球的旋转速度慢下来。
更出人意料的是,由NOAA确定为厄尔尼诺事件发生的期间1965年至1970年期间和1990年至1995年之间,不同筛标准偏差值均非常大。
图1.8(a,顶图)经过9步筛选后的平均IMF;
(b,底图)经过9步筛选后的平均IMF的标准差。
图1.9年平均周期及其包络。
每个包络的峰值都代表厄尔尼诺事件
这个例子验证了任何IMF分量的真正物理意义。
更根本的,有Flandrin等人最近的研究(2004年)。
Flandrin和Goncalves(2004年)还有吴和黄(2004)进一步确立了IMF分量的统计意义。
因此,现在正在进行测试能否给予固定模态函数(IMF)包含重要信息,或着只能代表噪音而已。
1.2.2.希尔伯特频谱分析
在已获得固有模态函数的分量,对每个IMF分量作希尔伯特变换,根据公式(1.2)-(1.6)计算每个瞬时频率将没有任何难度。
通过对每个IMF分量作希尔伯特变换后,原始数据可以表示为下列形式:
这里,残留分量rn已被排除在外,因为它要么是单调函数要么是一个常数。
虽然希尔伯特变换可以把它当作一个较长的振荡部分的单调的趋势,但剩余的趋势所涉及的能量相对于平均偏移仍肯可能过大。
在考虑较长趋势的不确定性时,对获取了其他低能量所包含的信息也应感兴趣,但很明显的振动分量,如最后一个非IMF分量应被排除在外。
不过,也可能将物理因素包括在内,如果要考虑物理因素的话。
公式(1.15)给出了时域上每个IMF分量的幅度和频率。
而下面的公式则是通过傅立叶变换表示相同的数据:
这里的aj和wj都是变量。
通过公式(1.15)和(1.16)的对比,我们知道了IMF实际上就是一个广义的傅里叶展开。
随时间变化的振幅和瞬时频率不仅大大提高了傅里叶展开的效率,而且也使展开以适应非线性非平稳数据。
通过IMF的展开,幅度和频率调制也清醒地分开。
因此,有了可变幅度和瞬时频率,代表傅立叶展开固定的的幅度和频率的限制已被克服。
这个幅度频率时间分布被指定为“希尔伯特振幅谱的”H(ω,t)的,或简单地称其为“Hilbert谱。
”如果振幅平方能很好地代表能量密度的话,则该平方值幅度同样可以代表Hilbert能量谱。
实际上最基本的Hilbert谱更可取,因为它提供了更多的定量结果。
其实,Bacry等人(1991年)和Carmona等人(1998年)曾试图提取作为连续小波系数局部极大值作为小波变换的骨架。
但是这种做法仍被谐波所影响。
如果需要有更多的定性结果,也可用二维平滑的Hilbert谱来模糊表示。
其结果是一种平滑的时频分布表现,但仍然没有谐波杂质。
根据Hilbert谱的定义,我们还可以定义边际谱的H(ω)为
边际频谱提供了在每个频率值上的总振幅(或能量)。
这个频谱是指在一个概率意义上对整个数据跨度的累加振幅。
经验模式分解和希尔伯特谱分析相结合,也被称为“希尔伯特黄变换”,简称HHT。
根据经验,所有的测试表明,HHT方法是一种时频非线性和非平稳数据分析优越的工具。
它是基于一个自适应的基础上,频率的定义是通过希尔伯特变换。
因此,没有必要的杂散谐波代表,作为处理方法中的任何一个先验的基础非线性波形变形,并没有时间或从卷积对频率分辨率不确定性原理的限制上也基于先验基础。
现将傅立叶变换,小波和HHT的分析比较摘要载于下表:
傅里叶变换
小波
希尔伯特
基础
先验
自适应
频率
卷积:
全部不确定
局部不确定
微分:
局部确定
表现
能量—频率
能力-时间-频率
非线性
不适用
适用
非平稳
特征提取
离散:
不适用;
连续:
理论基础
完整理论
基于经验
此表显示,HHT方法确实是分析非线性和非平稳过程数据的强大方法:
它是一种自适应的基础之上,频率的计算方法是分化而不是回旋,因此,它不受不确定性原理的限制;
它适用于非线性,非平稳数据,并在时频空间提取能力特征。
1.3最新的发展
以下几个领域的一些最新的发展将被详细讨论:
(1)归一化希尔伯特变换
(2)置信域
(3)IMF的统计意义
1.3.1归一化希尔伯特变换
众所周知,虽然希尔伯特变换适用于任何Lp类函数,变换后的相位函数不会总是产生一个物理意义的瞬时频率,如上所述。
减少IMF功能,提高了获得一个有意义的瞬时频率的机会,但获得IMF只能满足必要的条件;
额外的限制条件已被另外两个理论总结。
首先,Bedrosian定理(1963)指出希尔伯特变换的两个函数f(t)和H(t)可以写成
只有当对f(t)和H(t)的傅里叶频谱在频率空间是完全不相交的,且以H(t)的频谱频率范围是高于f(t)。
这种限制是至关重要的:
如果瞬时频率来自公式(1.3)到(1.6)的相位函数的计算,数据就可以用IMF形式表示为:
这时,希尔波特变换的共轭部分为:
然而,根据Bedrosian定理,(1.20)只有在振幅变化非常缓慢,包络的频谱和载波才不相交。
这种情况下的希尔伯特变换是有问题的。
为了解决这一问题,黄和龙(2003)提出,IMF被如下归一化:
开始的数据已经是固定模态函数。
首先,找到所有的IMF中的最大值,然后,通过所有的最大值定义由一个样条包络,并指定为E(t)。
现在,可以用除以E(t)来归一化IMF:
Co(t)是包含所有局部最大值的载波函数,上述的归一化函数在图1.10中给出。
图1.10平均希尔伯特谱
这种结构应作出振幅总是归于整体的而异常清晰地存在,而且可能引起并发症,从曲线拟合,主要发生在幅度波动较大的点。
然后,拟合曲线可以在数据下面,造成归一化函数比整体的幅度更大。
虽然这些情况很少见,他们就可能发生。
每当他们这样做,肯定会出现错误,这将在下面讨论。
即使是一个完美的归一化,也不是所有的问题都已解决。
对于接下来的困难将会提出Nuttall定理。
Nuttall定理(1996)指出,希尔伯特变换余弦不一定是简单的90◦相移,结果可以产生与任意一个相位函数功能相同的正弦函数。
Nuttall给出了一个误差界限概念ΔE来定义希尔伯特变换Ch和正交分量Cq(正好有90◦的相移)之间的差异:
这里的Sq是正交函数的傅立叶频谱。
虽然这个定理的证明是严谨,其结果是很难有用的。
第一,它是表示在一个仍是未知正交函数的傅立叶频谱;
第二,它提供了固定误差在整个数据范围的约束。
对于一个非平稳时间序列,这种经常性的约束不会揭露关于时间轴错误的位置。
对于归一化,黄和龙(2003)提出了一个变量误差界限定义:
该误差为归一化信号与整体的平方差。
这一概念的证明很简单:
如果希尔伯特变换是完全正交,顾名思义幅度平方是一致的,差异为零。
如果振幅平方是不一致的,那么希尔伯特变换不能完全正交。
两个可能的结果可能导致下列错误:
第一,归一化过程不清楚,如上所讨论的,因此归一化振幅可以过度一致,误差将会不为零。
第二个问题可能来自一个高度复杂的相函数,如黄等人(1998年)讨论,这时的相位图将不会是一个完美的圆。
任何圆的偏差会导致幅度在整体上的差异。
黄和龙(2003)和黄等人(2005年)进行了详细的比较,发现结果相当令人满意。
另外,黄等人(2005)建议,相位函数可以通过计算反余弦的归一化函数发现。
以这种方式获得的结果也是令人满意的。
但是,两个问题仍然困扰着这种方法:
第一,任何不完美的归一化会给予归一函数值比上面所讨论的整体值更大。
再这一条件下,反余弦函数将会被破坏。
其次,计算精度的要求是相角高度靠近0°
和180°
。
我们可以证明,归一化希尔伯特变换的问题总是发生在振幅急剧变化或幅值非常低的位置上的。
1.3.2置信域
在数据分析中,置信域始终是必要的,它提供了有关结果的合法性的保证措施。
因此,对傅立叶频谱的置信域分析是由常规计算,但计算是基于遍历理论的,其中的数据进行细分成N段,从每个部分被计算为基础。
置信域从N个不同谱统计展开的。
当所有的遍历理论的条件得到满足,时间一般被视为总体平均。
不幸的是,只有满足平稳过程,遍历的条件才能满足,否则,他们将没有意义。
黄等人(2003年)提出,利用多种方式的无限分解成不同的组件之一给出函数存在不同的方法。
使用EMD方法,很多不同的IMF可以被获得通过改变停止标准。
例如,黄等人(2003)探讨通过改变的筛选次数来改变停止准则。
他们将筛选次数从1改到20,研究均值和Hilbert谱的标准差。
由此所得的置信度不依赖于遍历理论。
如果使用相同的数据长度,频谱分辨率不降级的频率空间,通过子数据划分为若干个部分。
此外,黄等人还引用了间歇标准,迫使相对于不用的筛选次数有着相同的IMF数目。
因此,黄等人希望能够找到图1.9所示的具体IMF的平均值。
特别令人感兴趣的是高标准差的时期从1965年到1970年和1990-1995。
这些周期是异常的厄尔尼诺现象期间,当在赤道地区的海水表面温度持续高值的基础上观察,显示出海洋长时间加热,而不是从温暖到寒冷过程中的变化在厄尔尼诺到拉尼娜变化期间。
最后,从置信度的研究中,一个意想不到的结果是最优筛选次数的确定。
黄等人(2003年)计算之间的个别案件和整体平均差异,并发现其中一个范围一直存在的差异达到当地最低。
根据他们使用不同的数据集,黄等人的有限经验推出,一个筛选次数在4至8范围内表现良好。
逻辑上还说明筛选次数不应该太高而使IMF失去了所有的物理意义,也不应该太低,而留下一些IMF的导波。
1.3.3IMF的统计意义
EMD是根据其不同的频率范围将不同数据分量分离的方法。
所以IMF的统计意义的问题始终是一个问题。
在含有噪音数据,如何才能自信地将信号从噪声分开?
这些问题被Flandrin等人(2004年)提出,Flandrin和Goncalv`es(2004年),吴和黄(2004)开展了对噪声的研究。
Flandrin和Goncalv`es(2004年)研究了分数高斯噪声,发现EMD是一个二进制滤波器。
这些研究人员还发现,当一个绘制为从分数对一个对数尺度高斯噪声所产生的平均周期函数的均方根(RMS)的IMF值,结果形成了一条直线。
白噪声直线的斜率是-1,但是,值发生定期的变化随着不同的赫斯特指数。
基于这些结果,Flandrin等人(2004年)和Flandrin和Goncal