毕业论文基于ADPCM的语音编解码设计.docx

上传人:b****3 文档编号:10857073 上传时间:2023-05-28 格式:DOCX 页数:44 大小:303.96KB
下载 相关 举报
毕业论文基于ADPCM的语音编解码设计.docx_第1页
第1页 / 共44页
毕业论文基于ADPCM的语音编解码设计.docx_第2页
第2页 / 共44页
毕业论文基于ADPCM的语音编解码设计.docx_第3页
第3页 / 共44页
毕业论文基于ADPCM的语音编解码设计.docx_第4页
第4页 / 共44页
毕业论文基于ADPCM的语音编解码设计.docx_第5页
第5页 / 共44页
毕业论文基于ADPCM的语音编解码设计.docx_第6页
第6页 / 共44页
毕业论文基于ADPCM的语音编解码设计.docx_第7页
第7页 / 共44页
毕业论文基于ADPCM的语音编解码设计.docx_第8页
第8页 / 共44页
毕业论文基于ADPCM的语音编解码设计.docx_第9页
第9页 / 共44页
毕业论文基于ADPCM的语音编解码设计.docx_第10页
第10页 / 共44页
毕业论文基于ADPCM的语音编解码设计.docx_第11页
第11页 / 共44页
毕业论文基于ADPCM的语音编解码设计.docx_第12页
第12页 / 共44页
毕业论文基于ADPCM的语音编解码设计.docx_第13页
第13页 / 共44页
毕业论文基于ADPCM的语音编解码设计.docx_第14页
第14页 / 共44页
毕业论文基于ADPCM的语音编解码设计.docx_第15页
第15页 / 共44页
毕业论文基于ADPCM的语音编解码设计.docx_第16页
第16页 / 共44页
毕业论文基于ADPCM的语音编解码设计.docx_第17页
第17页 / 共44页
毕业论文基于ADPCM的语音编解码设计.docx_第18页
第18页 / 共44页
毕业论文基于ADPCM的语音编解码设计.docx_第19页
第19页 / 共44页
毕业论文基于ADPCM的语音编解码设计.docx_第20页
第20页 / 共44页
亲,该文档总共44页,到这儿已超出免费预览范围,如果喜欢就下载吧!
下载资源
资源描述

毕业论文基于ADPCM的语音编解码设计.docx

《毕业论文基于ADPCM的语音编解码设计.docx》由会员分享,可在线阅读,更多相关《毕业论文基于ADPCM的语音编解码设计.docx(44页珍藏版)》请在冰点文库上搜索。

毕业论文基于ADPCM的语音编解码设计.docx

毕业论文基于ADPCM的语音编解码设计

1绪论

 

1.1课题研究的背景和意义

随着社会时代的发展,人类迅速进入信息时代,对于各种资源的利用率要求越来越高,从而推动了语音编解码技术的飞跃发展。

与此同时,伴随着微电子技术的快速发展,以及超大规模集成电路设计技术的不断完善,使得语音编解码技术越来越广泛的深入到通信领域、消费电子领域,辟如数字录音笔、IP电话、复读机等等都是语音压缩编码技术的典型应用。

语音编码技术就是将模拟的语音信号数字化离散化,利用语音听觉上的制约或者数据的冗余度来压缩信号的一些不必要的信息,以此来增加传输速率、减少存储容量,然后再进行传输、存储或者处理,而解码就是相反的一个过程。

ADPCM是自适应差分脉冲编码调制的简称,是语音编码的多种算法中的一种,更是最早使用于数字通信系统中的一种语音编解码算法。

此算法利用了语音信号样点间的相关性,针对语音信号的非平稳特点,使用了自适应预测和自适应量化,即预测器和量化器它们的参数能随着输入信号的统计特性,自适应于或接近于最佳的参数状态,在32kbps的速率上能够给出网络等级话音质量。

ADPCM究其本质是一种针对16bits(或8bits或者更高)声音波形数据的一种有损压缩算法,它可以将声音流中每次采样的16bit数据用4bit来存储,所以其压缩比为1:

4。

而且它的压缩/解压缩算法非常简单,所以又是一种低空间消耗、高质量高效率声音获得的好途径。

ADPCM其主要是针对连续波形数据的,保存的则是波形的变化情况,从而以达到描述整个波形的目的。

1.2语音编码的发展和研究状况

数字语音有很多的优点是模拟语音不可比拟的,它能更方便的传输和存储,可以在噪声信道中进行相当可靠的传输,容易进行交换,能够很方便的对信号进行加密传输。

数字语音可以由模拟语音简单的抽样,量化来得到,但由于数字语音其数据量比较大如果不经过处理,那它在传输和存储时就会占用很大量的信道资源以及存储空间,那么给系统提出的要求势必就会很高,所以数字语音通常情况下都是要进行压缩编码的。

在确保编码语音一定质量的前提下,究竟如何高效率进行压缩编码,或者说在给定信息速率的前提下,如何去提高编码后的语音质量,是当代语音编码所要研究的重点。

语音编码技术一般分为两种:

信源编码和信道编码。

信源编码的目的是为了提高信号的传输和存储效率,在这指的就是数字语音信号被压缩的比特率(即每秒钟传输语音信号所得出的比特数,通常也可以称为数码率),使得更多路的语音信号能在同样的信道容量中传输,或者说只需要较小的容量存储数字语音信号,所以这一类编码又被称为语音信号的压缩编码。

而信道编码因为是为了提高传输的可靠性而作出的处理,所以又被称为可靠性编码。

语音信号编码从方法上讲有波形编码和分析合成系统两大分支。

波形编码是以尽最大可能无失真的重构出语音波形为目标,在其编码时以波形逼近为基本原则,在时域上或变换域上直接进行编码,虽然这种方法压缩效率不很高,但是在64~16Kb/s的速率上,却可以合成出相当高的语音质量,然而在速率进一步下降时,编码语音的质量将会随之大幅度下降。

常用的波形编码算法有:

时域上编码的PCM(PulseCodeModulation),ADPCM,APC(AdaptivePredictiveCoding);在频域上进行编码的子带编码SBC(Sub-BandCoding)和自适应变换编码ATC(AdaptiveTransformCording)。

分析合成系统是把语音信号产生模型作为基础,把语音信号变换成模型参数后再进行编码,因此又称之为参数编码。

参数编码其出发点同波形编码有所不同,它的原则是以在尽量保持语音可懂度的条件下,为语音信号搭建一个数学模型,然后通过给定的语音信号计算模型参数并且量化编码来实现。

而且它的模型参数对比于语音波形来说数据量是很小的,因而其压缩效率很高。

虽然也许参数编码会导致重建话音和原始语音在它时域波形上有很大的区别,但它的可懂度仍然可以保持在一个相当高的程度。

现在,还时常采用混合编码的方案,混合编码是波形编码和参数编码优点的结合,这种结合是保留分析合成编码技术精华的基础,引用波形编码准则优化激励源信号,从而在一个较小的数码率上(4.8~9.6kbit/s)获得更高质量的合成语音。

自1937年以来的脉冲编码调制(PCM)是AH里夫斯已经提出,语音编码技术的发展历史已经超过60年。

尤其是在过去的20年里,随着计算机的语音编码技术和微电子技术的发展得到了快速发展。

64kbit/s的PCM系统标准CCITT于1972年确定了64kbit/s的PCM语音编码G.711建议,已被广泛应用于数字交换机,数字通讯等领域,到现在为止,仍然是占主导地位。

虽然这种编码方法可以得到良好的语音质量,但缺点是,它会占用更多的带宽,有限的带宽资源条件下不使用。

CCITT在20世纪80年代初,就开始专攻小于64KB/s的非PCM编码算法,32K比特/秒ADPCM语音编码G.721建议,于1984年通过,它不仅可以实现与PCM等效语音质量,还更好的抗误码性能,它被广泛用于海底电缆,卫星​​,和可变速率的数字语音内插编码器清空设备。

连续地,在那之后,1986年,1988,做了进一步的修改在此,也可以是32K比特/秒的PCM比特率,一般是高速率的一半,达到接近正常的PCM语音质量,防误性能优于PCM格式。

随后颁布G.723标准,扩大到24Kbit/s和40Kbit/s的编码标准税率。

1990年G.723,G.721由ITU合并,将进一步扩展的编码率16KBIT/秒,从而促进G.726标准形成的。

语音插值技术和浮动利率结合原来的PCM通道的ADPCM编码,可扩展到8-10倍,称之为数字语音通道倍增设备DCME。

G.726标准算法不仅简单,但高品质的声音,即使在经过反复的切换,以确保他们的声音质量,所以网络会议系统,8-ISDN通信和VOIP网络通信等方面具有广泛的应用。

然后16KB/s的低时延码激励线性预测(LD-CELP)G.728建议,在1992年出版。

正是由于其较低的利率,高性能,低延迟在实践中广泛使用,如:

单路单载波卫星,无绳电话和数字插值空气设备,海事卫星通信,存储,数字移动无线系统,分组语音,转发系统,语音留言录制。

最后,在11月1995年共轭代数码激励线性预测(CS-ACELP)8KB/s的语音编码G.729建议ITU-TSGl5全体会议通过,并通过G.729附件降低复杂8KB/s的CS-ACELP讲话编解码器在ITU-TSGl51996年6月的会议上正式成为国际标准。

这种编码其延迟小,可以节省带宽的87.5%,为32KB/s的ADPCM语音质量,音质在同级别最优的比特率,在嘈杂的环境中也可以更好的语音质量。

虽然CS—ACELP语音编解码器占用比特率比ADPCM的少,但是其算法复杂度远没有ADPCM的算法简单明了,所以在现代通信系统中,ADPCM这种编码算法仍然占主导地位。

1.3语音压缩编码的评价

语音质量是一个语音编码系统必然要保证的性能指标,速率再低,编码效率再高,不能得到满意的语音质量也不能算是一个优良的编码算法。

那么,在语音压缩编码中,怎样评价一个语音压缩质量的好坏就成为了是一个极其重要的概念,通常,评价语音压缩的标准主要有以下几点:

1)语音质量

语音质量的评价方法可分为主观评定和客观评定两大类。

客观评定方法用客观测量的手段来评价语音编码质量,常用的方法有均方误差、信噪比、加权信噪比、平均分段信噪比等。

主观评定方法是用人们自身去感受语音质量的感觉,然后主观评判其语音压缩编码的质量。

2)编码速率

编码速率,可以使用“比特/秒”(比特/秒或bps)的措施,即总速率编码,通常用I表示,即每秒的编码比特的数量。

3)编解码复杂度

所谓编解码的复杂度指的就是实现一个信号编解码算法的难易程度。

编解码算法的复杂程度和语音编码的话音质量有着相当密切的联系。

在一个相同的数码率情况下,算法复杂一些的将会获得更好的语音质量。

编解码复杂度可以由算法复杂程度、硬件实现及价格等许多因素来衡量。

4)编解码延时

数字音频编解码器的延迟主要由两部分组成:

算法延迟和处理延迟。

之前的压缩的音频信号到高速缓存中的数据必须是有效的,这个时间延迟称为算法延迟,它是不是唯一的方法,以减少通过改变延迟时间。

即,音频信号压缩编码器和解码器的编解码器的实现在不同的应用程序所需的时间的处理延迟,国际社会已延时的编解码器不同的要求,如长途编解码器延迟不超过5-10毫秒,但对于可视电话可以扩展到几十毫秒到几百毫秒。

5)稳健性(Robustness)

所谓稳健性是指编译码系统的抗噪声、抗信道误码能力。

一个实用的声码器,其误码率要求在10-3的信道上传输时,语音质量不至于过分恶化,而对于移动通信中的声码器则要求在信道误码率为3×10-2时仍能正常工作。

ADPCM就语音质量的评价上来说,语音质量的客观评价方法主要采用均方误差和信噪比来评定。

但客观评价还不能全面反映人对语音质量的感觉,而主观评定方法符合人们对语音质量感觉的要求。

主观评价的优越性,主要体现在其处理还原后给人主观感觉效果很好,感觉语音失真度小;就编码速率来讲,ADPCM的编码速率为16KB/S,优于其他编码方式;就其编解码的复杂度而言,ADPCM采用四位二进制的差值编码方式,使用起来简单又容易实现;它的抗噪能力也比较强即稳健性相当好。

1.4论文研究的主要内容及章节内容安排

本论文研究的内容是语音编解码的算法及软件实现过程,主要是研究ADPCM的语音编解码算法及在MATLAB软件中的实现。

论文共分4章,各章内容安排如下:

第一章:

简要介绍课题研究背景和意义,语音编解码的发展和研究状况以及它的评价标准。

第二章:

主要介绍语音信号脉冲编码基本理论,为对语音进行ADPCM编码译码系统提供理论依据。

第三章:

介绍PCM与DPCM(DifferentialPulseCodeModulation)的工作原理,并对二者进行比较,从而体现出DPCM编码的优越性。

接着介绍增量调制DM(deltamodulation)及自适应增量调制ADM(adaptivedeltamodulation)的原理与运用,二者比较得出ADM更容易跟踪信号变化快的的语言,最后阐述了ADPCM的由来及主要原理。

第四章:

确定ADPCM实现的总体设计框图,以及ADPCM编码和解码实现过程的设计流程图,并采用MATLAB软件对ADPCM编解码系统的实现进行了仿真。

 

2语音信号脉冲编码基本理论

 

当前最主要的通信业务有电话、图像(传真、电视)等,它们都是时间上和幅度上连续的模拟信号,如果要想实现数字化的传输和交换,则首先要做的就是把模拟信号变化成数字信号,电话信号数字化一般被称为语音编码,而图像信号数字化就被称为图像编码。

虽然两者各有各的特点,但两者的编码原理基本上仍然是一致的。

而当前的通信网中很多业务基本上都是电话业务,因此语音编码将为本章讨论的重点。

可以说这些理论对任何模拟信号数字化的实现过程都是适用的,其不失一般意义。

依照语音的特点,通常把语音编码方法分为波形编码和参量编码,波形编码是指对信号的波形进行编码,它具有较高重建信号质量的能力。

参量编码则是通过提取语音信号的一些特征参量,从而对其进行编码,它的特点是码速率较低,但其语音质量要较波形编码差一些。

波形编码的质量比较高,通常在300~3400Hz话路通道中传输模拟信号(例如模拟数据信号、电话信号、传真信号及各种随路信令信号等)在数字化以后,仍然可以达到原来的质量容限。

这一特点是通信网由模拟转换为数字过渡过程中极其重要的一点。

根据语音的特性,通常分为波形编码和参数编码类型的两类语音编码方法,波形编码,用于编码的信号波形,它具有更高的能力来重建信号的质量。

参数编码是通过提取语音信号的参数的一些特点,从而编码,它的特点是较低的比特率,但不如波形编码的语音质量。

波形编码质量是比较高的,通常会在通道300〜3400Hz传输各种模拟信号(如模拟数据信号,电话信号,传真信号,与信道相关信令的各种信号)后的数字仍实现其原来的质量宽容。

的通信网络,其特征在于由模拟到数字的转换是非常重要的。

语音信号有很多波形编码方法,例如脉冲编码调制(PCM)、自适应增量调制(ADM)、自适应差值脉冲编码调制(ADPCM)、子带编码(SBC)、矢量编码(VQC:

VectorQuantitationCoding)等。

为对语音进行ADPCM编码译码系统提供理论依据,下面主要介绍编码的一些基本理论。

2.1语音信号压缩的基本原理

在数字通信中,语音信号被编码为二进制数字序列,通过信道传输或存储,在经过解码后恢复为可懂的语音。

将语音信号编码为二进制数字序列后再经传输或储存有其独特的优点。

例如,可摆脱传输或存储中噪声的干扰。

模拟传输信道的噪声总是要使语音信号发生畸变,而数字通信只要有足够的通信站,就能排除所有噪声的影响;另一方面,磁带录音机存储模拟信号时要受磁带噪声和其他噪声的影响,而采用计算机存储数字语音信号时,惟一的失真来自模数转换前的低通滤波。

另外,数字编码的信号还便于处理和加密、再生与转发,也可与其他信号复用一个信道,设备便于集成等。

最简单的语音编码方法是对其直接进行模/数变换;只要其取样率足够高,量化每个样本的比特数足够大,那么就能保证解码恢复的语音信号有非常好的音质,而且也不会丢失有用信息。

可是对语音信号直接进行数字化其所需数码率太高,比如普通电话通信中采用8KHZ取样率,如用12bit进行量化,则数码率为96kbit/s,这样大的数码率即使对很大容量的传输信道也是难以承受的。

而语音信号用PCM编码后,数码率为64kbit/s,不进行压缩很难用调制解调器在电话线路上传输,所以必须进行压缩编码。

对语音进行编压缩码的基本依据有两个。

一是,从产生的物理机理和语音结构的性质来看,语音信号中存在较大的冗余度。

从信息保持的角度讲,只有当信源本身具有冗余度,才能对其进行压缩。

语音压缩实质上就是识别语音中的冗余度并设法去除掉它们。

冗余度最主要部分可以分别从时域或频域来考虑,归纳起来有以下几个方面:

1,语音信号样本间的相关性很强,即其短时谱不平坦。

2,浊音语音段具有准周期性。

3,声道的形状及其变化比较慢。

4,传输码值的概率分布是非均匀的。

语音编码的第二个依据是利用人类听觉的某些特性。

人耳听不到或感知不灵敏的语音分量可视为冗余(这种冗余可看作为主观上的冗余),所以可以利用人耳感知模型,去除掉人耳感觉不灵敏的语音分量,而重构后的语音质量不明显下降。

总之,利用冗余度或者是听觉上的制约,可以压缩表示语音信号的必要信息,从而可降低传输速率或存储容量。

下面给出脉冲编码的基本框图:

图1模拟脉冲编码框图

2.2采样定理

2.2.1Nyquist采样定理

采样是指将时间上连续的模拟信号变为时间上离散样值的过程。

采样定理最主要要回答的问题是看能不能由离散样值序列重建出原始的模拟信号。

且抽样定理还是任何模拟信号数字化的理论基础。

其主要有以下几种:

①Nyquist采样定理;②带通采样定理;③自然采样④平顶采样。

接下来简单的介绍一下Nyquist采样定理和带通采样定理。

Nyquist采样定理:

设定一个频率带限信号为

将其频带限制在(0,

)或以下,若对

以不低于

的采样速率进行等间隔采样,那么获得时间离散的采样信号

(其中

称为采样间隔),通过所得到的采样值

原信号

将完全的确定。

奈奎斯特采样定理指出,如果信号是一个不小于2倍的采样率进行采样的,则由所得到的离散采样值就可以唯一的恢复原信号。

根据抽样理论,使采样信号通过一个低通滤波器,其带宽不小于

,过滤掉高频成分,因此它可以恢复的原始信号

的无失真的从

中。

随着时间离散采样值来代替连续时间模拟信号的采样定理的意义是,这将模拟信号处理数字化奠定了理论基础。

2.2.2带通信号采样

Nyquist采样定理仅仅讨论了频谱分布在(0,

)上的基带信号的采样问题,但在实践中,我们遇到的信号,尤其是语音信号中,通常会在一个有限的频带(

)范围内的信号的带通频率分布,由奈奎斯特采样定理,依然能按照

的采样速率去进行采样。

时,即当信号最高频率

远远大于该信号带宽B时,若仍然按照Nyquist采样率去进行采样的话,那么它的采样频率就会变得很高,从而就很难去实现,或随后的处理速度是非常困难符合要求的。

带通采样定理:

设一个带限信号

将其频带限制在(

)范围内,若其采样速率关系式满足:

(1)

其中n为整数,其取值区间为:

[0,N],N为

/B的整数部分。

那么

的频谱将不会发生混叠,即能从

中无失真的恢复出

从以上采样定理中很容易推导出最低采样率

(2)

(当n=最大值N时,

最小),且又由式可以得知:

带通采样频率最小值在2B到4B之间,即

(3)

通常,当带通信号的带宽比信号的最低频率

大时,就可将此信号作为低通信号处理。

只有当不满足上述条件时才使用带通抽样定理。

2.3量化定理

2.3.1基本概念

量化是指将一个幅度连续变化的信号变为一个离散信号的过程。

由于用有限长度的二进制数字码组表示模拟信号样值是PCM的数字化过程,然而有限长度的二进制数字码组又只能代表有限数量的样值,所以若要用有限的数量样值去表示原模拟信号无限个幅度抽样值,那么就需要对其进行量化。

量化的方法就是,将所需量化样值的最大变化范围分成若干个相邻区间段落,当其样值落在某一间区间内,它的输出数值就用此区间内的某一个单一固定值来表示。

量化间隔可以是相等的,也可以是不相等的,一般有均匀量化和非均匀量化两种量化方法。

从量化结果可以发现,不论量化的间隔有多么小,都会带来一定的误差,随之就产生了量化噪声。

虽然将量化间隔取得较小,量化级数会因此变多从而能减小一定的量化误差,但与此同时,也会相应的增加数码率,提高编码设备的复杂程度,而且需要较宽的传输信道。

例如,对语音信号,其抽样速率为

如果每个样值编码8位,量化共有256个量化间隔,每路语音PCM编码后的数码率为8x8=64kib/s;如果每位样值编11位码,数码率提高到88kbit/s。

2.3.2均匀量化

均匀量化也叫线性量化,它在量化时各量化间隔是相等的。

任意一个量化器都会有一定的量化范围,通常取-V~V。

在均匀量化的情况下与,量化间隔(Δ)和量化级数N的关系为:

(4)

通常情况下每一个量化间隔内的量化值可以取此区间内的任意一值,但是理论上为了减小平均量化误差功率,一般量化值的取值会取量化间隔中间值,那么这样量化的最大误差便为Δ/2。

一般来说,信源码都是二元码,所以其码位n与量化级数N的关系为

对于均匀量化的量化间隔或是量化电平用n位码表示,就得到了数字编码信号,通常称为线性PCM编码信号。

2.3.3非均匀量化

非均匀量化是一种量化间隔取决于使用不同信号的,在信号幅度值比较小的区间内就采用小的量化间隔,而在信号幅值比较大的区间内则采用大的量化间隔,量化间隔不再是一个恒定值。

非均匀量化较均匀量化方法具有以下两个优点:

a)当对一个概率密度非均匀分布的语音信号进行量化时,非均匀量化方式就可以得到较高的平均信号量化噪声功率比。

b)在非均匀量化,量化噪声的语音信号的rms值的功率大致成比例的采样,即,量化的或大或小的语音信号的量化噪声信号的方法,无论水平是相同的,即改善均匀量化的声音时,小信号量化噪声比。

非均匀量化小的用于小信号的量化噪声,以确保在同一时间有一定的限制,在量化过程中,有足够的动态范围的量化比特数并没有把一个大的信号过载。

如果我们知道的语音信号的幅度的概率密度函数的序列,我们可以设计给定的量化比特数的量化噪声是最小的非均匀量化器。

输入语音信号的方差和概率密度函数进行量化,与量化的质量密切相关,我们需要通过量化方法一种受二者影响较小的,目前在这方面的杰出贡献的,我们经常看到的A律或μ律量化。

非均匀量化的过程中,可以等效地视为非线性的压缩语音信号的振幅,然后的线性量化处理。

非线性压缩方法是目前​​理想的对数压缩。

所谓的对数压缩,也就是说,要量化的对数压缩的语音信号的振幅值,振幅的第一语音信号的对数,然后量化值,提高量化器的动态范围。

在解码侧,通过过程的逆过程-恢复的话音消息的采样的指数函数的对数。

仅取自量化步长的量化噪声对数压缩,从该语音信号的方差。

然而,其值的对数的语音信号的振幅可能很大,需要定量或定量的特定的量化比特的电平,以便对数压缩更难以实现。

可将对数压缩特性作些近似,这样才有了后来的律的压缩方式:

先将语音抽样信号作公式(5)变换得到

量化器再对

进行量化。

(5)

时,当

时,当

时,

输入输出信号相同,即没有进行压缩,信号子幅度范围即量化电平均匀分布;当μ很大,并且

也很大时,则有:

(6)

此时的μ律量化器的信噪比可推导为:

(7)

由上述公式可知:

μ律量化器信噪比

关系不大。

大量实验结果表明,对于一个固定的

值,若

减为二分之一,则

减少6dB;而对于一个固定的

值,码每增加一位,则

增加6dB。

μ律量化器以量化信噪比作较小牺牲为代价,使量化器有一个比较宽的动态范围。

通常作为“长途电话质量”语音波形标准的7位μ律PCM在动态范围合适的情况下保持有34dB的信噪比。

而若用均匀量化器得到同样宽度的动态范围,大约需要11位,比μ律量化器高出50%还多。

2.3.4自适应量化

一方面,在语音信号中的量化器的量化步长,从选定的足够大,以适应动态范围;另一方面,希望减小量化步长,以减少量化噪声相差。

这种现象的原因是语音信号,语音通信过程是不固定的。

与扬声器或通信环境的变化,和由浊音清音段到段的语音内容,语音信号的幅度会在一个很宽的范围内。

正如我们所看到的,使用非均匀量化,以适应这些幅度的波动是一种方式,还有一个比这更好的方式,采用自适应量化,即使量化的量化步长自动适应输入电平的变化。

在本节将介绍自适应量化的一般原则。

自适应量化的基本思想,是使量化步长的距离,变成输入信号相匹配的幅度变化,作为输入信号的振幅从规定的变化,从而进一步提高其定量结果的量化步。

也可以在前面的一个固定量化器的自适应增益控制,使之进入到量化器的输入信号保持到一个固定的常数方差。

这两种方法是等效的。

这两种方法应容易地估计随时间变化的输入信号的振幅,来纠正从Δ(n)的量化步长的增益值。

并根据不同的估计方法,自适应量化可以分为两种类型:

一种是输入振幅或输入估计值本身的方差,此程序被称为前馈自适应量化(AQF),另一种是,在根据与量化步长从量化器输出

是自适应的,或等价的输出码字C(N)自适应调整,这个程序被称为反馈自适应量化(AQB)。

无论的AQF法或AQB方法,可以显着提高量化的输入信号电平变化的适应能力,可以使大或小信号输入信号输入具有很高的量化噪声比。

1)前馈自适应量化

所谓前馈自适应是指,信号

的能量或者方差是通过输入信号

其本身估算出来的,通常是先在估算出

的方差

后,然后令两种系统输出

(8)

正比于

,而

反比于盯

因为量化噪声不能影响的AQF估值方法,所以AQF估值相当可靠的。

在同一时间,这也意味着,为了信息的传送量,使用额外的比特到解码器,被称为边信息。

典型5-6位需要编写每个量阶,所以,估值的频率不能太高,不然总的编码速率过大,一般为10至30毫秒的时间估计。

AQF方法还具有的另一个问题是,将引入一个较长的编码延迟,它经常被用于子帧的编码处理。

2)反馈自适应量化器

反馈自适应量化器的估值方法是使用量化的信号后去提取量阶信息,所以就避

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 表格模板 > 合同协议

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2