ImageVerifierCode 换一换
格式:DOCX , 页数:57 ,大小:639.02KB ,
资源ID:14781822      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bingdoc.com/d-14781822.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(面向麦克风阵列应用的声源定位算法研究概要.docx)为本站会员(b****5)主动上传,冰点文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰点文库(发送邮件至service@bingdoc.com或直接QQ联系客服),我们立即给予删除!

面向麦克风阵列应用的声源定位算法研究概要.docx

1、面向麦克风阵列应用的声源定位算法研究概要华中科技大学硕士学位论文面向麦克风阵列应用的声源定位算法研究 姓名:徐燕子申请学位级别:硕士专业:微电子学与固体电子学 指导教师:江建军20090525摘 要随着语音通信技术的发展,对声源定位的实时性和精确性要求越来越高,基于麦 克风阵列的语音处理方法已成为研究热点之一。然而,受系统灵活性、应用方便性和 算法精确性等方面的影响,目前国内麦克风阵列产品虽有部分应用,但是仍然具有一 定的局限性。因此,为了推进麦克风阵列的应用,对麦克风阵列及其算法开展研究, 具有实用价值和意义。为了利用麦克风阵列实现对实际声源的定位功能, 本论文着重于声源定位算法研 究。在

2、LabVIEW 环境中设置了仿真模型,考虑室内混响和噪声的影响,分别实现了 基于时延估计的声源定位法和基于子空间技术的声源定位法, 并讨论了各种算法的适 用范围。基于时延估计的声源定位法分为时延估计和声源定位两部分,其中时延估计 部分讨论了各种加权因子的 GCC 时延估计法, 声源定位部分讨论了角度距离定位法、 最小二乘法和球形插值法的特点和定位效果。 基于子空间技术的声源定位讨论了二维 MUSIC 方法对远场声源的 DOA 估计。经仿真结果对比分析,讨论的各种算法基本上 可以实现声源定位功能,但是局限性和精确性各有不同,如正常情况下的最小二乘法 和球形插值法精确性好,但是不适用于四元阵列,需

3、针对实际系统进行改进;角度距 离定位法在远场情况下对距离的估计误差较大等等。通过仿真实现声源定位功能后,针对系统构建,将算法移植到硬件平台上,对实 际声源进行定位。在仿真过程对实际系统的理论指导下,选用了各种加权的 GCC 时 延估计法和角度距离声源定位法进行实际声源定位,实验证明,该系统能够比较精确 地对半空间域的声源进行定位。关键词:麦克风阵列 时延估计 声源定位 MUSIC 算法 LabVIEWAbstractWith the development of the voice communications technology, attention is mainly paid to t

4、he performance of the real-time character and the accuracy for acoustic source localization. Thus the acoustic signal processing methods based on microphone array have become a hotspot in the research area. However, the applications of microphone array commercial products are still limited in domest

5、ic up to now owing to lacking the flexibility of system, the convenience in use and the accuracy of algorithm. Therefore, in order to popularize the application of the microphone array, the improvement of the algorithm and hardwares on the performance of acoustic source localization are of important

6、 value. The research is focused on the algorithm to obtain the sound source localization practically. A simulation model is put forwad firstly in the LabVIEW environment, after taking both the reverberation and noise into account. Then, the time delay estimation and the sub-spatial algorithm of the

7、acoustic source localization are carried out. As a result, the application scope and the effects of various algorithm are further discussed. As the time delay estimation algorithm is divided into two steps, kinds of weighted generalized cross correlation (GCC algorithm are simulated for time delay e

8、stimate, while the angle-distance method, the Least-Square (LS method and the Spherical Interpolation(SI method are discussed for the acoustic source localization. The sub-spatial algorithm also includes different types of methods, here only a two dimensions (2D MUSIC method based on a far-field sig

9、nal model is applied. After being analyzed and discussed, the simulation results indicate that, the methods in the thesis can acquire the location of the acoustic source with different limitations and accuracy. For example, the SI method and the LS method under normal circumstances are accurate, but

10、 they are not suit for four-element microphone array, so the algorithms are adjusted to acquire a satisfying perform. The error of the distance caused by the angle-distance method is relatively large while the source is in a far field, etc. As the simulated result turned to be fine, the algorithms a

11、re transplanted to the hardware platform according to the requirement of the system. The integration of the hardware and software makes the object of the system come true. Under the guidance of the simulation results, the real system adopts kinds of weighted GCC methods for time delayestimation and

12、the angle-distance method for acoustic source localization. In conclusion, the system can localize the acoustic source accurately.Keywords :Microphone Array; Time Delay Estimate; Acoustic Source Localization; MUSIC algorithm; LabVIEW独创性声明本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作 及取得的研究成果。 尽我所知, 除文中已经标明引用的内容外, 本

13、论文不 包含任何其他个人或集体已经发表或撰写过的研究成果。 对本文的研究做 出贡献的个人和集体, 均已在文中以明确方式标明。 本人完全意识到本声 明的法律结果由本人承担。学位论文作者签名:日期:年 月 日学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,即:学校有权保留并向国家有关部门或机构送交论文的复印件和电子版, 允许 论文被查阅和借阅。 本人授权华中科技大学可以将本学位论文的全部或部 分内容编入有关数据库进行检索, 可以采用影印、 缩印或扫描等复制手段 保存和汇编本学位论文。保 密,在 _年解密后适用本授权书。 不保密。(请在以上方框内打“” 学位论文作者签名

14、:指导教师签名:日期:年 月 日 日期:年 月 日本论文属于1绪论1.1研究背景和目的对语音信号处理而言,麦克风是最基本的信号接收设备之一。传统的单个麦克风 在无噪声、无混响、距离声源很近的情况下,拾取信号的质量较高 1。然而,随着时 代的发展,单个麦克风存在的许多局限性已无法满足我们对于语音通信的要求 2:(1它要求声源和麦克风之间的位置相对固定,如果声源位置改变,就必须移动麦克风。 (2声源多位于室内等较封闭的环境中, 各种其它声音的多径反射和混响等因素, 也会 导致单个麦克风接收的信号信噪比降低, 拾取信号的质量下降。 (3当麦克风距离声源 很远时,也无法保证良好的语音通信质量。针对单个

15、麦克风的不足,结合实际应用的 需要,如远程视频会议、报警系统、车载电话、助听系统、智能机器人系统等等 3, 4, 人们提出了用麦克风阵列进行语音处理的方法。 麦克风阵列是指多个麦克风按一定的 几何结构进行摆放组成的阵列。它具有很强的空间选择性,无须移动就可对声源信号 自动监测、定位和跟踪,因此在语音增强 5、 声源定位 6、回声消除 7等方面有着极大 的应用空间。其中,利用麦克风阵列采集到的声音信号来估计声源所在位置即声源定 位 8。用麦克风阵列进行信号处理与传统的阵列信号处理有以下不同 9-11:(1传统的阵 列处理信号,如通信信号和雷达信号等,它们属于主动定位方式,即发出电磁波,接 收的是

16、经过高频信号调制后的窄带信号;而麦克风阵列属于被动定位方式,接收的是 目标发出的语音信号,其频率集中在 3003400 Hz,中心频率随声源的变化而变化, 是一个多频宽带信号 12。 (2传统的阵列信号是平稳的电磁波, 其相关函数可以通过时 间相关来准确获得,而麦克风阵列的接收信号为短时平稳的语音信号,用时间平均来 求得准确的相关函数比较困难, 因此要采取其他的方法来获得准确的相关函数 12。 (3传统的阵列信号多采用远场、平面波模型,而麦克风阵列多位于近场 13,需要使用球 面波模型。另外,在需要估计声源与阵列的距离时,还应该考虑信号在传播过程中发 生的幅度衰减。 (4传统的阵列信号处理中,

17、噪声和信源通常是不相干的,而麦克风阵列多位于室内等较封闭的环境中, 除了非高斯噪声和相干噪声的影响 14外, 声源本身 在室内的混响也会对准确定位造成影响。 (5传统的阵列信号处理主要针对一维 DOA 估计,麦克风阵列应用一般需要二维、三维定位 9。这些不同要求我们对传统的阵列 处理算法和模型加以改进。由于麦克风阵列在语音处理方面具有极大的优势, 麦克风阵列在声源定位上的应 用引起了人们越来越多的注意。但是国内在这方面起步较晚,各高校和研究机构更多 的关注算法仿真,而忽视算法与硬件的有效结合,因而在实际的系统构建中存在不少 缺陷,无法保证声源定位的实时性和精确性。因此对麦克风阵列的应用还有极大

18、的发 掘潜力和极大的应用前景,这就促使了我们对这一课题进行进一步的研究。整个系统的目的是在 DSP 平台上利用麦克风阵列实现实际的声源定位。 基于系统 构建的需要,本文着重进行算法部分的研究,在仿真的基础上使之更加适用于实际的 声源定位系统。1.2国内外研究概况1.2.1麦克风阵列的发展历程20世纪 80年代以来,传声器阵列信号处理技术得到了迅猛的发展,并在雷达、 声呐及通信中得到广泛的应用,后来又应用到语音信号处理中。1985年, Flanagan 将传声器阵列引入到大型会议的语音增强中, 并开发出很多实 际产品。 1987年 Silverman 将传声器阵列引入到语音识别系统 15。199

19、2年, Silverman 将阵列信号处理用于移动环境下的语音获取,后来将其应用 于说话人识别。 1995年 Flanagan 在混响环境下用阵列信号处理对声音进行捕获。 1996年 Silverman 和 Brandstein 开始将其应用于声源定位中,用于确实和实时跟踪说话人 的位置。中国在这方面的研究起步较晚,对声源定位的研究 21世纪初期才起步。 21世纪初期:近年来,音 /视频通信 /会议系统发展很快, Polycom 、 Lifesize 等公 司推出了基于麦克风阵列的音 /视频会议产品。 其中 Lifesize 公司的 LifesizePhone 采用 16个麦克风组成均匀圆环麦

20、克风阵列, 16 KHz采样, 集成 voPI 、 PsNT 等通信模块 9。 YAMAHA 的 Projectphone 系列会议产品采用了窄指向性阵列式麦克风技术,实现清晰语音收音,并强化特定方向的收音效果。在过去二十多年中,笔记本电脑的多媒体应用功能不断增强,但是其音频输入端 很大程度上被忽略了, 通常提供给用户最普通的体验。 近年来 Intel 研究所致力于研究 能够提高第三方语音识别系统识别率的麦克风阵列, 新一代笔记本电脑平台被设计以 支持实时通信应用 (如基于 IP 的视频和语音 (WoIP。为了利用噪声抑制和波束形成算 法的优点, Microsoft 公司在 WindowsVi

21、sta 中集成了对麦克风阵列的支持,实现高质 量的语音采集。2001年,波音的研究人员把广泛应用于无线通讯的智能天线的原理推广到音频 16, 用数百个麦克风在机场的跑道上布设了直径达 150英尺的螺旋形的麦克风阵列来 记录飞越上空的波音 777发出的噪声,如图 1-1左图所示。反复试验的结果表明波音 777在起飞和降落期间发出的 2000Hz 的啸叫来自两翼的前沿。麦克风阵列的这一次 完美展示使其得到进一步推广。如今,麦克风阵列不仅被用来研究飞机、汽车上的噪 声源,而且被用于潜水艇、建筑和家电行业的噪声研究中。在这类应用中,麦克风阵 列被视作“声学照相机” 。2005年,日本的 BMC (Bi

22、o-Mimetic Control研究中心的 Hiromichi Nakashima和 Toshiharu Mukai研制了仿生的麦克风阵列的声源定位机器人系统 17,如 图 1-2右图 所示。此系统设计定位功能由两套定位子系统完成。首先,利用双耳时延模型,通过 设计仿生人耳耳廓功能的反射器及两个模仿人耳的麦克风接受声音信号, 完成水平方 向的声源定位。其次,利用反射器引导的音频信号谱来确定垂直方向的声源定位,最 后通过 PC 机进行数据处理并控制电机完成定位。 该系统中的反射器的频率特性成为作 者的重要讨论内容,基于该反射器,系统可以识别在正前方水平范围-30到 +30之间的声源,而超过-4

23、0到 +40时,该系统则完全失效。 图 1-2 “声音照相机”与声源定位机器人在国内对于麦克风阵列的实际应用研究较晚,应用范围也有一定的限制:2005年, 上海交通大学振动、 冲击、 噪声国家重点实验室研制成功了基于虚拟仪 器技术的声场可视化系统。该系统基于虚拟仪器技术构建了声信号采集及处理系统。 文中提到该系统可以对噪声源进行定位、量化及传播路径的确定,但并未给出具体的 声源定位性能分析等参数 18。2006年, 哈尔滨工业大学的机器人研究所的研究人员讨论了移动机器人中利用模 糊推理结合声源定位技术来实现机器人的协同定位功能 19。2007年,泛华测控推出国内首款“声音照相机” ,即噪声源定

24、位分析系统 20,由 麦克风阵列、传输线缆和主机组成,综合了声源定位、声源识别、声源信号分离、频 谱分析和联合时频分析等功能, 在机器故障定位、 降噪设计 (如汽车、 飞机等降噪设计 以及噪声泄漏测试等领域有着广泛的应用。一方面,实际的应用需求促进了对麦克风阵列的研究;另一方面,麦克风阵列的 发展拓宽了语音处理的领域。如果能保证声音定位精确性和实时性,麦克风阵列在不 同的场合有着愈加广泛的应用。 而声音定位的精确性和实时行需要我们对传统的声源 定位算法作一定的改进,使这些改进切实可行,可进一步推广麦克风阵列的使用。 1.2.2麦克风阵列实现声源定位的算法研究概况1973年, William R

25、.hahn和 Steven A.thetter最早提出基于最大输出功率的可控波束的声源定位算法 21。 1977年, William R.hahn进一步得出可控定位的理论和实际上 的方差 22。 1983年, Mati Wax和 Thomas Kailath将该方法应用于多声源的定位 23。 2007年, 电子科技大学电子工程学院的张扬等在基于移位平滑的相干波束形成方法和 阵列内插方法的基础上提出了相干波束形成法 24, 解决了五阵元均与圆阵下二维相干 信号的波束形成问题。 北京航空航天大学汽车工程系的雷凌等研究了改进的波束形成 方法在运动声源定位中的应用,从而大幅降低了所需的传声器数目,而对

26、定位精度影 响不大 25。 波束形成的基本思想是采用波束形成技术实现阵列信号的输出同步及加权 求和来得到波束,然后通过修改权值或麦克风指向来对阵列输出信号功率进行搜索, 所得到的波束最大输出功率点即为声源的位置。基于可控波束形成的定位算法,主要 分为延迟累加波束算法和自适应波束算法。 该技术己经广泛应用于基于麦克风阵列的 语音拾取领域,但要达到稳健有效的声源定位还十分困难。这主要是由于该方法需要 进行全局搜索, 运算量极大, 很难实时实现。 虽可以采用一些迭代方法来减少运算量, 但常常没有有效的全局峰值,收敛于几个局部最大值,且对初始搜索值极度敏感。并 且,可控波束定位技术依赖于声源信号的频谱

27、特性,其最优化准则绝大多数都基于背 景噪声和声源信号的频谱特性的先验知识。因此,该类方法在实际系统中性能差异很 大,再加之计算复杂度高,限制了该类算法的应用范围。1976年, C.H.Knapp 和 G .C.Carter 发表的论文中提出应用于时延估计的广义相关 函数 (GCC法 26。 虽然它计算非常有效, 但是在实际环境中, 由于噪声和混响的影响, TDOA 估计的可靠性大大降低。 1981年, Reed F A和 Feintuch P L提出最小均方 (LMS自适应滤波法 27。针对 GCC 受混响影响较严重的情况, 1987年, Champagne B和 Stephene A提出倒谱

28、预滤波 (CEP技术 28,通过对通道特性的分析,有目的地去除信 号中受反射影响严重的部分, 再将预滤波后的信号通过 GCC 进行时延估计。 1997年, Brandstein M S提出基音加权的 GCC 方法 29,充分考虑了信号本身的特征,比 CEP 方法更适用于语音信号的处理。 2002年, DiBiase 提出了联合可控响应功率和相位变 换 (SRP-PHAT的声源定位方法。 国内大连理工大学致力于各种时延估计及定位估计方 法的改进, 2004年,马晓红等提出了改进的互功率谱相位时延估计法 30,将固定的 互功率谱加权函数改进为随信噪比而变的, 将原来由一帧互功率谱相位的峰值决定时延

29、估计值改为由多帧互功率谱相位。 2005年, Doh-Hyoumg Kim等利用小波变换改进 了直接适应性时延估计法 (EATDE,针对移动声源进行有效定位 31。 2006年,谭颖等 提出了改进的 SRP-PHAT 声源定位方法 32, 去掉了对相位累加和没有贡献的互功率谱 成分,并将原方法中所有频段的全搜索改为分频段由粗到精的搜索,从而降低了运算 量,在低信噪比和强混响的环境下定位精度较高。清华大学在与松下电器北京研究所 “车载导航”研究项目开展过程中研究了各种时延估计法的优缺点 33。此外, 2000年 Guner Arslan和 F.Ayhan Sakarya提出基于 BP 神经网络的

30、声源定位法实质上是声源 定位的一种 34, 35。 2006年中国计量学院光电子技术研究所的沈常宇提出的基于蒙特 卡罗的实时空间三维声源定位方法实质上是时延估计的一种 36。基于子空间技术的声源定位算法主要有 MUSIC 算法、 ESPRIT(旋转不变子空间 算法、 极大似然估计算法等。 1979年 Schimidt 提出多信号分类方法 37, 简称 MUSIC , 这是 DOA 估计理论发展上一次质的飞跃,其核心原理是以信号子空间与噪声子空间 的正交性为基础, 划分空间来进行参数估计。 其后 Balabell 又提出了一维 Root-MUSIC 算法,减小了 MUSIC 算法的计算量。针对

31、MUSIC 算法的不足,后来出现了改进的 MMUSIC 算法子空间迭代的快速算法及一些去相关的空间平滑技术等。 但由于麦克风 阵列的 DOA 估计与普通的 DOA 估计有很大的区别, 传统的算法并不适用于基于麦克 风阵列的声源定位。 2000年,日本的 Futoshi ASANO 和 Hideki ASOH 等人把传统 的 MUSIC 算法用到了声源定位系统中,提出了基于麦克风阵列的近场二维 MUSIC 算法 38, 该算法用于办公室智能机器人系统中, 基本实现了声源的水平角和声源与麦 克风阵列之间的距离的估计,但是距离分辨率和准确性均较低。 2002年,美国的 Joe C.Chen 等人提出

32、了用极大似然估计算法来实现声源定位 12,该算法可以对近场和远 场的声源进行定位, 在单声源系统中定位性能较好, 但是对于多声源系统运算量较大, 性能较低。电子科技大学彭启琮教授带领的团队对 MUSIC 算法进行了各种改进,对 均匀线阵、均匀圆阵近场模型进行 2D 仿真 4,进而对均匀圆阵及均匀球面阵进行 3D 仿真。 2008年, 四川大学电子信息学院的李文等改进了基于麦克风阵列的近场声源定 位, 提出了一种快速谱峰搜索算法, 从而降低了运算量 10。 1986年, Roy 等提出 ESPRIT 方法 37, 它是 “借助旋转不变性估计信号参数” 的简称, 由于不需要进行全空间搜索,它的运算量较适中, 但是常规的 ESPRIT 算法不能处理相干信号。 1994年, Mathews C P 等在原算法进行改进的基础上提出了二维 ESPRIT 方法,从而实现了对二维方向的 估计。除了上述三种常用的声源定位方法外,近年来有不少学者提出一些新的方法,如 基于匹配域处理的方法、基于空间时域分布分析的方法等等。1.2.3LabVIEW 的信号处理应用为了将

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2