语音信号处理作业16.docx

上传人:b****5 文档编号:8713438 上传时间:2023-05-14 格式:DOCX 页数:12 大小:29.83KB
下载 相关 举报
语音信号处理作业16.docx_第1页
第1页 / 共12页
语音信号处理作业16.docx_第2页
第2页 / 共12页
语音信号处理作业16.docx_第3页
第3页 / 共12页
语音信号处理作业16.docx_第4页
第4页 / 共12页
语音信号处理作业16.docx_第5页
第5页 / 共12页
语音信号处理作业16.docx_第6页
第6页 / 共12页
语音信号处理作业16.docx_第7页
第7页 / 共12页
语音信号处理作业16.docx_第8页
第8页 / 共12页
语音信号处理作业16.docx_第9页
第9页 / 共12页
语音信号处理作业16.docx_第10页
第10页 / 共12页
语音信号处理作业16.docx_第11页
第11页 / 共12页
语音信号处理作业16.docx_第12页
第12页 / 共12页
亲,该文档总共12页,全部预览完了,如果喜欢就下载吧!
下载资源
资源描述

语音信号处理作业16.docx

《语音信号处理作业16.docx》由会员分享,可在线阅读,更多相关《语音信号处理作业16.docx(12页珍藏版)》请在冰点文库上搜索。

语音信号处理作业16.docx

语音信号处理作业16

语音信号处理技术发展历程与发展趋势

201105023

1发展历程

声学是物理学的一个分支学科。

而语言声学又是声学的一个分支学科,它主要的研究方向是人的发声器官机理,发声器官的类比线路和数学模型,,听觉器官的特性(如听阈、掩蔽、临界带宽、听力损失等)听觉器官的数学模型,,语音信号的物理特性(如频谱特性、声调特性、相关特性、概率分布等),语音的清晰度和可懂度等。

当今通信和广播的发展非常迅速,,而语言通信和语言广播仍然是最重要的部分,语言声学则是这些技术科学的基础。

语言声学的发展和电子学、计算机科学有着非常密切的关系。

在它发展的过程中,有过几次飞跃。

第一次飞跃是1907年电子管的发明和1920年无线电广播的出现,因为有了电子管放大器,很微弱的声音也可以放大,而且可以定量测量。

从而使电声学和语言声学的一些研究成果,扩展到通信和广播部门。

第二次飞跃应该是在20世纪70年代初,由于电子计算机和数字信号处理的发展,人们发现:

声音信号特别是语音信号,可以通过模数转换器(A/D)采样和量化,它们转换为数字信号后,能够送进计算机。

这样就可以用数字计算方法,对语音信号进行处理和加工。

例如频谱分析可以用傅里叶变换或快速傅里叶变换(FFT)实现,数字滤波器可以用差分方程实现。

在这个基础上,逐渐形成了一门新学科——语音信号处理。

它的发展很快,在通信、自动控制等领域,解决了很多用传统方法难以解决的问题。

在信息科学中占有很重要的地位。

2语音信号的情感处理及其未来发展

2.1语音信号的情感处理

目前情感类型的划分主要有离散的表示和连续的维度表示两种类型。

离散的情感表示是将情感划分为基本类和扩展类,也有学者称之为主要情感(原始情感)和次要情感(派生情感)。

扩展情感是由基本情感变化混合而成的,好像三元色可以混合生成多种色彩一样,所以也有学者称该情感生成理论为情感的调色板理论。

至于基本情感的数量从两种至8种不等,学术界尚未达成共识,不过比较常见的公认的基本情感是恐惧、生气、高兴、悲伤、吃惊、厌恶等6种。

扩展情感则覆盖了很大的情感空间,尽管有些研究者认为,因为情感产生于语言符号之前,用情感词语对情感分类不一定是很好的方法,然而语言毕竟是思维的外壳,情感词能在很大程度上反映出不同类型的情感。

情感还可以用连续变化的维度表示。

维度是指情感在所固有的某种性质上,存在一个可变化的度量,维度理论通常将情感定义为一个维度空间上的点。

不同研究者所定义的维度数目也有所不同,有二维的,三维的甚至四维的,其中受到广泛认可的有H.Schloberg的“快乐维-注意维-强度维”的三维表示,和R.Plutchik的“激发维-评价维-强度维”的三维表示。

离散表示和维度表示在某种程度上是可以相互转化的。

2.2情感语音的应用领域

2.2.1交互电影中自发(spontaneous)交互的判定

电影艺术从19世纪开始就已经逐步完善,它为人们提供了一种娱乐方式,但目前电影还只是提供给人们不同种类的情节,对观众来说并没有直接参与进去。

观众所能亲身经历、感受和学习到的东西是非常有限的。

交互式电影将为人们提供一种全新的感受。

观众不仅能看到故事情节,也能与故事进行交互,提供给人们一种全新的经历。

在这种电影中,人们不再只是预测其中人物的命运,而是能亲身经历日常生活中从未有过的剧情和故事。

通过这种方式将为大家提供学习不同本领和课程的大好机会。

交互电影的关键因素之一,就是与作为主要角色的参加者进行交互的计算机角色。

日本ATR媒体集成和通信研究实验室,通过用情感识别将自发交互能力引入到了交互电影中,在研究过程中,他们考虑到只有语音识别时,系统很难判定参加者的语音是事先设计好的台词,还是自发输入的台词。

为此,同时使用语音识别和情感识别来决定是进行预先设计好的演出方式,还是进入自发交互方式。

当语音识别结果比较理想时,可确定为是一个设计好的交互,并由此让演员进行事先定义好情节的表演;而当语音识别结果不理想时,可确定为是一个自发方式,利用情感识别结果产生演员自发的反应和动作。

2.2.2辅助残疾人讲话

失语症是很多脑部疾病带来的直接后遗症,这些患者有着与健康人同样的情感却苦于无法表达。

为此VAESS(VoicesAttitudesandEmotionsinSynthesisSpeech)工程开发研制了一种不仅能够辅助残疾人说话,而且还能帮助他们表达情感的一种便携式情感语音合成器。

文献[1]中给出了一个辅助残疾人进行情感语音输出的系统CHATAKO,用户使用该系统输入文本信息后,可以选择某种情感选项,输出有情感的合成语音。

该系统使用的是日本ATR实验室开发的语音合成器,采用波形拼接的方法进行合成,拼接单元来源于6个情感语音语料库,语料库包括男声和女声的生气、高兴、悲伤等各3种情感。

该系统选择了基频平均值、基频标准差、基频动态范围、停顿时长均值、能量均值等作为情感特征。

对合成语音进行的不依赖于上下文的感知测试表明,这种利用情感语音语料库进行波形拼接合成情感语音,能够取得非常高的可懂度与较高的自然度。

2.2.3情感语音将使人机界面更具人性化

随着计算机技术的发展,利用选单命令和目录方式进行信息的管理已不能完全满足人们的需求,人们需要更自然、更智能、更人性化的人机界面,如语音方式,新一代的用户界面离不开语音技术的发展。

现在,人们可以通过互联网获取大量的信息,在电子购物、网上医疗、网上聊天、电子会议以及有声电子邮件等应用上,人们所希望听到的已不再是有很高可懂度的枯燥的机器音,而是更具“人情味”的语音。

人机之间的交互不仅仅是依靠键盘和鼠标,简单、易学、更具“人性化”的语音操作界应当更符合人们的实际需求。

这种人机之间的交互既需要情感语音识别技术,又需要情感语音合成技术。

2.2.4情感语音与其它多媒体技术相结合

前文提及的“谈话头”即是将情感语音配之以相应的面部特征的视频来传达情感,通过将一些视觉效果,包括人的头部建模、唇形同步技术和表情因素等视频信息加入,使声音、表情同步,这就是当前比较热门的“视觉语音(visualspeech)”技术。

视觉语音可以使输出效果更具表现力和感染力,虚拟主持人的实现就是利用了这一技术,英国报业联合通讯社推出的第一个虚拟新闻播报员“阿娜诺娃(Ananova)”就是一个很好的应用实例。

2.3情感语音未来研究的重点

从总体上看,情感语音处理这一研究领域还处于探索阶段,有很多问题尚待解决。

笔者认为如下几方面的工作将是未来本领域的研究重点。

2.3.1情感分类与建模

目前的研究大多将情感划分为3~9类不同的基本情感,同时假定其它情感可以由这几种基本情感派生。

到底有多少种基本情感?

其它情感是否可以由基本情感组合派生出来?

情感是如何通过语音表达出来的?

如何描述每种情感的属性?

这些属性对应于哪些声学特征?

如何准确地抽取情感特征?

不同的情感状态之间有什么联系?

如何从一种情感状态过渡到另一种情感状态?

这些问题将涉及到语音学、心理学、生理学、语言学、音韵学、声学、实验语音学、数字信号处理技术等多门学科,这些问题解决的好坏与否将直接影响着情感语音的识别与合成,应该下大力气加以研究。

2.3.2情感语音语料的获取

无论是情感分析、情感识别,还是情感合成都将需要在数量和质量上有保证的情感语音语料库,而目前的情感语音语料的来源问题却一直没有得到很好的解决。

目前用的比较多的情感语音采集方法,大多是让演员模拟不同的情感来朗读一些句子。

但演员的表达方式与人们在日常生活中表达情感的方式存在很大的不同,所以还是应当尽量获取真实情感语料,如可以录制医院里一些患者的害怕、恐惧、绝望、伤心的语音;游乐场中激动、高兴的语音,以及一些电视或电台中的访谈节目里的真实情感语音;甚至是吵架时生气、暴怒的语音等,但这样采集来的数据往往存在很多噪声。

除了直接录制情感语音外,Hansen等人也尝试了利用正常语音来合成情感语音的方法[2],利用这种方法合成语音后,再通过主观听觉测试去除那些合成效果较差的语音,这种方法可以弥补情感语音语料匮乏的不足,利用情感语音合成来丰富情感语音库,并支持情感语音的分析与识别,这是一项非常有意义的工作。

2.3.3评价方法

对情感语音合成来说,除了要评价其自然度和可懂度,还需进一步评价合成语音对情感的表达是否恰当、合理。

目前人们所采用的较典型的方法是组织一批测试者进行主观感知评价,参加听评的人事先被告知几种基本情感,然后对所合成出的情感语音进行类别划分,目的是判断所合成出的情感语音能否被听者正确感知,但这种评价方法更倾向于分类而不是真正辨识。

另外,这种主观评价除了耗费时间、人力和费用外,还常受到人的反应等内在不可重复的影响,尤其是对语音识别来说,测试结果与测试人当时的状态、环境等存在很大关系,而采用一些基于客观测度的语音评价方法可克服这些不足。

目前所用的客观测度可分为时域测度、频域测度和在此基础上发展起来的其它测度,研究新的合理的评价方法是人们今后仍需探索的工作。

2.3.4开发语音分析工具和语料标注工具

情感语音的建模、预测、实现、评价等都将以原始语料的采集、整理和标注为基础,语音的识别与合成必须以对语料的准确分析为前提。

高效、准确的语音分析工具和语料标注工具是实现情感语音分析的重要手段。

目前还没有一个标准的情感语音数据库,语音分析工具的功能也不是很完善,对情感语料进行标注的标注工具更是缺乏,开展对语音分析工具和语料标注工具的研制将具有非常重要的意义。

2.3.5语音识别与语音合成方法的研究

连续语音识别率的提高与语音合成自然度的改进将直接影响情感语音识别的性能与情感语音合成的质量。

情感语音识别研究的重点仍然是特征提取和识别方法的研究。

如何提取更能代表情感语音的特征?

这种特征是长时特征还是短时特征?

应选择多少维特征参数?

如何使情感语音识别更具顽健性(robustness)?

采用何种更有效的识别方法等都是目前研究的重点。

就情感语音合成而言,如何提高用参数合成的情感语音的自然度?

如何使基于波形拼接的合成方法有更大的情感韵律调节能力?

在基于大规模语料库的合成中采用何种更优的情感基元选择算法,并处理好拼接单元之间的过渡平滑?

这些仍是人们长期研究的目标。

3语音信号数字处理技术在军事方面的应用

语言与军事历来就有着天然的亲缘关系,大凡军事活动,如组织指挥、宣传鼓动、敌我交际、信码解读等都离不开人类语言,特别是人类的自然语音。

正是由于语音信号数字处理技术在军事领域有着极为重要的应用价值和极其广阔的应用空间,各军事强国的高科技发展战略,如美国国防部的AVLEY计划、欧盟的ESPRIT计划、日本的第5代计算机发展计划等,都将其列入立项研究计划,并投入大量的人力、物力、财力加大对语音识别与语音理解的研究,以期攻克人机交互式自然语音通讯这一高技术难关。

美国国防部下属的先进研究计划署(DefenseAdvancedResearchProjectsAgency,DARPA)信息技术办公室资助的20个主题中就有2个是围绕语音识别的研究;我国的863计划《智能计算机主题》专家组就专门为汉语语音识别与理解的相关研究立项,每两年滚动一次。

语音信号数字处理技术在军事领域中主要有以下四类应用方式:

1、军事指控

通过识别军事指挥员语音中的要求、请求、命令或询问并作出正确的响应,这在用语比较规范的军事指控系统中有着很高的应用价值。

由于技术的局限性,传统的军事指挥控制系统在完成威胁判断、态势评估、辅助指挥决策等任务时,常常需要采用键盘方式进行信息的输入。

而人工键盘输入速度慢、还容易出现差错,并且会分散指挥员的注意力,已成为缩短军事指控系统反应时间的制约因素。

语音是人类交流信息最便捷的手段。

随着随着当代计算机技术和人工智能技术的发展,语音数字处理技术日渐成熟,语音输入已成为一种理想的信息输入手段,人机交流变得简便易行,口呼电话拨号、口授打字技术早已成功进入市场。

因此,改善信息输入手段,在军队管理、指挥、控制和通信中充分应用语音信号数字处理技术,变信息的键盘输入为语音输入,尽量减少人工操作所浪费的时间,这对进一步提高军事指控系统的自动化水平,对提高军事指控的快速反应能力有非常重要的意义。

完全可以这样说,在军事指控系统中充分应用语音信号数字处理技术,是建设信息化军队、打赢信息化战争一个至关重要的发展方向。

需要注意的是,要想在军事指控中随心所欲地进行人机语音信息交流,还需要重点解决背景噪声干扰、鲁棒(Lombard)效应、指控人员口音自适应等技术难题。

此外,为了反制敌军利用我方信道伪装我指挥员发假命令,干扰我方军事行动的情况,还需要应用声纹识别技术对我方信息发布者进行身份确认,对系统进行生物技术加密,以实现指挥口令的实时识别,增加系统的安全性。

2、政治作战

当前,信息化战争形态初露端倪,政治作战的地位作用已从传统的战役战术行动中的辅助手段,一跃而升为国家和军队战略行动的重要组成部分。

政治作战是一种攻防兼备的精神信息战,可以激发我方斗志,主领国际舆论,瓦解敌方士气,最终实现不战而屈人之兵的战略目标。

在政治作战中,语音信号数字处理技术具有广阔的应用前景。

特别是某些国家利用语音合成技术生成所谓的“谣声”———即首先提取敌方国家和军队领导人、大众名人或者当事人的语音特征,经过一番剪辑与组合,最后再生成这些人员从未说出的话语———通过公开发布这些“真实的谎言”,给予敌国民众和国际社会以视觉和听觉的强烈刺激,借此达到颠倒黑白,混淆视听,诱导舆论的政治作战目的。

此外,还可利用“谣声”技术生成假命令、假指示,给敌方军队制造混乱或使其服从自己的调动,也会收到一般军事打击所达不到的效果。

譬如美军就特别注重“谣声”在战时的重要作用。

美军心理战大队不但大量制造“谣声”,还将“谣声”与以多媒体、虚拟仿真、虚拟现实等为主要内容的高技术信息生成手段相结合,制造大量并不存在的“战场实况”,散布许多场景逼真的假新闻、假消息,实施舆论造势、心理攻击和法理争夺。

由于“谣声”散布的欺骗性信息是依附于具体人物的真实声音表达出来的,其效果足以假乱真,不仅扰乱国内视听,还使国际舆论为之大哗。

对此,美国学者直言不讳地声称:

“我们的社会宣传,就是借助说谎,有倾向性地陈述事实,玩弄手腕,以达到使人丧失独立思考能力的目的。

”有报道称,海湾战争中,“沙漠盾牌电台”曾多次模拟萨达姆的讲话,对其进行丑化宣传,以降低萨达姆在其国民及其盟国中的威信。

而在伊拉克战争中,语音合成技术更是美军心理战部队屡试不爽的秘密武器。

美特种作战部队提前秘密潜入伊拉克重要地区,在伊军部分电话中安装了自动应答器,伊军人员拿起电话,立即传出“不要使用生化武器、不要反抗、不要服从上级命令”等阿拉伯语劝降话声。

美军还模拟生成萨达姆和伊方其他军政领导人的声音,向伊军下达假命令和假指示,还在战前建起了一个“提克里特电台”,冒充是伊拉克本土电台实施广播,进行语音攻心,几乎达到了真假难辨的程度,具有很强的欺骗性。

为了进一步攻心夺志,瓦解伊军士气,美军还尝试散发了一种集视听说为一体的智能化传单,这些都是伊拉克战争中特别值得关注的焦点。

3、军事监听

军事监听又称军事侦听,是一种利用声纹识别技术对说话人身份进行确认的军事情报侦察手段。

监听设备中的语音识别系统首先提取敌军重要人员的语音特征,并创建相应的双语语料库,一旦截获敌军话务信号,语音识别系统就会自动对其进行降噪处理,删除静电等背景杂讯,通过频谱分析,将截获的声音与声音数据库相对照,就能立即准确识别出通话者的身份,最后将敌军语音信号翻译成本国语的文本或声音信号。

军事监听有利于快速判断其所掌握情报的真实价值,在战时还有利于指挥员及时掌握战场信息,以便作出正确的决策判断。

美国国防部国家安全局负责管辖包括军事监听在内的情报侦察事务。

为了尽可能多地掌握其他国家的绝密情报,上个世纪70年代,美国国防部就专门邀请军职和文职语言学家,对被监听国家的语言进行了全面深入的研究,开发出了一套独特的电子监听系统。

最近几年,这套系统的功能不断完善,只要截获被侦察者的通话,系统便能准确地识别出具体的声音,查明通话者的身份,尤其是高层领导者的身份。

据2000年欧盟的一份报告,美国国家安全局建立了一个代号为“梯队”的全球电子监听侦测网络系统,在加拿大、新西兰和澳大利亚设置了数十个大型地面接收站,动用了120颗卫星,形成了一个庞大而高效的军事侦听体系,通过截获各国电话、手机、传真机和计算机等通信工具所传输的信息,大量窃取世界各国的政治、军事、经济等重要情报。

一旦被监视区域出现某些敏感字眼,这些电子“大耳朵”就会自动把通话记录在案,然后将其重要部分交给情报人员深入分析。

除了“梯队”之外,美军还拥有很多功能强大的、专门监听手机通信的间谍卫星和电子侦察飞机。

譬如美EP-3侦察机上就装有美国最为先进的声音识别系统。

而最新一代电子侦察卫星更是集电子情报和语音通信情报侦察于一身,能截获无线电和移动电话通信,把电磁信号传送到美国的巨型计算机上,以供分析。

美国最新利用“猎户座”(Orion)系列间谍卫星跟踪微波传输,可以窃听到许多国家的重要电话。

而美国安全局后来还发现,只要利用北极上空的卫星,在美国便可以窃听到大部分国家的手机信号。

众所周知,手机通信是一个开放的电子通信系统,手机使用者的语言信号被手机传输到移动通信网络中,再由移动通信网络将语言信号变成电磁频谱,通过通信卫星辐射漫游传送到受话人的电信网络中,受话人的通信设备接收到无线电磁波,再转换成语言信号接通通信网络。

只要有相应的语音接收、解码设备,监听者就能够截获任何时间、任何地点、任何人的语音通话信息。

即使在待机或关闭状态下,手机也很容易被识别、监视和跟踪。

据美国前情报官詹姆士·巴姆福德2001年出版的、揭示冷战秘闻的《秘密》一书中透露,早在冷战时期,美国国家安全局就已经掌握了无线电话语音识别技术,并对前苏联领导人勃列日涅夫进行全程监听,只要他用无线电话通话,国家安全局的声音识别系统就会立即确认出勃列日涅夫的身份,并立即将他的谈话内容记录下来。

五角大楼一位情报官曾经夸口说:

“这套系统甚至能够分辨出是车内的勃列日涅夫还是其他人打的嗝儿。

”据巴姆福德称:

“监听员甚至可以说出被监听者是否感冒了。

”书中还透露,国家安全局拥有大量被监听者的资料,有时候,监听员在监听时,旁边就放着这些被监听者的照片。

在阿富汗战争中,美国就运用了电子侦察卫星来搜集塔利班和“基地”组织的信息。

本·拉登的得力助手阿布·祖巴耶达赫就是因为使用手机暴露了藏身之地而落网。

2006年6月7日晚,“基地”组织在伊拉克的头目、恐怖分子阿布·穆萨卜·扎卡维在伊拉克东北约50公里处(迪亚拉省首府巴古拜附近)被美军F-16战机投下的两枚炸弹炸死,同在的7名基地重要成员也一并丧命。

伊拉克军队一名军官迪亚·塔米米上校在接受CNN独家专访时透露,他与美军一起对扎卡维及其同僚的手机信号进行了长期的跟踪监视,正是扎卡维使用的手机所发出的信号帮助美军找到他所处的准确位置并对他实施了空中精确打击。

而在俄罗斯的车臣战争期间,俄空军预警机截获了当时车臣分裂主义头子杜达耶夫与居住在莫斯科的战争调节人—————俄罗斯国家杜马前议长哈兹布拉托夫之间的手机通信,并在GPS全球定位系统的帮助下迅速测出杜达耶夫所在位置的精确坐标。

1996年4月22日凌晨4时,俄罗斯空军飞机在距目标40公里的地方发射了两枚反辐射导弹,导弹循着电磁波方向击中了杜达耶夫正在通话的小楼,轻而易举地将其消灭。

4、战地交际

语言是人们交流的工具,不同民族有自己不同的语言。

即使是信息化条件下的对外战争,语言问题也将是一个十分突出的问题。

能否逾越这道跨文化的巨大障碍,实现不同语言族群之间的精确语音交流,将成为信息战争最终致胜的关键因素。

美军的对外作战面临的一个突出问题就是跨文化交际中的语言问题。

在海湾战争、阿富汗战争和伊拉克战争中,由于参战美军绝大多数都对阿拉伯语和阿富汗的达里语、普什图语等一窍不通,加之缺乏足够的翻译人员,致使执行任务的美军无法进行有效的战地交际,甚至还有不少士兵在落单的情况下因言语不通而遇难。

针对美军因缺少阿拉伯语翻译而不能及时与伊拉克军民相互沟通这种情况,美国国防部高级研究计划管理局在海湾战争以后就斥资2080万美元,加紧研发军队必需的阿拉伯语自动翻译机。

该局最初委托安纳波利斯州的一家语音技术公司研制开发了第一代手持式阿拉伯语单向自动翻译机。

这种机器存储约700句阿拉伯语,在“听到”对应的英语或使用者通过菜单选择了某一句话时,机器便会找到对应的阿语并发音。

“9·11”事件发生的几个月后,美军联合作战部队司令部(theU.S.JointForcesCommand)就为部队装备了20台这种翻译机。

目前,美军已在伊拉克已经投放了3000台类似的翻译设备。

但在实际应用中,美军官兵发现,这类机器在设计上多有缺陷,特别是词汇量十分有限,使用起来很不方便,很多伊拉克人根本无法听懂机器录制的阿拉伯词句。

2001年,高级研究计划管理局同时选中在语音识别与理解技术上独领风骚的美国国际商用机器公司(IBM)、卡耐基·梅隆大学(CMU)和SRI国际研究所(斯坦福研究院)共同参与阿拉伯语自动翻译机的研发。

2006年10月,美军联合作战部队司令部将35套原本还在IBM公司研发阶段的“多语言自动讲话翻译机”(MultilingualAutomaticSpeech-to-Speechtranslator,Mastor)配发给驻伊美军医务人员、特种部队和海军陆战队使用,以便他们在必要时能及时与伊拉克安全部队和伊平民沟通。

这种可由单兵携带的新型翻译机拥有超过5万多英语单词和10万阿拉伯语单词的海量词库,只要对着麦克风说话,翻译机就能迅速将英语翻译成带有伊拉克方言的阿拉伯语音,其识别响应时间只需1至2秒,转译速度媲美真人。

据悉,军方同时开发的还有英语和中文的适时口译机。

IBM研究翻译技术的首席技术官大卫·纳哈默(DavidNahamoo)说,这种翻译机与现有翻译软件最大不同在于,它并不局限于程序事先存入的语句,还可以识别人们不同的文法、词序和句子结构。

IBM技术合作服务部门的首席研究员曼尼·阿萨瓦(MannyAthavale)乐观地说,“我们相信它在军事实地应用上可充分发挥效用”。

不过,Mastor现阶段还无法实现同声传译。

为了防止翻错出现误会,Mastor先在屏幕上显示三种翻译方式,由使用者进行选择。

在现有条件下,任何翻译机都不可能达到准确无误。

据报道,翻译机暂时还不会应用于冲突或作战环境中,因为这些紧急状况需要瞬间沟通和决策。

而IBM宣称,他们的目标是让军队在翻译缺乏的真实战场环境下实现讲不同语言者之间的有效交流。

为了实现“在与作战有关的环境中实现自由自在的双向对话”的终极目标,高级研究计划管理局又与美国著名的BBN公司合作研发了以HWIM系统为核心的“外语对话翻译设备”,这显然代表着美军自动翻译机发展的潮流。

目前,BBN公司已成功研制了5套这种翻译设备,美国国家标准与技术研究院(TheNationalInstituteofStandardsandTechnology,NIST)正在对其进行测试和评估。

与IBM的Mastor相比,BBN公司的5套设备显然棋高一着,要先进得多。

例如,“卡西姆”在阿拉伯语中也有“分开”的意思。

但BBN的翻译设备懂得这个词使用的上下文,并判断出这是一个名字。

它还将“你结婚了吗

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > PPT模板 > 其它模板

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2