中文语音识别技术在net中的应用.docx

资源描述

中文语音识别技术在net中的应用.docx

《中文语音识别技术在net中的应用.docx》由会员分享，可在线阅读，更多相关《中文语音识别技术在net中的应用.docx（9页珍藏版）》请在冰点文库上搜索。

中文语音识别技术在net中的应用.docx

中文语音识别技术在net中的应用

.Net平台下开发中文语音应用程序

摘要：

语音是人类最自然的交互方式，也是现阶段软件用户界面发展的最高目标。

微软公司一直积极推动语音技术的发展，并且公布了语音开发平台SpeechSDK帮助开发人员实现语音应用。

随着.net技术深入人心，越来越多的程序员开始转到.net平台上进行开发。

然而，在新发布的.netspeechSDK里面并没有对中文语音进行支持，目前支持中文的SpeechSDK最高版本为Windows平台下的SAPI5.1（），本文介绍如何在.net平台下利用SAPI5.1开发中文语音应用程序。

1.SAPI.51SDK浅析以及安装

2.导入COM对象到.Net

3.用C#开发中文TTS应用程序示例

4.结论

5.参考文献

1．SAPI.51SDK浅析以及安装

SAPISDK是微软公司免费提供的语音应用开发工具包，这个SDK中包含了语音应用设计接口（SAPI）、微软的连续语音识别引擎（MCSR）以及微软的语音合成（TTS）引擎等等。

目前的5.1版本一共可以支持3种语言的识别（英语，汉语和日语）以及2种语言的合成（英语和汉语）。

SAPI中还包括对于低层控制和高度适应性的直接语音管理、训练向导、事件、语法编译、资源、语音识别（SR）管理以及TTS管理等强大的设计接口。

其结构如图

（1）：

图

（1）

语音引擎则通过DDI层（设备驱动接口）和SAPI（SpeechAPI）进行交互，应用程序通过API层和SAPI通信。

通过使用这些API，用户可以快速开发在语音识别或语音合成方面应用程序。

SAPI5.1SDK可以从微软网站下载：

需要安装程序的有SpeechSDK5.1（68M）和5.1LanguagePack（81.5M）。

2．导入COM对象到.Net

SAPI5.1的基于Windows平台的，通过COM接口进行调用。

在.Net平台下要应用SAPI5.1，我们可以利用.NetFramework自带的强大工具TlbImp.exe来把SAPISDK的COM对象导入到.Net中。

TlbImp.exe产生一个管制的包装类，管理客户端可以使用它。

包装类管理实际的COM对象的参考数。

当包装类当作收集的垃圾时，包装类释放掉它包装的COM对象。

当然，你也可以在VS.NET环境中通过从项目参考对话框选择COM对象，实现COM对象的导入，这个过程也是通过TlbImp.exe来完成的。

下面演示如何导入SAPI的COM对象：

\ProgramFiles\CommonFiles\MicrosoftShared\Speech>Tlbimpsapi.dll/out:

DotNetSpeech.dll

在安转SDK以后，可以在D:

\ProgramFiles\CommonFiles\MicrosoftShared\Speech\目录下面找到SAPI.dll，这里面定义了SAPI的COM对象，用Tlbimp.exe工具将该dll转换成.net平台下的Assembly---DotNetSpeech.dll，转换的过程会提示不少的警告（warning），但这部影响我们的开发，可以忽略。

最后，我们可以用ildasm查看DotnetSpeech.dll里面的对象。

3．用C#开发中文TTS应用程序示例

下面通过一个实例来介绍如何利用C#进行开发语音应用程序，开发环境为：

操作系统：

Windows2000中文版+SP3

.NetFramework:

1.0.3705（英文版）

VisualStudio.Net7.0.9466（英文版）

首先，新建一个C#的WindowsApplication工程SpeechApp，在开发环境的右边的解决方案管理器（SolutionExplorer）中，添加DotNetSpeech对象库。

右键点击"Reference"（参考），选择"AddReference"（添加参考），在弹出的文件选择对话框中找到刚才生成的DotNetSpeech.dll。

图

（2）

打开Form1.cs代码文件,在代码开头添加名字空间（注意大小写）。

usingDotNetSpeech;

这样就实现了SAPISDK的导入，下面我们就可以开始编写应用代码了。

本示例演示如何把文本通过喇叭朗读出来以及把文本转化成语音信号（Wave声音文件），程序界面如图（3）：

//朗读

privatevoidbuttonSynthesis_Click（objectsender,System.EventArgse）

{

try

{

SpeechVoiceSpeakFlagsSpFlags=SpeechVoiceSpeakFlags.SVSFlagsAsync;

SpVoiceVoice=newSpVoice（）;

Voice.Speak（this.textBoxText.Text,SpFlags）;

}

catch（Exceptioner）

{

MessageBox.Show（"AnErrorOccured!

","SpeechApp",MessageBoxButtons.OK,MessageBoxIcon.Error）;

}

//生成声音文件（Wav）

privatevoidbuttonTTStoWave_Click（objectsender,System.EventArgse）

{

try

{

SpeechVoiceSpeakFlagsSpFlags=SpeechVoiceSpeakFlags.SVSFlagsAsync;

SpVoiceVoice=newSpVoice（）;

SaveFileDialogsfd=newSaveFileDialog（）;

sfd.Filter="Allfiles（*.*）|*.*|wavfiles（*.wav）|*.wav";

sfd.Title="Savetoawavefile";

sfd.FilterIndex=2;

sfd.RestoreDirectory=true;

if（sfd.ShowDialog（）==DialogResult.OK）

{

SpeechStreamFileModeSpFileMode=SpeechStreamFileMode.SSFMCreateForWrite;

SpFileStreamSpFileStream=newSpFileStream（）;

SpFileStream.Open（sfd.FileName,SpFileMode,false）;

Voice.AudioOutputStream=SpFileStream;

Voice.Speak（txtSpeakText.Text,SpFlags）;

Voice.WaitUntilDone（Timeout.Infinite）;

SpFileStream.Close（）;

}

catch（Exceptioner）

{

MessageBox.Show（"AnErrorOccured!

","SpeechApp",MessageBoxButtons.OK,MessageBoxIcon.Error）;

}

接下来,还要去控制面板配置SpeechSDK引擎当前所处理语言。

打开"控制面板"，打开"语音"配置项目，可以看到在这里我们可以指定当前可以对何种语言进行识别或者合成，还可以配置相关的硬件设备以及控制语速。

（如图4）

在"文字-语音转换"的"语音选择"组合框中选择简体中文（MicrosoftSimplifiedChinese）。

这样就可以合成汉语文字了。

回到VS.Net，F5编译运行刚才的应用程序，在文本框里输入汉字，戴上耳机，点击"朗读"按钮，开始体验新一代的智能人机界面吧，呵呵：

）

.Net平台下开发英文语音应用程序

程序演示：

点击下载

源文件：

点击下载

1、先安装金山词霸

然后会在系统目录[Win2000是WINNT目录]下Speech中找到vtxtauto.tlb文件

2、导入COM对象到.Net

我们可以利用.NetFramework自带的强大工具TlbImp.exe来把SAPISDK的COM对象导入到.Net中。

TlbImp.exe产生一个管制的包装类，管理客户端可以使用它。

包装类管理实际的COM对象的参考数。

当包装类当作收集的垃圾时，包装类释放掉它包装的COM对象。

当然，你也可以在VS.NET环境中通过从项目参考对话框选择COM对象，实现COM对象的导入，这个过程也是通过TlbImp.exe来完成的。

\WINNT\Speech>Tlbimpvtxtauto.tlb/namespace:

DotNetSpeech_E/out:

DotNetSpeech_E.dll

3．用C#开发英文TTS应用程序示例

下面通过一个实例来介绍如何利用C#进行开发英文语音应用程序，开发环境为：

Win2K+SP4+.NetFrameworkv1.1+MicrosoftVisualStudio.NET2003

首先，新建一个C#的WindowsApplication工程SpeechApp[en]，在开发环境的右边的解决方案管理器（SolutionExplorer）中，添加DotNetSpeech_E对象库。

右键点击"Reference"（参考），选择"AddReference"（添加参考），在弹出的文件选择对话框中找到刚才生成的DotNetSpeech_E.dll。

下面我们就可以开始编写应用代码了。

本示例演示如何把英文文本通过喇叭朗读出来

程序界面如图：

///

///朗读

///

privatevoidButtonSynthesis_Click（objectsender,System.EventArgse）

{

try

{

if（this.textBox1.Text.Trim（）!

=""）

{

DotNetSpeech_E.IVTxtAutoIVTA=newDotNetSpeech_E.VTxtAutoClass（）;

IVTA.Register（"",""）;

IVTA.Speak（this.textBox1.Text,0）;

}

catch（System.Exceptionec）

{

MessageBox.Show（ec.ToString（）,"SpeechApp",MessageBoxButtons.OK,System.Windows.Forms.MessageBoxIcon.Error）;

}

4、结论

.net环境更使这种开发方便快捷。

赶快去测试，让你的应用程序"绘声绘色"，体现NatureUI，Let’sGO!

展开阅读全文