语音控制小车设计方案Word格式.docx

上传人:b****3 文档编号:7867357 上传时间:2023-05-09 格式:DOCX 页数:43 大小:3.65MB
下载 相关 举报
语音控制小车设计方案Word格式.docx_第1页
第1页 / 共43页
语音控制小车设计方案Word格式.docx_第2页
第2页 / 共43页
语音控制小车设计方案Word格式.docx_第3页
第3页 / 共43页
语音控制小车设计方案Word格式.docx_第4页
第4页 / 共43页
语音控制小车设计方案Word格式.docx_第5页
第5页 / 共43页
语音控制小车设计方案Word格式.docx_第6页
第6页 / 共43页
语音控制小车设计方案Word格式.docx_第7页
第7页 / 共43页
语音控制小车设计方案Word格式.docx_第8页
第8页 / 共43页
语音控制小车设计方案Word格式.docx_第9页
第9页 / 共43页
语音控制小车设计方案Word格式.docx_第10页
第10页 / 共43页
语音控制小车设计方案Word格式.docx_第11页
第11页 / 共43页
语音控制小车设计方案Word格式.docx_第12页
第12页 / 共43页
语音控制小车设计方案Word格式.docx_第13页
第13页 / 共43页
语音控制小车设计方案Word格式.docx_第14页
第14页 / 共43页
语音控制小车设计方案Word格式.docx_第15页
第15页 / 共43页
语音控制小车设计方案Word格式.docx_第16页
第16页 / 共43页
语音控制小车设计方案Word格式.docx_第17页
第17页 / 共43页
语音控制小车设计方案Word格式.docx_第18页
第18页 / 共43页
语音控制小车设计方案Word格式.docx_第19页
第19页 / 共43页
语音控制小车设计方案Word格式.docx_第20页
第20页 / 共43页
亲,该文档总共43页,到这儿已超出免费预览范围,如果喜欢就下载吧!
下载资源
资源描述

语音控制小车设计方案Word格式.docx

《语音控制小车设计方案Word格式.docx》由会员分享,可在线阅读,更多相关《语音控制小车设计方案Word格式.docx(43页珍藏版)》请在冰点文库上搜索。

语音控制小车设计方案Word格式.docx

语音识别技术的研究取得了显著的进步,从以前的假想实现成为现实;

如现在的智能玩具市场中,智能小车作为微电子智能玩具是面向广大群众需求的主流,这区别于传统式的手遥控小车运动方式,大大的带给人们一种前所未有的新鲜感,在这些设计系统当中,语音识别技术是关键,让人们体验到不用动手只用开口的真正智能化。

通过课题设计,我自己也能了解学到一些有关语音识别技术方面的知识,这些知识区别于我所在学校学到的传统基础知识,它能让自己大开眼界,了解到现在的语音识别科技的发展趋势,设计中,也让自己把在学校中学到的知识重新的复习了一遍,让自己受益匪浅。

语音识别技术的应用也很广,不仅仅局限于玩具小车的设计中,在现在的高端产品中都担任着重要的角色,如家具电器、智能手机、智能导航仪等中都发挥着不可估量的作用。

因此,展开语音小车的设计是非常有意义的。

1.3课题设计方案

经过多方的学习参考文献资料,由此得出了三种最初的设计方案,并加以认真考虑那种方法最为适于课题的设计。

方案一:

采用STC11L08XE单片机作为主控芯片,语音识别模块使用LD3320语音芯片,在该模块上也集成有REG1117-3.3V的稳压芯片,由于LD3320芯片集成了语音接收识别处理器和外部电路,其系统也精简,由于LD3320芯片集成了语音识别处理器和外部电路,包括AD和DA转换器、麦克风、声音输出等接口,且不需要外接任何的辅助芯片如Flash、RAM[7];

由于电路的精简,让各个芯片之间按原理设计的要求焊接在一起,使用起来非常的实用方便,该语音模块能够直接集成在现有的产品中,并且可以直接实现语音识别、声控、人机对话等功能,此语音模块的市场价格相对比较便宜,它采用的非特定人连续语音识别的技术,使得该模块的语音识别率相当高;

通过使用LM2596和LM2940芯片作电源模块,分别为两个直流电机、L298N、语音模块提供电源,采用定时/计数器T0产生的PWM方波来控制电机的正反转等运动状态[8],实现该方案结构如图1-1所示:

图1-1STC单片机方案框图

方案二:

使用凌阳SPCE061A单片机来设计语音小车,这款芯片非常的强大,其部集成了语音的识别模块并且具有语音的播报和录放功能的模块[9],只需要焊接好麦克风(MIC)和拓展语音的功放就可以了,在本设计当中,只要一块SPCE061A就能实现基本的功能模块的功能,极其的精简,在设计过程中节约了大量的时间,非常的便于使用,但是价格比较昂贵,这个方案的基本结构图如图1-2所示:

图1-2凌阳61核心方案框图

方案三:

这个方案是基于TMS320vc5420这款芯片的语音处理板的设计,整个设计都是围绕着TMS320vc5420为主要核心电路进行设计,该系统以语音CODEC芯片与DSP芯片作为最主要核心,并且具有强大的数据处理的能力和较灵活的与外部通信的接口电路,其预算处理的速度非常的高效,能够快速的分析处理大量的语音信号的数据,实时性也不错,基于其性价比比较昂贵,一般用的不是太多,这个方案的设计如图1-3所示:

图1-3DSP核心方案框图

由以上方案对比,方案一其性价比也相对比较便宜,基于该核心芯片是能够识别非特定人语音的,并且该芯片的识别正确率也很高,有95%这样的识别正确率,区别于一些需要进行事先录制声音的语音识别芯片,在芯片外围电路也比较简单,芯片外围设有喇叭、麦克风等拓展口,在语音识别方面上有较大的优势;

方案二运用的比较的广泛,看起来也比较简易,但是考虑到其在软件上的设计比较困难并且整个设计价格较高;

方案三虽然对语音信号的数据处理非常的强大,但是也考虑到其昂贵的价格,不宜选择;

所以经过这三种方案的探讨与仔细的分析思考后,决定选择方案一为此次设计方案。

 

2语音小车硬件设计

2.1语音小车原理框图

基于硬件平台的设计,构建小车硬件原理框如图2-1所示。

图2-1语音小车原理框图

此次的设计有三个大模块,即为语音识别模块LD3320(与单片机STC11L08XE集合在一块板子上)、电源模块(由LM2596和LM2940组成)、电机驱动模块L298N;

在小车的设计上,使用两节3.7v电池为整个系统供电,在驱动小车上,电池输出电压由电压可调LM2596芯片稳压后输出,为小车的两个直流电机提供驱动电源;

一部分由LM2940芯片把电池输出电压稳定在5V,测试输出稳定后,专门为整个语音芯片工作;

由于这个语音模块中的LD3320和单片机的工作电压都是3.3V的,所以还要经过一个稳压芯片REG1117-3.3把电源模块里稳压输出的5V降低为3.3V,这样才能够使整个语音模块正常的工作;

当接收语音的信号时候,该信号会经过语音芯片的逻辑处理,通过芯片部的AD/DA转换,变换成单片机能够读取的数字信号,通过I/O口,由单片机部的逻辑处理,再通过软件的编程,使用定时器中断T0产生脉冲宽度调制波(PWM)信号,然后再通过控制输出I/O口的操作,对L298N发出相对应的控制信号,实现对小车电机运动状态的操作。

2.2语音识别模块

语音模块电路原理如图2-1所示。

图2-1语音模块电路原理图

在语音模块中,里面含有3块芯片,一块是语音信号接收识别模块(LD3320),一块是语音处理模块(STC11L08XE)以及REG1117稳压模块[10],在这个原理图当中,STC11L08XE单片机与LD3320是以并行方式连接的;

在单片机芯片外部,设计有芯片复位电路,同时外接一个22.1184Mhz的晶振作为外部时钟电路,为单片机工作提供工作时钟频率;

在语音芯片外围,该语音芯片与单片机共用同一个时钟输入,并设计有喇叭音量外部控制电路,在本次设计中未使用到该电路,除此,还设计有麦克风增益的辅助电路,在调节麦克风的灵敏度时,会使用到该电路,还有一些外围电源处理电路,目的是为了让电源信号稳定,不影响芯片工作;

除了外围电路,同时还要为P0~P7口、读写信号口、片选信号口、复位口及MD、A0口接上上拉电阻,保证这些端口信号稳定。

在整个硬件的语音模块中,该模块对外部语音信号进行识别处理的过程如图2-2所示。

图2-2语音模块处理过程框图

在芯片中语音识别功能是通过在部关键词列表中的词语与语音相匹配出结果的过程;

在对语音进行识别时候,在芯片部把声音的频谱转换成相应特征的语音,根据这个语音特征,语音再从关键词列表中,逐个对列表词语进行匹配,在匹配出最好最优的关键词后,将其作为语音识别的结果[11]。

例如:

在我们日常的手机的应用里面,关键词语的容就包括了本里面的联系人或者手机里面存储短信的人的名字、手机应用功能的设置菜单命令、存储卡里面的存储的歌曲的曲名,地图地址等。

根据需要,设置相应的寄存器,通过改变里面的数据,就能够把列表中相对应的待识别条目容以字符窜的形式写入到语音识别芯片,修改一些需要设定关键词;

从算法角度来看,每一条关键词语最多能够容纳的字数是限制在30个字以,但是从大多数的实际情况来看,用户在说出条目时,如果一下子说超过8个字以上的关键词,这样肯定会有说错字、说漏字、说多字、停顿等情况,这些情况都会严重影响语音的识别,从而造成语音识别的错误,大大的提高了误识别率。

因此,一般来说,如果想要获得较为准确的语音识别结果,条目中的关键词语字数不要太长,尽量短一些,这样识别的准确率也相对提高了很多。

2.2.1语音接收识别模块

LD3320芯片原理图如图2-3所示。

图2-3语音芯片原理图

LD3320语音芯片的诞生,是在人们生活中非特定人语音识别的要求下,由设计开发人员特别研发设计出来的,并作出了相关技术的解决办法。

基于考虑设计的实用性和便捷,开发设计时在LD3320语音芯片周围集成了高精度的A/D和D/A的转换接口,部有放大处理,因此不再需要外接任何的Flash和RAM等辅助芯片,高度的集成就能够实现语音识别、声控、人机对话等功能。

并且,在识别的关键词语列表里面,关键词是可以进行动态编辑的。

基于LD3320语音芯片的强大功能,它能够在几乎任何的电子产品中,包括以最简单且普遍的51单片机作为主要控制芯片的系统里面,也可以轻松的实现各种语音人机交流等功能。

同时也为市面上基本所有的电子产品,添加了VUI(VoiceUserInterface)语音用户操作的界面,增加了电子语音功能特色。

该款芯片的主要功能有:

①非特定人语音识别技术:

在进行语音识别的时候,不需要使用者事先进行录音练习;

可以直接进行语音识别,语音识别的准确率高达95%;

②真正独立芯片解决方案:

由于其部存储空间容量比较大,不需扩展外接RAM和Flash,从而不用外扩而降低该芯片的使用成本;

③在芯片置有高精度的D/A与A/D通道:

由于芯片本身的设计开发,它可以在部自动完成AD转换,除此,在AD的输入上面只需接好MIC,就可以完成模拟量的输入,在DA输出上能够播放声音的文件,不用外接放大器,在部集成有550mw的放大器;

④高准确度和实用的语音识别效果:

可容纳50条关键词,随意自由编辑词条容,但是,对外界语音也只能从这50条关键字中进行识别匹配;

因此在不同的场合可以根据需要编辑不同的关键词,这样显得关键词的编辑很灵活;

只要自己有需要或是工作场合有需要都可以进行更新关键词。

LD3320提供的语音识别技术,是基于“关键词语列表”的识别技术[12]。

在程序设计中,关键词语的列表生成,是通过单片机写入到芯片的寄存器中,经过声音的扫描后,在部识别匹配成功后,将结果送给单片机,然后根据结果进行下一步控制;

⑤可动态编辑关键词语列表:

在识别的程序当中,把关键词用字符窜的编写方式编写进核心芯片当中,这样子的话,就能够在下次识别的时候立即生效。

举例如:

使用者在使用51系列的单片机作为主控芯片编程的时候,只需要简单的编写芯片的寄存器操作,就能够把一些“”、“”等简单容的关键字动态的传送到芯片当中,同样在下一次识别操作的时候,芯片就可以识别出这些已存入的关键词了;

⑥芯片的工作电压为3.3V,部消耗能力小,所以比较节能,用AA电池就可直接为芯片供电;

⑦自动语音识别ASR现实意义:

使用者可以脱离外设的依赖,只需要语音操作即可完成想要做的事情,解放了传统的手控指令的操作,做到了真正的智能识别操作。

2.2.2语音芯片部分逻辑电路

LD3320语音芯片的部部分电路逻辑图如图2-4所示。

图2-4LD部逻辑电路图

该芯片的电源输入使用3.3v基本都可以满足正常工作,该芯片的管脚输出高电平时,对应引脚电压为电源电压的0.7倍,如果相应的管脚为低电平时,其管脚输出的电压为0.3倍电源电压,在该语音模块上,单片机和语音芯片共用稳压输出的3.3V。

VDD—的数字电路使用电源输入:

3.0V-3.3V;

VDDIO—数字I/O电路使用电源输入:

1.65V-VDD;

VDDA—模拟电路使用电源输入:

3.0V-4.0V;

▲时钟(Clock)—芯片必须连接外部时钟晶振,在该芯片外部有外接晶振端口,其部有一个频率合成器,能产生一定特定频率供给芯片部器件工作。

▲复位—必须在电源信号都稳定后,才能让复位信号(RSTB*)对芯片进行复位;

不管芯片在做任何的事情,复位信号都能使芯片回到最初的状态,同时让各个寄存器复位,如果不进行对寄存器的操作的话,复位后的芯片将进入不工作的状态。

在这以后,只要有一个CSB*信号,就能够激活芯片,让它处于工作的状态。

▲并行接口—该芯片可以通过并行方式和外部CPU连接;

使用P0口作数据线,一个中断返回信号(INTB*),控制读写信号WRB*,RDB*,片选信号CS*及A0口。

▲串行接口—串行接口通过SPI协议,再与外部主CPU进行连接通信;

首先要将MD接上高电平,将(SPIS*)接地。

串行时候只使用到4个管脚:

SPI输出(SDO)、SPI输入(SDI)、SPI时钟(SDCK)、片选信号(SCS*)。

▲寄存器—通过对寄存器的操作来完成芯片的设置,以及处理一些命令还有传送接收数据等。

贴片的语音芯片相应管脚图和封装图如图2-5和2-6所示。

图2-5LD芯片管脚图

图2-6LD芯片封装图

其对应图2-5所示管脚编号定义如表5-1所示。

表5-1芯片管脚说明

管脚编号

管脚说明

1,32

数字IO电路电源输入

31

时钟输入(4~48Mhz)

2~6

根据原理图接上拉电阻

34~38

第3~7位并行口接上拉电阻

7

数字逻辑电路电源

39

第2位并行口,共用SPI时钟

8,33

IO和数字电路接地

40

第1位并行口,共用SPI输出,接上拉电阻

9,10

麦克风输入(正负)

41

第0位并行口,共用SPI输入,接上拉电阻

11

单声道输入

42

写允许,共用SPI允许(低电平有效),接上拉电阻

12

麦克风偏置

43

并行方式和共用SPI片选信号,接上拉电阻

13,14

立体声输入(左右端)

44

地址或数据选择,在WRB*有效时,高电平表示P0~P7是地址,而低电平表示P0~P7是数据。

连接上拉电阻

15,16

耳机输出

45

读允许(低电平有效,接上拉电阻)

17,24

模拟电路接地

46

0:

并行工作方式1:

串行工作方式

18

声音信号参考电压

47

复位信号,低电平有效,接上拉电阻

19,23

模拟信号电源

48

中断输出信号,低电平有效,接上拉电阻

27,28

LineOut输出

20~22

喇叭音量外部控制

29,30

可悬空

25,26

喇叭输出

2.2.3单片机模块

单片机原理图如图2-7所示。

图2-7单片机模块原理图

语音小车的主要控制芯片是STC11L08XE单片机,它是一款单时钟或者单机器周期的单片机,具有高速运行、功耗低、抗干扰极强的特点,属于新一代的8051单片机,拥有8k字节的Flash程序存储空间,1280字节的SRAM,有32K空间的EPROM,其指令编码完全兼容传统的8051单片机,除此外它的部集成有高可靠度的复位电路,专门针对强干扰、高速通信等场合;

其次它是一款低功耗的单片机,工作电压只需要3.3v,通用I/O口在复位之后为:

准双向口,每个I/O的驱动能力很强,基本可以达到20mA,对于整块芯片部结构来说,全部口不能承受超过100mA电流,基于其设计的特性,它能够在ISP/IAP模式下,无需专门的编程器和专门的仿真软件就可以通过串口(RxD/P3.0,TxD/P3.1)直接下载用户事先编写好的程序,下载速度极快,用户在下载程序时候,可以选择是使用振荡器还是使用外部的晶振时钟;

其具有EPROM和看门狗的功能;

该单片机部拥有2个16位的定时器/计数器,它的时钟信号有3个输出口,在P3.4/T0口处,可以由T0定时器溢出输出时钟信号,也在P3.5/T1口处,由T1定时器溢出输出时钟信号,由于芯片部独特结构,拥有1~2个独立的波特率发生器,在使用要求低的时候,即使用的时钟频率为4MHz~8MHz这样时,可以使用它部的R/C振荡器提供时钟频率,因此,在它的P1.0口处,能够输出相应的时钟信号;

它的外部中断的I/O口有5路,有两个中断优先级别,与传统的单片机一样,也支持低电平触发中断或者下降沿的中断,其掉电模式可以由外部的5个中断唤醒,这5个中断分别为:

INT/RxD/P3.0口(INT/RxD/P1.6口)、INT0/P3.2口、INT1/P3.3口、INT/T0/P3.4口、INT/T1/P3.5口;

主控芯片主要用来处理语音芯片的输入信号和输出控制信号使电机工作。

该主控芯片外接有22.1118MHZ的晶振时钟,通过XTAL2口与LD3320的CLK口相连,共同使用同一个外部时钟源;

它与语音芯片工作的方式是并行方式,通过单片机的P4.3口向MD口输出一个低电平;

在并行的工作方式下单片机P0口与语音芯片的P0口相连接,通过单片机的P2.1口发出一个低电平到语音芯片的CSB*端口,作为并行方式下的片选信号,从而实现真正的与语音芯片通信工作;

在处理数据的时候,LD3320芯片在处理语音信号后会输出一个低电平的信号给单片机的INT0口,使得单片机的外部中断请求的触发方式为电平触发;

选择好工作方式后,在P3.6和P3.7输出控制信号到语音芯片的WRB*和RDB*(输出为低电平的时候有效),再由单片机的P2.0口控制输出一个信号给语音芯片的A0引脚,当输出的是低电平(“0”)的时候,并行口P0~P0.7的通信是以地址的形式进行的,当输出的是高电平(“1”)的时候,并行口的通信是以数据的形式进行的,单片机的P3.5口输出控制信号控制语音芯片的复位(输出为低电平的时候有效)。

2.3电源模块

在这次的设计当中所使用的电源模块由两个部分组成,即由LM2940芯片和LM2596芯片组成,该模块的电路原理如图2-8。

图2-8电源模块原理图

Jo为电源的输入端口,由外部的电池供电;

LM1部分就是LM2940芯片,它是一个输出电压固定的低压差三端稳压器,能够稳压输出5v,同时能够输出1A的电流;

该芯片的理论上,承受最大输入电压是26v,如果芯片输出1A时,它最小的输入输出电压差应该是小于0.8v的;

在芯片的部含有一个静态的电流降低电路,如果输入给芯片的电压与输出电压的差压超过3v的话,就能够减少地电流;

在输出的电流为1A,其静态电流为30mA,或者输出输入的电压差为5V的时候,它的静态电流也为30mA,除此外,其部还有防止电池反接、反插的保护电路,以防输入错误的电压对电路造成严重的损坏;

这个模块上,它主要是为语音模块提供输出稳压5v。

在稳压5V输出的性能上,也可以选择7805,在此不多介绍。

PCB图下部分是LM2596稳压模块,此芯片中,有一个1.23V稳压器,根据需要不同,选择不同的元器件参数,作为外围辅助电路;

在芯片里面,还有一个振荡器,这个振荡器特点是:

它所产生的频率是固定的。

在此,我使用的是可调的输出电压;

由于开发人员的设计,对该芯片里面设计有保护模块,能够在过热、过流是保护芯片本身;

这块芯片的运用只需要非常少的外围电子元器件就能够构造成高效稳压电路,除此外,芯片本身还提供了工作状态的外部控制引脚,这个稳压集成电路有以下几个特性:

3.3v、5v、12v固定输出型和可调输出型可调型的输出围为1.2v~32v,输入电压最高可以达到40v,只需要7个外围的简单元器件,可以提供3A负载电流;

这块芯片在模块中主要是为小车电机提供电源。

2.4电机驱动模块

整个设计的核心动力部分就在这个模块上,电机驱动模块电路原理如图2-9所示。

图1.0电机驱动模块原理图

此电源模块有以下性能特点:

①能够实现电机的正转和反转并调节电机转速;

②启动转矩大;

③工作电压可以达到46V,能输出2A电流;

④可以驱动一台或者两台直流电机,也可以驱动个一个两相的步进电机[13];

⑤使用的围比较广。

该芯片工作电压为5V,其输入端为图中的VSS;

VS表示的是供给电机工作的电压,其最小值需要比输入的低电平电压高;

SENSA、SENSB分别为其部两个H桥的电流反馈脚,在一般的小型电机的使用中,将它们接在公共端;

ENA、ENA为使能端,用于输入PWM信号;

引脚IN1、IN2、IN3、IN4为输入端,与单片机I/O连接,接收TTL逻辑电平信号;

管脚OUT1、OUT2(1通道)和OUT3、OUT4(2通道)为两组输出端,ENA为高电平时,选择1通道输出,ENB为高电平时,选择2通道输出,该两个分别接两个电机;

在通电的时候,电机本身具有很大的感性,如果电流突然的断掉,或者突变很厉害的话,会产生一个很大的反向电流,此时该电流很容易把L298N芯片给烧掉,所以在芯片的外围加上D1~D8续流二极管,它们的作用是保护芯片的输出端不受过高的反电压击穿而烧坏;

该模块输入信号主要由单片机控制,单片机通过改变I/O口的高低电平,控制使能端,就可以对小车电机进行左右转、前进后退、停止等操作,具体的控制信号引脚和电机的逻辑关系如列表5-2所示。

表5

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 初中教育 > 理化生

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2