基于单片机的语音遥控车设计Word文件下载.docx

资源描述

基于单片机的语音遥控车设计Word文件下载.docx

《基于单片机的语音遥控车设计Word文件下载.docx》由会员分享，可在线阅读，更多相关《基于单片机的语音遥控车设计Word文件下载.docx（27页珍藏版）》请在冰豆网上搜索。

基于单片机的语音遥控车设计Word文件下载.docx

2006年斯洛伐克研究出“天蝎座”无线遥控机器人车——简易爆炸装置的克星。

2006年为了确保飞机起降安全，我国机场有关方面组织专家技术攻关，研制成功无人驾驶遥控驱鸟车，走出了一条利用高科技驱鸟的新路。

人员通过遥控器操作，可以变速，在1公里范围内从机场南端到北端来回行驶，具有全天候使用、承担重复强度大、自动化程度高的优点。

2007年8月法国ＥＣＡ公司新近推出的“INBOT”微型无人车，该车可通过掌上电脑或与操纵杆连接的个人计算机控制，虽然貌不惊人，但发展前景却不容小视，无论爆炸物处理还是战术侦察都是它的强项。

2010年6月，武汉科技大学机械工程学院完成气动遥控消防小车的设计，该车动力均以气动为主，通过手持遥控器发出预设指令，在各功能的协调配合下，该车完全可代替消防人员进入复杂危险环境实施救灾作业，从而确保消防人员的人身安全。

此外该设备绿色环保，节能减排，有较好的应用价值，具有良好的市场推广前景。

2010年11月开始，我国科技创新协会首届遥控小车比赛正式启动。

科技创新协会会员通过组员之间的配合，查阅资料，从零开始。

历经4个月，自主设计制作出了一辆辆可以左右转向，前后行进的遥控小车，经过不断调试，无线遥控小车最终成功启动。

2011年德国与瑞士联合组建的“地雷狼”（Minewolf）系统公司最近展出了新型中型“地雷狼”MW330扫雷车。

该车可以选择人员操作和远程遥控两种方式,在操作模式中能够抵御重型反坦克地雷的攻击。

2011年5月就读于西班牙加泰罗尼亚理工学院的两名大学生亚历克斯.洛维特和哈维尔·

萨卢埃尼亚，制造了世界首架利用汽水铝罐拉环作为燃料的无线遥控小车DAlH2Orean。

人类对于语音技术的接触大概要追溯到爱迪生在1875年发明留声机和贝尔在1876年发明电话。

随后，语音正式成为了可以被人造物有效存储、传输的信号。

此后的语音技术逐渐分化出三个方向。

最早开展的是物理信号层次的处理，主要是为了获得清晰的语音信号。

后来，人们开始了语音技术的第二分支——语音合成，这门学科的研究，也就是根据文字制造声音。

1936年AT&

T的贝尔实验室（BellLab）发明了世界上第一个基于语音技术的电子语音合成器，这个东西在二战时期被悄悄的用在罗斯福和邱吉尔的电话通话中，以保证通话的安全。

语音技术的第三分支是语音识别。

语音识别作为语音合成的逆过程，基本的任务就是把语音转化为文字，它的难度要比语音合成高出很多，成为了语音技术中最具挑战性的分支。

从1966年到1972年，对隐马尔可夫模型的研究极大的鼓舞了语音技术工程师和研究者们，以及政府的热情。

从1971年开始，美国组织了包括麻省理工学院等著名研究机构，一起建立一个进行基于语音技术的连续语音识别的计算机系统。

这是当时规模最大的语音技术项目。

与此同时，1971年的剑桥大学工程系，一个新的语音技术实验室被建立起来。

这个实验室建立之初的目标就是对机器学习相关的技术进行研究，力图使英国这个科学大国继续能在语音技术领域也占据一席之地。

数字信号处理成为70年代最为火热的语音技术的领域之一。

以此为基础的语音识别也在众多世界著名的大学、研究所和公司紧锣密鼓的开展起来。

到了80年代初，语音技术的研究已经初具规模，形成了不同的门派以及各自的系统。

进入二十一世纪后，世界范围内新兴的语音技术公司更是层出不穷，思必驰作为其中一员，在语音识别、语音评测方面的研究取得了重大突破[8]。

思必驰以源于剑桥大学的语音技术为起点，自主研发了国际创新的第二代智能语音分析和人机对话技术。

与目前使用的第一代语音技术相比，第二代智能语音技术大大减小了对使用环境和方式的限制，并能够对不同口音进行快速的自适应调整，具有优异的语音分析精度和稳健的人机对话性能。

第二代语音技术使得机器智能得以更充分的体现，同时也将引导智能语音技术的下一次应用高潮。

1.3研究的内容和要求

本设计主要研究的内容是以单片机为核心进行语音遥控车的设计，包括硬件电路和软件程序的设计。

硬件电路的设计主要包括语音识别模块、控制核心模块、小车驱动模块与转向控制模块等；

软件设计主要是完成相应电路的功能，要求能够进行语音识别，能够通过语音信号控制小车前进、后退、左转和右转的动作。

第2章方案论证

2.1方案论证

根据设计要求，制订了如下三套方案：

方案一：

采用MCS-51系列中的89S52单片机。

以89S52为控制核心，利用声控传感器和专门的语音处理芯片，并采用桥式驱动电路来实现对小车的前进转向进行控制,并能够做出应答的功能。

89S52是一款八位单片机，应用范围广,价格便宜是其最大优点。

但由于89S52单片机的闪存（FLASH）只有8K,且无法内置DAC电路,必须通过外围电路实现。

另外，语音识别是一门新兴的技术,不止包括语音的录制和播放,还包括语音的压缩,编码和解码和语音的识别,这些都要进行大量的计算,如果用89S52来实现，需要扩展语音识别模块和语音播放模块，这样必然造成端口的资源紧张，而其实现起来比较困难且效率很低。

实现该方案结构如图2-1所示。

图2-1采用MCS-51系列单片机实现语音控制小车

方案二：

采用以TMS320VC5402这款DSP芯片为语音处理系统的核心部分来实现语音控制方案。

其主要优点包括：

采用改进的哈佛结构，带有专用硬件逻辑CPU（40位算术逻辑单元（ALU），包括1个40位桶形移位器和二个40位累加器；

一个17×

17乘法器和一个40位专用加法器，允许16位带或不带符号的乘法），片内存储器（八个辅助寄存器及一个软件栈），片内外专用的指令集，允许使用业界最先进的定点DSPC语言编译器。

最重要的是其运算处理速度的高效，可以快速处理大量的语音数据，实时性好，但费用价格昂贵。

该方案如图2-2所示。

图2-2基于TMS320VC5402的语音识别小车

方案三：

采用SPCE061A实现语音控制小车方案，由于SPCE061A内部集成有语音识别和语音播放功能模块，所以只需要扩展基本的MIC和语音功放即可，另外凌阳SPCE061A单片机提供32个I/O口，一片SPCE061A单片机即可实现所有功能，这为设计过程提供了极大方便。

该方案结构如图2-3所示。

图2-3基于SPCE061A的语音控制小车实现方案

比较以上三种方案可见,方案一应用范围广价格便宜但系统复杂且难以实现语音控制；

方案二中TMS320VC5402这款DSP芯片虽然有强大的数据处理功能，但要完成语音识别功能，软件上实现起来比较复杂且价格昂贵；

方案三应用范围广，一般价格略高；

因此，选择方案一。

2.2系统原理框图

根据设计要求，首先通过麦克风将声音信号采集，通过放大电路将信号放大，在将放大的信号，送给AD转换器，由AD转换器将模拟信号转换成数字信号，再将数字信号送给语音处理识别芯片，语音处理识别芯片将信号处理识别后，将处理识别结果送给89S52单片机，再由单片机将识别结果进一步处理，将输出结果送给外围放大电路，由外围放大电路去驱动小车的不同动作，从而实现设计目的。

流程图如图2-4：

图2-4系统原理框图

语音识别模块：

用于接收、识别外界发出的语音信号并转换成数字信号。

AT89S52单片机：

把收到的信号转换成小车的控制信号。

小车驱动模块：

用于控制小车前进、停止和转向的控制模块。

第3章硬件单元电路设计

整个系统的硬件电路主要包括核心主控制和语音识别两个部分。

主控制部分为AT89S52单片机，语音识别部分为LD3320语音识别芯片。

3.1AT89S52单片机最小系统

AT89S52是一种低功耗、高性能的CMOS8位微控制器，具有8KB在系统可编程Flash存储器；

是用Atmel公司高密度非易失性存储技术制造，片上Flash允许程序存储器在系统可编程，也适用于常规编程器。

AT89S52具有8KBFlash，256BRAM，32位I/O口线，看门狗定时器，2个数据指针，3个16位定时器/计数器，1个6向量2级中断结构，全双工串行口，片内晶振及时钟电路。

另外，AT89S52可降至0Hz静态逻辑操作，支持2种软件，可选择节电模式。

在空闲模式下，CPU停止工作，允许RAM、定时器/计数器、串口、中断继续工作。

在掉电保护方式下，RAM内容被保存，振荡器被冻结，单片机一切工作停止，知道下一个中断或硬件复位为止。

AT89S52是在电子设竞赛中最常用的单片机之一[2]。

AT89S52单片机是把那些作为控制应用所必需的基本内容都集成在一个尺寸有限的集成电路芯片上。

如果按功能划分，它由如下功能部件组成，即微处理器、数据存储器、程序存储器、并行I/O口、串行口、定时器/计数器、中断系统及特殊功能寄存器。

它们都是通过片内单一总线连接而成，其基本结构依旧是CPU加上外围芯片的传统结构模式。

但对各种功能部件的控制是采用特殊功能寄存器的集中控制方式，图3-1是AT89S52单片机引脚图。

图3-1AT89S52单片机引脚图

3.1.1主要性能

与MCS-51单片机产品兼容

8K字节在系统可编程Flash存储器

1000次擦写周期

全静态操作：

0Hz～33Hz

三级加密程序存储器

32个可编程I/O口线

三个16位定时器/计数器

八个中断源

全双工UART串行通道

低功耗空闲和掉电模式

掉电后中断可唤醒

看门狗定时器

双数据指针

掉电标识符

3.1.2单片机引脚

VCC:

电源

GND:

地

P0口：

P0口是一个8位漏极开路的双向I/O口。

作为输出口，每位能驱动8个TTL逻辑电平。

对P0端口写“1”时，引脚用作高阻抗输入。

当访问外部程序和数据存储器时，P0口也被作为低8位地址/数据复用。

在这种模式下，P0具有内部上拉电阻。

在flash编程时，P0口也用来接收指令字节；

在程序校验时，输出指令字节。

程序校验时，需要外部上拉电阻。

P1口：

P1口是一个具有内部上拉电阻的8位双向I/O口，p1输出缓冲器能驱动4个TTL逻辑电平。

对P1端口写“1”时，内部上拉电阻把端口拉高，此时可以作为输入口使用。

作为输入使用时，被外部拉低的引脚由于内部电阻的原因，将输出电流（IIL）。

此外，P1.0和P1.2分别作定时器/计数器2的外部计数输入（P1.0/T2）和时器/计数器2的触发输入（P1.1/T2EX），具体如下表所示。

在flash编程和校验时，P1口接收低8位地址字节

P2口：

P2口是一个具有内部上拉电阻的8位双向I/O口，P2输出缓冲器能驱动4个TTL逻辑电平。

对P2端口写“1”时，内部上拉电阻把端口拉高，此时可以作为输入口使用。

在访问外部程序存储器或用16位地址读取外部数据存储器（例如执行MOVX@DPTR）时，P2口送出高八位地址。

在这种应用中，P2口使用很强的内部上拉发送1。

在使用8位地址（如MOVX@RI）访问外部数据存储器时，P2口输出P2锁存器的内容。

在flash编程和校验时，P2口也接收高8位地址字节和一些控制信号。

P3口：

P3口是一个具有内部上拉电阻的8位双向I/O口，p2输出缓冲器能驱动4个TTL逻辑电平。

对P3端口写“1”时，内部上拉电阻把端口拉高，此时可以作为输入口使用。

P3口亦作为AT89S52特殊功能（第二功能）使用。

在flash编程和校验时，P3口也接收一些控制信号。

RST:

复位输入。

晶振工作时，RST脚持续2个机器周期高电平将使单片机复位。

看门狗计时完成后，RST脚输出96个晶振周期的高电平。

特殊寄存器AUXR（地址8EH）上的DISRTO位可以使此功能无效。

DISRTO默认状态下，复位高电平有效。

ALE/PROG：

地址锁存控制信号（ALE）是访问外部程序存储器时，锁存低8位地址的输出脉冲。

在flash编程时，此引脚（PROG）也用作编程输入脉冲。

在一般情况下，ALE以晶振六分之一的固定频率输出脉冲，可用来作为外部定时器或时钟使用。

然而，特别强调，在每次访问外部数据存储器时，ALE脉冲将会跳过。

如果需要，通过将地址为8EH的SFR的第0位置“1”，ALE操作将无效。

这一位置“1”，ALE仅在执行MOVX或MOVC指令时有效。

否则，ALE将被微弱拉高。

这个ALE使能标志位（地址为8EH的SFR的第0位）的设置对微控制器处于外部执行模式下无效。

PSEN:

外部程序存储器选通信号（PSEN）是外部程序存储器选通信号。

当AT89S52从外部程序存储器执行外部代码时，PSEN在每个机器周期被激活两次，而在访问外部数据存储器时，PSEN将不被激活。

EA/VPP:

访问外部程序存储器控制信号。

为使能从0000H到FFFFH的外部程序存储器读取指令，EA必须接GND。

为了执行内部程序指令，EA应该接VCC。

在flash编程期间，EA也接收12伏VPP电压。

XTAL1:

振荡器反相放大器和内部时钟发生电路的输入端。

XTAL2:

振荡器反相放大器的输出端[9]。

3.1.3晶振电路

晶振电路如图3-2所示：

图3-2单片机晶振电路

每个单片机系统里都有晶振，全程是叫晶体震荡器，在单片机系统里晶振的作用非常大，他结合单片机内部的电路，产生单片机所必须的时钟频率，单片机的一切指令的执行都是建立在这个基础上的，晶振提供的时钟频率越高，那单片机的运行速度也就越快。

单片机晶振两个电容的作用：

这两个电容叫晶振的负载电容，分别接在晶振的两个脚上和对地的电容，一般在几十皮发。

它会影响到晶振的谐振频率和输出幅度。

晶振的负载电容=[（Cd*Cg）/（Cd+Cg）]+Cic+△C式中Cd,Cg为分别接在晶振的两个脚上和对地的电容，Cic（集成电路内部电容）+△C（PCB上电容）值为3至5pf。

3.1.4复位电路

复位电路如图3-3所示：

图3-3单片机复位电路

复位电路的基本功能是：

系统上电时提供复位信号，直至系统电源稳定后，撤销复位信号。

为可靠起见，电源稳定后还要经过一定的延时才撤销复位信号，以防电源开关或电源插头分-合过程中引起的抖动而影响复位。

单片机复位电路参数的选定须在振荡稳定后保证复位高电平持续时间大于2个机器周期。

AT89S52单片机是整个开发板的控制中心，我们在选用电路时应该保证它的可靠性和抗干扰性.在选用具体电子器件的时候，应该确定它的各项参数，尽量使用参数相当的器件。

3.2电源电路的设计

如下图3-4所示，为开发板的电源电路。

开发板使用+5V稳压电源，可以使用插针供电，也可以使用电源插座。

图3-4电源

3.3LD3320语音模块

本设计方案采用基于LD3320的模块M-LD3320。

该模块将LD3320芯片与周围必要的容阻件集成在一块PCB上，将LD3320的芯片管脚通过2*20的排针引出。

可以直接将自己的主控MCU的管脚连接到M-LD3320模块的排针上，同时给M-LD3320模块提供3.3V电源和合适的晶振信号，就可以在主控MCU中编写程序运行LD3320的语音识别功能。

LD3320模块主要特征有：

LD3320芯片的音频模拟管脚连接相应的电容/电阻后通过排针引出。

LD3320模块上设计有2个音频插座，直接引出MIC输入和Speaker输出信号。

用户可以用一个带麦克风的耳机验证语音识别和声音播放，十分方便。

LD3320模块上没有电源芯片，相应的电源管脚由排针引出，由开发者连接入3.3v电源输入。

LD3320模块上的CLK输入可以选择如下任意一种：

1）直接将晶振信号通过排针输入到LD3320的相应管脚。

2）或者用户可以自行焊接晶振，在模块上预留了晶振的空间和连接点。

LD3320模块上有两个LED灯，连接到LD3320芯片的29，30管脚上，在LD3320上电重启复位（RSTB*）并稳定工作后，29，30管脚会稳定输出低电平，因此这两个LED灯可以作为芯片上电指示[10]。

说明：

用户可以直接把麦克风和喇叭的接头插入模块上焊接的对应插座中使用，也可以通过引出的对应排针进行连接。

语音识别技术是本系统最为关键的技术之一。

LD3320芯片提供的语音识别技术，是基于“关键词语列表”的识别技术。

并且识别的“关键词语列表”是可以任意动态编辑的。

它是基于非特定人语音识别（SI-ASR：

Speaker-IndependentAutomaticSpeechRecognition）技术的语音识别/声控芯片，其在设计上注重节能与高效，它集成了语音识别处理器和一些外部电路，包括AD、DA转换器、麦克风接口、声音输出接口等，不需要外接任何的辅助芯片，如Flash、RAM等，只需要51MCU将关键词语拼音串，设置寄存器传入LD332X芯片，就可以完成语音识别功能。

直接将芯片设计加入系统中（LD332X芯片支持并口和SPI两种接口方式）即可以增加非特定人语音识别功能，该产品提供了真正的单芯片语音识别解决方案。

下图3-5是LD3320A的非特定语音识别芯片。

图3-5LD3320的非特定语音识别芯片

3.3.1LD3320芯片参数特性

内置单声道mono16-bitA/D模数转换

内置双声道stereo16-bitD/A数模转换

内置20mW双声道耳机放大器输出

内置550mW单声道扬声器放大器输出

支持并行接口或者串行SPI接口

内置锁相电路PLL，输入主控时钟频率为2MHz--34MHz

工作电压：

（VDD:

forinternalcore）3.3V

48pin的QFN7*7标准封装

省电模式耗电：

1uA

3.3.2LD3320芯片的主要特征

通过快速而稳定的优化算法，完成非特定人语音识别。

不需要用户事先训练和录音。

也不需要任何在PC机上的软件。

单芯片。

不需要外接任何辅助的Flash芯片，RAM芯片和AD芯片，就可以完成语音识别功能，真正提供了单芯片语音识别解决方案。

动态编辑识别列表。

每次识别最多可以设置50项候选识别句，每个识别句可以是单字，词组或短句。

另一方面，识别句内容可以动态编辑修改,只需要主控MCU把识别关键词语的拼音串通过设置寄存器的方式传入芯片内部。

因此可由一个系统支持多种场景。

主控MCU对芯片的操作通过读写芯片内部寄存器完成。

通过设置和读取寄存器可以方便地完成设置语音识别列表，启动语音识别，获得识别结果，播放MP3等功能[3]。

芯片内部已经准备了16位A/D转换器、16位D/A转换器和功放电路。

麦克风、立体声耳机和单声道喇叭可以很方便地和芯片管脚连接。

立体声耳机接口的输出功率为20mW，而喇叭接口的输出功率为550mW，能产生清晰响亮的声音。

支持并行接口和串行接口SPI两种连接方式，串行方式可以简化与其他模块的连接。

可把芯片设置为休眠状态，此时耗电非常少，而且可以方便地激活。

支持MP3播放功能，无需外围辅助器件，主控MCU将MP3数据依次送入LD332X芯片内部就可以从芯片的D/APIN输出声音。

支持MPEG1（ISO/IEC11172-3）,MPEG2（ISO/IEC13818-3）和MPEG2.5layer3等格式。

工作供电为3.3V，如果用于便携式系统，使用3节AA电池就可以满足供电需要[11]。

3.4电机驱动电路

L298是ST公司生产的一种高电压、大电流电机驱动芯片。

该芯片的主要特点是:

工作电压高，最高工作电压可达46V;

输出电流大，瞬间峰值电流可达3A，持续工作电流为2A；

内含两个H桥的高电压大电流全桥式驱动器，可以用来驱动直流电动机和步进电动机、继电器、线圈等感性负载；

采用标准TTL逻辑电平信号控制；

具有两个使能控制端，在不受输入信号影响的情况下允许或禁止器件工作；

有一个逻辑电源输入端，使内部逻辑电路部分在低电压下工作；

可以外接检测电阻，将变化量反馈给控制电路。

直流电机驱动电路使用最广泛的就是H型全桥式驱动电路。

这种驱动电路可以很方便实现直流电机的四象限运行，分别对应正转、正转制动、反转、反转制动[5]。

L298N芯片如图3-6所示：

图3-6L298N芯片

H桥驱动原理：

H桥一共有四个臂，分别为B1~B4，每个臂由一个开关控制，示例中为三极管Q1~Q4。

如果让Q1、Q2导通Q3、Q4关断，如图3-7所示，此时电流将会流经Q1、负载、Q2组成的回路，电机正转。

图3-7Q1、Q2导通时H桥工作状态

图3-8Q3、Q4导通时电桥工作状态

如果让Q1、

展开阅读全文