智能轮椅语音导航控制系统的设计毕业设计说明书Word文档格式.docx
《智能轮椅语音导航控制系统的设计毕业设计说明书Word文档格式.docx》由会员分享,可在线阅读,更多相关《智能轮椅语音导航控制系统的设计毕业设计说明书Word文档格式.docx(45页珍藏版)》请在冰豆网上搜索。
本人授权 大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。
涉密论文按学校规定处理。
导师签名:
日期:
注意事项
1.设计(论文)的内容包括:
1)封面(按教务处制定的标准封面格式制作)
2)原创性声明
3)中文摘要(300字左右)、关键词
4)外文摘要、关键词
5)目次页(附件不统一编入)
6)论文主体部分:
引言(或绪论)、正文、结论
7)参考文献
8)致谢
9)附录(对论文支持必要时)
2.论文字数要求:
理工类设计(论文)正文字数不少于1万字(不包括图纸、程序清单等),文科类论文正文字数不少于1.2万字。
3.附件包括:
任务书、开题报告、外文译文、译文原文(复印件)。
4.文字、图表要求:
1)文字通顺,语言流畅,书写字迹工整,打印字体及大小符合要求,无错别字,不准请他人代写
2)工程设计类题目的图纸,要求部分用尺规绘制,部分用计算机绘制,所有图纸应符合国家技术标准规范。
图表整洁,布局合理,文字注释必须使用工程字书写,不准用徒手画
3)毕业论文须用A4单面打印,论文50页以上的双面打印
4)图表应绘制于无格子的页面上
5)软件工程类课题应有程序清单,并提供电子文档
5.装订顺序
1)设计(论文)
2)附件:
按照任务书、开题报告、外文译文、译文原文(复印件)次序装订
指导教师评阅书
指导教师评价:
一、撰写(设计)过程
1、学生在论文(设计)过程中的治学态度、工作精神
□优□良□中□及格□不及格
2、学生掌握专业知识、技能的扎实程度
3、学生综合运用所学知识和专业技能分析和解决问题的能力
4、研究方法的科学性;
技术线路的可行性;
设计方案的合理性
5、完成毕业论文(设计)期间的出勤情况
二、论文(设计)质量
1、论文(设计)的整体结构是否符合撰写规范?
2、是否完成指定的论文(设计)任务(包括装订及附件)?
三、论文(设计)水平
1、论文(设计)的理论意义或对解决实际问题的指导意义
2、论文的观念是否有新意?
设计是否有创意?
3、论文(设计说明书)所体现的整体水平
建议成绩:
(在所选等级前的□内画“√”)
指导教师:
(签名)单位:
(盖章)
年月日
评阅教师评阅书
评阅教师评价:
一、论文(设计)质量
二、论文(设计)水平
评阅教师:
教研室(或答辩小组)及教学系意见
教研室(或答辩小组)评价:
一、答辩过程
1、毕业论文(设计)的基本要点和见解的叙述情况
2、对答辩问题的反应、理解、表达情况
3、学生答辩过程中的精神状态
评定成绩:
教研室主任(或答辩小组组长):
(签名)
教学系意见:
系主任:
1引言
1.1研究背景
目前,助老/助残系列产品的研发己纳入国家863计划之列,可见此类产品的重要性及其对和谐社会建立的战略意义。
智能轮椅作为助老/助残系列产品之一,其智能化体现在多方面。
其中,为其提供一个自然的语音控制界面是其智能化的一个重要体现。
把语音识别算法移植到嵌入式设备中,实现轮椅的自主运动具有重要的现实意义。
对于硬件的实现,需要考虑实际系统的需求与成本,以避免资源的浪费,同时降低了成本以提高性价比。
轮椅语音识别控制系统是属于一个拥有几十个词的小词汇量的识别控制系统,系统要求上不在于大词汇量与连续语音识别,而在于准确性与稳健性,对此选择一种性价比高的SOC结构的嵌入式系统不仅可以大大减少了芯片数量,而且能够提供高集成度和相对低成本的解决方案,同时也使得系统的可靠性大为提高,还可以满足嵌入式系统对体积的要求。
台湾凌阳16位单片机SPCE061A是一款性能良好的嵌入式微处理器,具有体积小、集成度高、可靠性好且易于扩展,较强的中断处理能力,高性能价格比,功能强!
效率高的指令系统,低功耗、低电压等特点[1]。
采用SPCE061A作为机器人系统的核心的部件,利用其所具有的语音处理和DSP功能,不仅可以对机器人的语音控制,而且还可以快速地对语音信号进行处理,从而实现自然人对机器人的控制。
本文采用SPCE061A作为轮椅语音控制系统的核心,实现了轮椅的前进、后退、左拐、右拐、停止、加速、减速运动,还可以根据运动要求通过语音实现轮椅的变速运动。
基于SPCE061A的语音控制系统结构简单,性价比高,易于功能扩展和移植,具有广阔的应用前景。
1.2国内外研究现状与发展趋势
国外对智能轮椅的研究可以追溯到20世纪80年代,世界第一辆智能轮椅是英国于1986年研制的。
继英国之后,其它国家也投入大量经费开始了智能轮椅的研究,研发机构大部分为高等院校和科研机构。
当时的研发机构有:
美国麻省理工学院、不莱梅大学、德国乌尔姆大学、韩国高级科技研究所等[2~4]。
由于各个研发机构的研究内容和方法不同,所以研发的轮椅具备不同的功能。
各大研发机构中研制的功能比较齐全的一款智能轮椅是由美国麻省理工智能实验室研制的。
这款智能轮椅是在电动轮椅的基础上配备了PC机和各种传感器,此轮椅具备人机界面交互功能。
使用者可以使用操纵杆方式、菜单方式或者用户界面接口方式对轮椅进行控制。
在操纵杆方式下,用户通过控制操纵杆来控制轮椅的各种运动并且可以实现避碰;
用户界面模式下,用户可以使用鹰眼系统来驱动智能轮椅的运动。
该轮椅在国际联合会的机器人轮椅展中获得冠军,并且是唯一不需要人来指导就可以穿过门口的机器人。
我国对智能轮椅的研究晚于世界其它国家,虽然在机构的复杂性和灵活性上和国外有一定差距,但某些技术指标已经接近国外先进水平。
中科院自动化所承担了“863”智能机器人智能轮椅项目,研制出我国第一台多模态交互式智能轮椅样机,该样机采用嵌入式控制系统。
该机器人轮椅名为NLPR,具有视觉和口令导航功能并且能够与人进行语音交互,用户能够通过语音控制轮椅实现各种运动。
在智能机器人领域内,目前有一些人工智能产品可以与人进行短暂的对话,比如爱尔兰媒体实验室开发的名为“人类”的新型机器人;
以及中国科学院自动化研究所最新研制的表情机器人“童童”等。
语音识别技术在机器人控制领域的应用体现在语音控制机器人技术上,因此,语音控制机器人技术的研究与发展取决于语音识别技术的研究与发展[5]。
60年代的重要成果是提出了线性预测分析技术(LinearPrediction,LP)和动态规划算法(DynamicProgramming,DP),较好的解决了语音的特征提取和时间不等长匹配问题。
70年代,人们对语音识别技术的研究开始了飞速发展,研究重心为孤立词语音识别,并取得了突破性成果。
动态时间归整技术(DynamicTimeWarping,DTW)基本成熟,特别是提出了矢量量化(VectorQuantization,VQ)和隐马尔可夫模型(HiddenMarkovModel,HMM)理论。
实现了基于线性预测倒谱和DTW技术的特定人孤立词语音识别系统。
80年代,语音识别研究进一步走向深入,连接词和大词汇量连续语音识别成为研究热点,HMM模型和人工神经网络(ANN)算法在语音识别中成功应用。
统计模型取代模板匹配的方法成为主流的语音识别技术。
具有代表性的系统有:
1988年美国卡耐基•梅隆大学(CMU)基于VQ/HMM开发的997个词汇的非特定人连续语音识别系统SPHINX。
90年代,语音识别技术逐渐由实验室走向实用化。
许多国外大公司推出了比较成功的大词汇量、连续语音识别系统,比如IBM的ViaVoice系列、Microsoft的WhisPer、CMU的SPHINX-II,这些系统大多都采用了隐马尔可夫模型。
目前具有代表性的语音识别方法主要有特征参数匹配法、隐马尔科夫法和神经网络法[6]。
在语音识别领域,IBM公司的技术已日趋成熟。
IBM公司于1998年开发出可以识别上海话、四川话和广东话等地方口音的语音识别系统ViaVoice’98,其平均识别率可以达到90%以上,是目前最具有代表性的汉语连续语音识别系统。
我国的语音识别研究工作近年来发展很快,同时也开始从实验室逐步走向实用化。
1987年开始执行863计划,国家863《智能计算机主题》专家组为语音识别的研究立项。
从1991年开始,专家组每一两年举行一次全国性的具有较高水平的语音识别系统测试,这些都说明汉语语音识别研究已经走上了组织化的道路[7]。
目前,我国对语音识别技术的研究在某些领域已达到国际先进水平。
科大讯飞作为我国最大的智能语音技术提供商,在智能语音技术领域有着长期的研究积累,并在中文语音合成、语音识别、口语评测等多项技术上拥有国际领先的成果。
科大讯飞曾在国际英文合成大赛(BlizzardChallenge)上夺得六连冠,在2011年的“2011NIST”语种识别评测大赛上获得国际亚军,为中国科技界赢得了荣誉。
从各大公司、各研究机构的语音研究项目来看,语音识别正在向综合化方向发展。
总之,语音识别的研究正在朝深度和广度不断发展。
1.3主要设计工作
1、在熟悉智能轮椅的工作原理的基础上,进一步深入分析基于语音识别技术的智能轮椅导航控制系统的运行原理;
2、分析语音识别的基本方法,进行系统总体设计;
3、在理解凌阳16位单片机SPCE061A的工作原理后,进行智能轮椅语音导航控制系统的硬件选型与电路设计;
4、绘制语音导航控制系统的硬件电路原理图;
5、进行智能轮椅语音导航控制系统的软件设计。
2凌阳SPCE061A单片机简介
2.1概述
SPCE061A是台湾凌阳科技公司研制的一个16位架构的微控制器。
它的内核采用凌阳公司最新推出的MicrocontrollerandSignalProcessor(简称µ
’nSP™)16位微处理器芯片。
SPCE061A既具有体积小、集成度高、可靠性好的特点,又具有较强的中断处理能力、高性价比和功能强、效率高的指令系统及低功耗、低电压的特点。
因此,SPCE061A微控制器是适用于数字语音识别应用领域产品的一种最经济的选择。
2.2主要性能
▲16位µ
’nSP™微处理器;
▲工作电压(CPU)VDD为2.4-3.6V(I/O)VDDH为2.4-5.5V;
▲CPU时钟:
0.32MHz-49.152MHz;
▲内置2kSRAM;
▲内置32kFLASH;
▲可编程音频处理;
▲晶体振荡器;
▲系统处于备用状态下(时钟处于停止状态),耗电仅为2µ
A@3.6V;
▲2个16位可编程定时器/计数器(可自动预置初始计数值);
▲2个10位DAC(数-模转换)输出通道;
▲32位通用可编程输入/输出端口;
▲14个中断源可来自定时器A/B,时基,2个外部时钟源输入,键唤醒;
▲具备触键唤醒的功能;
▲使用凌阳音频编码SACM-S240方式(2.4kb/s),能容纳210秒的语音数据;
▲锁相环PLL振荡器提供系统时钟信号;
▲32768Hz实时时钟;
▲7通道10位电压模-数转换器(ADC)和单通道声音模-数转换器;
▲声音模-数转换器输入通道内置麦克风放大器和自动增益控制(AGC)功能;
▲具备串行设备接口;
▲具有低电压复位(LVR)功能和低电压监测(LVD)功能;
▲内置在线仿真电路ICE(In-CircuitEmulator)接口;
▲具有保密能力;
▲具有WatchDog功能[8]。
2.3结构
SPCE061A的结构如图2.1所示:
图2.1SPCE061A结构图
2.461板的结构
61板除了具备单片机最小系统电路外,还包括电源电路、音频电路(含MIC输入部分和DAC音频输出部分)、复位电路等,采用电池供电,方便随身携带。
61板上有调试器(PROBE)接口以及下载线(EZ_PROBE)接口,分别可接凌阳科技的在线调试器、简易下载线,配合µ
’nSPIDE,可方便地在板上实现程序的下载、在线仿真调试。
图2.2是61板(V1.6版)的实物图。
图2.261板实物图片
61板的硬件结构框图如图2.3。
图2.361板硬件结构框图
61板的硬件电路大体上可分为SPCE061A最小系统、电源电路、音频电路、ICE接口等模块,下面分别介绍61板的各部分电路。
2.5SPCE061A最小系统
SPCE061A最小系统中,包括SPCE061A芯片及其外围的基本模块,其中外围的基本模块有:
晶振输入模块(OSC)、锁相环外围电路(PLL)、复位电路(RESET)、指示灯(LED)等,如图2.4所示。
图2.4SPCE061A最小系统
(1)电源电路
图2.5是电源部分的电路,由电池盒提供的4.5V直流电压经过SPY0029后产生3.3V给整个系统供电。
SPY0029是凌阳公司设计的电压调整IC,采用CMOS工艺,具有静态电流低、驱动能力强、线性调整出色等特点。
图中的VDDH3为SPCE061A的I/O电平参考,如果该点接SPCE061A(PLCC84封装,下面的介绍中当出现SPCE061A的引脚描述时,均指此封装的芯片)的51脚,可使I/O输出高电平为3.3V;
VDDP为PLL锁相环电源,接SPCE061A的7脚;
VDD和VDDA分别为数字电源与模拟电源,分别接SPCE061A的15脚和36脚;
AVSS1是模拟地,接SPCE061A的24脚;
VSS是数字地,接SPCE061A的38脚;
AVSS2接音频输出电路的AVSS2[9]。
图2.5电源电路图
(2)音频电路
音频电路由音频输出和音频输入两部分组成。
图2.6是音频输出电路图。
SPCE061A内置2路10位精度的DAC,只需要外接功放电路即可完成语音的播放。
图中的SPY0030是凌阳的一款音频放大芯片,可以工作在2.4-6V范围内,最大输出功率可达700mW[9]。
图2.6音频输出电路
SPCE061A芯片中已经集成了音频输入专用ADC以及AGC放大电路,因此芯片外部的电路比较简单,图2.7是61板的音频输入电路模块。
图2.7音频输入模块
(3)ICE接口电路
SPCE061A芯片内部集成了ICE(在线仿真)接口,PC机通过PROBE(在线调试器)或EZ_PROBE(简易下载线)与61板相连,就可以方便地完成程序的下载、调试等。
61板为PROBE和EZ_PROBE各自提供了一组接口,可通过S5跳线来选择使用的接口类型。
ICE接口部分电路如图2.8所示。
图2.8ICE接口电路
2.6轮椅语音控制系统的设计方案
本设计中语音识别系统为小词量孤立词特定人识别系统,由特定人进行语音训练,系统只对训练人的语音命令敏感,语音命令由一条触发名称和四条语音命令构成。
在命令识别完毕后发出使轮椅动作的指令。
语音控制轮椅的主要功能:
(1)可以通过简单的I/O操作实现轮椅的前进、后退、左转、右转功能;
(2)配合SPCE061A语音处理的特点,利用系统的语音播放和语音识别资源,实现语音控制的功能;
(3)可以在行走过程中声控改变轮椅运动状态;
(4)在超出语音控制范围时能够自动停车。
总体设计思路:
整个系统由一片凌阳SPCE061A单片机作为核心,轮椅控制板和车体为周边器件组成,控制板安装在轮椅车体上。
通过软件编程实现轮椅的上述功能。
3轮椅语音控制系统的硬件设计
3.1系统设计方案
系统组成主要包括以下三部分:
SPCE061A精简开发板、语音轮椅控制电路板、车体部分。
如图3.1所示。
图中的语音输入部分MIC_IN、按键输入KEY、声音输出部分的功率放大环节等已经做到了61板上。
在电机的驱动方面,采用全桥驱动技术,利用四个I/O端口分为两组分别实现两个电机的正转、反转和停三态运行,系统硬件组成框图如图3.2。
图3.1系统结构图
图3.2系统硬件组成框图
3.2系统控制方案
轮椅的运动控制采用语音控制和中断定时控制相结合,通过语音触发轮椅动作,轮椅动作之后,随时可以通过语音指令改变轮椅的运动状态。
在每一次动作触发的同时启动定时器,如果轮椅由于某些原因不能正常的接收语音指令,则只要定时时间到,中断服务程序会发出指令让轮椅停下来。
3.3轮椅介绍
语音控制轮椅为四轮结构,其中前面两个车轮由前轮电机控制,在连杆和支点作用下控制前轮左右摆动,来调节轮椅的前进方向。
在自然状态下,前轮在弹簧作用下保持中间位置。
后面两个车轮由后轮电机驱动,为整个轮椅提供动力。
所以又称前面的轮子为方向轮,后面的两个轮子为驱动轮,如图3.3所示。
图3.3车体侧视图
图3.4车体顶视图
(1)轮椅的行走原理
前进:
由轮椅的结构分析,在自然状态下,前轮在弹簧作用下保持中间状态,这时只要后轮电机正转轮椅就会前进。
如图3.5所示:
图3.5前进示意图
倒车:
倒车动作和前进动作刚好相反,前轮电机仍然保持中间状态,后轮电机反转,轮椅就会向后运动,如图3.6所示:
图3.6倒车示意图
左转:
前轮电机逆时针旋转(规定为正转),后轮电机正转,这时轮椅就会在前后轮共同作用下朝左侧前进,如图3.7所示;
图3.7左转示意图
右转:
前轮电机反转,后轮电机正转,这时轮椅就是会在前后轮共同作用下朝右侧前进,如图3.8所示。
图3.8右转示意图
3.4控制板介绍
控制板主要包括:
接口电路、电源电路和两路电机的驱动电路,控制板原理图如图3.9所示。
图3.9控制板原理图
(1)接口电路:
接口电路负责将61板的I/O接口信号传送给控制电路板,I/O信号主要为控制电机需要的IOB8-IOB11这四路信号,同时为了方便后续的开发和完善,预留了IOB12-IOB15以及IOA8-IOA15接口,可以在这些接口上添加一些传感器。
(2)电源电路:
整个轮椅有4个电源信号:
电池电源,控制板工作电源,61板工作电源,61板的I/O输出电源。
系统供电由电池提供,控制板直接采用电池供电(VCC),然后经二极管D1后产生61板电源(VCC-61),通过61板的VIO跳线产生61板的端口电源(V1)。
二极管D1作用:
1)降压,4节电池提供的电压VCC最大可达到6V(模拟实验采用4节电池,实际使用时视情况使用更大电源和电机),D1可有效地降压。
2)保护,D1可以防止电源接反烧坏61板。
(3)两路电机的驱动电路:
1)动力电机驱动电路:
动力驱动由后轮驱动实现,负责轮椅的直线方向运动,包括前进和后退,后轮驱动电路是一个全桥驱动电路,如图3.10所示:
Q1、Q2、Q3、Q4四个三极管组成四个桥臂,Q1和Q4组成一组,Q2和Q3组成一组,Q5控制Q2、Q3的导通与关断,Q6控制Q1和Q4的导通与关断,而Q5、Q6由IOB9和IOB8控制,这样就可以通过IOB8和IOB9控制四个桥臂的导通与关断控制后轮电机的运行状态,使之正转反转或者停转,进而控制轮椅的前进和后退。
图3.10后轮电机驱动电路
当IOB8为高电平、IOB9为低电平时Q1和Q4导通,Q2和Q3截止,后轮电机正转,轮椅前进;
反之当IOB8为低电平、IOB9为高电平时Q1和Q4截止,Q2和Q3导通,后轮电机反转,轮椅倒退;
而当IOB8、IOB9同为低电平时Q1、Q2、Q3和Q4都截止,后轮电机停转,轮椅停止运动。
注意:
IOB8和IOB9不能同时置高电平,这样会造成后轮驱动全桥短路现象。
2)方向电机控制电路:
方向控制由前轮驱动实现,包括左转和右转,前轮驱动电路也是一个全桥驱动电路,如图3.11所示。
Q7、Q8、Q9、Q10四个三极管组成四个桥臂,Q7和Q10组成一组,Q8和Q9组成一组,Q11控制Q8、Q9的导通与关断,Q12