基于语音识别的家居智能监控系统毕业设计说明书.docx
《基于语音识别的家居智能监控系统毕业设计说明书.docx》由会员分享,可在线阅读,更多相关《基于语音识别的家居智能监控系统毕业设计说明书.docx(93页珍藏版)》请在冰豆网上搜索。
基于语音识别的家居智能监控系统毕业设计说明书
内蒙古科技大学
本科生毕业设计说明书(毕业论文)
题目:
基于语音识别的家居智能监控系统
基于语音识别的家居智能监控系统
摘要
智能家居系统大体而言可分为高层的信息娱乐网络和底层的数据采集与网络控制,在底层以微控制器为核心作为智能家居网络结点是目前智能家居的主要实现方式,语音识别技术在我国的研究成果也不是很高,但是用语音识别技术来与家居智能控制相结合是非常创新的。
本设计是采用AT89C52单片机为核心控制器的智能家居监控系统,系统通过无线nrf905作为信息传输媒介,将语音识别软件收到的具体指令发送至现场对单片机进行控制,从而控制家居的动作;同时现场单片机将数据通过无线发送至主控单片机,通过PC界面实时监控家居各模块的运行状态。
该系统的功能模块分为:
语音控制窗帘模块、温度检测模块、火焰检测模块和防盗报警模块。
通过C#编程,在MicrosoftSpeechSDK的基础上实现对家具的智能监控,在PC机界面上直观的看到家居所有情况。
关键字:
单片机;语音识别;nrf905;温度检测;防盗报警
Speechrecognition-basedsmarthomemonitoringsystem
Abstaract
Generallyspeakingthesmarthomesystemcanbedividedintohigh-levelinformationandentertainmentnetwork,theunderlyingdatacollectionandnetworkcontrolinthebottomtothemicrocontrollerasthecoreasasmarthomenetworknode,thisisthemainachievementofsmarthomeway,thespeechrecognitiontechnologyinourresearchisnotveryhigh,butthevoicerecognitiontechnologytothehomeintelligentcombinationofthecontrolisveryinnovative.
ThedesignisusingAT89S52MCUcorecontrollerintelligenthomemonitoringsystem,thesystemthroughwirelessnrf905asinformationtransmissionmedium,thatspecificinstructionsreceivedbythevoicerecognitionsoftwareissenttothescenetocontroltheMCUtocontroltheactionsofhome;atthesametimethesceneSCMdatathroughthewirelesssenttothehostmicrocontroller,real-timemonitoringviaaPCinterfacehomerunofthemodulestate.
Thefunctionalmodulesofthesystemisdividedinto,thevoicecontrolthecurtainsmoduletemperaturedetectionmodule,theflamedetectionmodule,andburglaralarmmodule.OnthebasisoftheMicrosoftSpeechSDK,C#Programming,intelligentmonitoringofthefurnitureintuitiveinterfaceofthePC,seethehomeinallcases.
Keywords:
SCM;speechrecognition;nrf905;temperaturedetection;burglaralarm
第一章引言
智能家居概念的起源甚早,但一直未有具体的建筑案例出现,直到1984年美国联合科技公司(UnitedTechno1ogiesBuildingSystem)将建筑设备信息化、整合化概念应用于美国康乃迪克州(Conneticut)哈特佛市(Hartford)的CityPlaceBuilding时,才出现了首栋的智能型建筑,从此也揭开了全世界争相建造智能家居的序幕。
一.1智能家居概述
20世纪80年代初,随着大量采用电子技术的家用电器面市,住宅电子化出现。
80年代中期,将家用电器、通信设备与安全防范设备各自独立的功能综合为一体后,形成了HomeAutomation住宅自动化概念。
80年代末,通信与信息技术的发展,出现了通过总线技术对住宅中各种通信、家电、安防设备进行监控与管理的商用系统,这在美国称为SmartHome,也就是现在智能家居的原型。
最终完整的定义为:
智能家居(smarthome)是利用先进的电子技术、网络通讯技术和综合布线技术等,将与家居生活有关的各种子系统有机地结合在一起的系统。
智能家居不仅具有传统的居住功能,并且通过在家中建立的通讯网络,实现对家庭中的各种与信息相关的设备、家用电器及保安装置,进行集中的或远程的监控和管理,使人们的生活更加安全、便利、舒适和符合环保。
目前智能家居系统总体包括照明控制系统、家居安防系统、环境控制系统、电器控制系统、电话远程控制系统、智能化协同工作系统等。
其目标就是:
“将家庭中各种与信息相关的通讯设备,家用电器和家庭保安装置通过家庭总线技术(HBS)连接到一个家庭智能化系统上进行集中的或异地的监视、控制和家庭事务性管理,并保持这些家庭设施与住宅环境的和谐与协调”。
智能家居主要包括以下内容:
(1)家居布线系统:
家庭智能化的实现,第一步就要进行家庭布线家居布线系统把电话、有线电视、电脑网络、影音系统、家庭自动化控制系统的布线统一规划、布局、集中管理,通过家居综合布线可以实现自动化的控制。
(2)家居安防系统:
家居安防系统可以有效的利用技防手段来实现安全防范。
家居安防系统主要指防盗报警。
(3)家庭自动化系统:
家庭自动化的主体是家电、照明等电气设备的控制。
家庭自动化系统能够通过集中或者分布式控制家庭内部照明或者家电,家居自动化系统是将来智能家居的主要发展方向。
一.2智能家居的发展现状
在我国智能家居引起越来越多的关注,随着人民生活水平的提高,人民对于居住环境智能化、舒适程度等要求会越来越高,这给智能家居的发展提供了很大的市场空间。
由于我国的居住模式和发达国家存在很大的差别,我国人口众多,城市多以密集型住宅为主,这造成了国内外在智能家居的发展和技术上存在了很大的差别。
国内智能化更多的注重于整个小区智能化的建设。
最早从做对讲开始,并且逐渐由过去的非可视对讲过渡到目前的以黑白可视对讲为主流,同时一些集成了安防功能、抄表功能、短消息等功能的对讲产品出现并在一些地区应用。
由于可视对讲的发展迅速,一些厂家的宣传,给人造成了一种错误的观念,小区只要做了可视对讲或者综合布线就称的上智能化小区。
随着对智能家居的认识越来越深入,人们逐渐意识到智能化的真正主体是家居的智能化,更多的体现在家庭内部自动化。
所以上个世纪90年代后期,一些企业开始引入国外的智能家居技术和产品在国内推广,还有一些大的集团公司也看好该领域,通过各种途径介入,促进整个行业迅速发展。
智能家居是IT技术(特别是计算机技术)、网络技术、控制技术向传统家电产业渗透发展的必然结果。
由社会背景之层面来看,近年来信息化的高度发展,通信的自由化与高层次化,业务量的急速增加与人类对工作环境的安全性、舒适性、效率性要求的提高,造成家居智能化的需求大为增加,在科学技术方面,由于计算机控制技术的发展与电子信息通信技术的成长,也促成了智能家居的诞生。
智能家居是一个多功能的技术系统,国内目前的产品比较杂乱,但从实现控制的方式来看基本上采用总线制、电力线载波、无线等方式,在网络连接方面基本上采用总线制联网、电话联网或者通过以太网方式来实现。
国内智能家居基本由以下几个方向演变而来:
①传统的可视对讲、家庭防盗产品生产厂家也有一定的电子开发、生产等经验,在其原有产品基础上增加控制功能和其他一些功能,来实现家庭自动化,这些公司有一定的工程、设计院等关系和网络,并利用原对讲产品市场来推广产品。
②传统的家电企业、IT企业看好该领域,这些企业结合其在家电控制领域、IT领域的优势开发出智能家居的产品,能更好地和家电结合在一起,他们利用自己的渠道优势和市场影响力,积累多年的管理经验、生产经验和良好的售后服务、企业信誉来打开市场。
一.3智能家居的功能及意义
智能家居(SmartHome)频繁出现在各大媒体上,成了人们耳熟能详的词汇。
目前关于智能家居的称谓多种多样,诸如:
电子家庭(ElectronicHome)、e-Home、数字家园(Digitalfamily)、家庭自动化(HomeAutomation)、家庭网络(Homenet/NetworksforHome)、网络家居(NetworkHome)、智能化家庭(Inte1ligenthome)等等几十种,尽管名称是五花八门,但它们的含义和所要完成的功能大体是相同的。
目前通常把智能家居被定义为利用电脑、网络和综合布线技术,通过家庭信息管理平台将与家居生活有关的各种子系统有机地结合的一个系统。
也就是说,首先,它们都要在一个家居中建立一个通讯网络,为家庭信息提供必要的通路,在家庭网络的操作系统的控制下,通过相应的硬件和执行机构,实现对所有家庭网络上的家电和设备的控制和监测。
其次,它们都要通过一定的媒介平台,构成与外界的通讯通道,以实现与家庭以外的世界沟信息,满足远程控制/监测和交换信息的需求。
最后,它们的最终目的都是为满足人们对安全、舒适、方便和符合绿色环境保护的需求。
一.4SpeechSDK简介
微软的SpeechSDK是是微软提供的软件开发包,其中包含了语音识别和合成引擎相关组件、帮助文档和例程,它是—个语音识别和合成的二次开发平台。
我们可以利用这个平台,在自己开发的软件里嵌入语音识别和合成功能,从而使用户可以用声音来代替鼠标和键盘完成部分操作,例如:
文字输入、菜单控制等,实现真正的“人机对话”。
SpeechSDK是基于COM的视窗操作系统开发工具包。
这个SDK中含有语音应用程序接口(SAPI),微软连续语音识别引擎(MCSR)以及串联语音合成(又称文本到语音)引擎(TTS)等等。
图1.1SAPI框架图
SAPI中还包括对于低层控制和高度适应性的直接语音管理,训练向导,事件,语法,编译,资源,语音识别管理以及文本到语音管理,其结构如图1.1所示。
在图1.1中,语音框架主要靠SAPI运行来实现应用程序与语音引擎之间的协作,而SAPI提供各种接口实现不同的语音功能,SAPI使得应用程序和语音引擎之间高度紧密的结合,实时处理各种语音引擎在底层工作中的细节。
本系统会同时使用到SPEECHSDK的语音识别引擎和TTS合成引擎.因此,对这两个引擎的相关控制命令介绍如下。
一.4.1语音识别引擎接口
(1)识别上下文(1spRecoContext)接口:
是主要的语音识别程序接口,主要用于发送和接收与语音识别相关的消息通知,创建语法规则对象。
(2)语音识别引擎(1spReeognizer)接口:
用于创建语音识别引擎的实例。
SAPI拥有两种不同的语音识别引擎类型,一个是共享的语音识别引擎(SharedRecognizer)。
由于它可以与其他语音识别应用程序共享其程序资源,所以在大多数场合中被推荐使用。
需要建立一个采用共享语音识别引擎的识别环境(IspRecoContext)。
一个是独占(1nProcRecognizer)的引擎,它只能由创建的应用程序使用,而共享引擎可以提供多个应用程序使用。
(3)语法规则(IspRecoGrammar)接口:
定义引擎需要识别的具体内容,创建、载入和激活识别用的语法规则。
(4)识别结果(IspVoice)接口:
用于获取识别的结果,包括识别的文字,识别的语法规则等。
一.4.2语音合成引擎接口
语音合成(ISpVoice)接口:
主要功能是实现文本到语音的转换。
它的作用如使用IspVoice:
:
Speak来从文本数据生成语音,从而使电脑会说话。
当处于异步工作时,可以使用IspVoiee:
:
CetStatus来获得发音状态及文本位置等。
在接口中,有许多成员函数,通过这些成员函数可以实现对发音频率、发音音量等合成属性进行调整。
在C#中,我们通过实现ISpVoice接口的SpVoice类来实现语音合成。
具体步骤如下:
(1)首先创建SpVoice类的对象;
(2)利用对象成员函数设置语音属性,如果不设置,则按默认方式处理;
(3)调用对象成员函数speak函数来朗读指定文本Speak函数需要两个参数,第一个参数指明需要朗读的文本。
第二个参数指明发音方式。
一.5语音识别的发展历史及应用领域
一.5.1国外研究历史及现状
语音识别的研究工作可以追溯到20世纪50年代AT&T贝尔实验室的Audry系统,它是第一个可以识别十个英文数字的语音识别系统。
但真正取得实质性进展,并将其作为一个重要的课题开展研究则是在60年代末70年代初。
这首先是因为计算机技术的发展为语音识别的实现提供了硬件和软件的可能,更重要的是语音信号线性预测编码(LPC)技术和动态时间规整(DTW)技术的提出,有效的解决了语音信号的特征提取和不等长匹配问题。
这一时期的语音识别主要基于模板匹配原理,研究的领域局限在特定人,小词汇表的孤立词识别,实现了基于线性预测倒谱和DTW技术的特定人孤立词语音识别系统;同时提出了矢量量化(VQ)和隐马尔可夫模型(HMM)理论。
随着应用领域的扩大,小词汇表、特定人、孤立词等这些对语音识别的约束条件需要放宽,与此同时也带来了许多新的问题:
第一,词汇表的扩大使得模板的选取和建立发生困难;第二,连续语音中,各个音素、音节以及词之间没有明显的边界,各个发音单位存在受上下文强烈影响的协同发音(Co-articulation)现象;第三,非特定人识别时,不同的人说相同的话相应的声学特征有很大的差异,即使相同的人在不同的时间、生理、心理状态下,说同样内容的话也会有很大的差异;第四,识别的语音中有背景噪声或其他干扰。
因此原有的模板匹配方法已不再适用。
实验室语音识别研究的巨大突破产生于20世纪80年代末:
人们终于在实验室突破了大词汇量、连续语音和非特定人这三大障碍,第一次把这三个特性都集成在一个系统中,比较典型的是卡耐基梅隆大学(CarnegieMellonUniversity)的Sphinx系统,它是第一个高性能的非特定人、大词汇量连续语音识别系统。
这一时期,语音识别研究进一步走向深入,其显著特征是HMM模型和人工神经元网络(ANN)在语音识别中的成功应用。
HMM模型的广泛应用应归功于AT&TBell实验室Rabiner等科学家的努力,他们把原本艰涩的HMM纯数学模型工程化,从而为更多研究者了解和认识,从而使统计方法成为了语音识别技术的主流。
统计方法将研究者的视线从微观转向宏观,不再刻意追求语音特征的细化,而是更多地从整体平均(统计)的角度来建立最佳的语音识别系统。
在声学模型方面,以Markov链为基础的语音序列建模方法HMM(隐式Markov链)比较有效地解决了语音信号短时稳定、长时时变的特性,并且能根据一些基本建模单元构造成连续语音的句子模型,达到了比较高的建模精度和建模灵活性。
在语言层面上,通过统计真实大规模语料的词之间同现概率即N元统计模型来区分识别带来的模糊音和同音词。
另外,人工神经网络方法、基于文法规则的语言处理机制等也在语音识别中得到了应用。
20世纪90年代前期,许多著名的大公司如IBM、苹果、AT&T和NTT都对语音识别系统的实用化研究投以巨资。
语音识别技术有一个很好的评估机制,那就是识别的准确率,而这项指标在20世纪90年代中后期实验室研究中得到了不断的提高。
比较有代表性的系统有:
IBM公司推出的ViaVoice和DragonSystem公司的NaturallySpeaking,Nuance公司的NuanceVoicePlatform语音平台,Microsoft的Whisper,Sun的VoiceTone等。
其中IBM公司于1997年开发出汉语ViaVoice语音识别系统,次年又开发出可以识别上海话、广东话和四川话等地方口音的语音识别系统ViaVoice98。
它带有一个32000词的基本词汇表,可以扩展到65000词,还包括办公常用词条,具有纠错机制,其平均识别率可以达到95%。
该系统对新闻语音识别具有较高的精度,是目前具有代表性的汉语连续语音识别系统。
一.5.2国内研究历史及现状
我国语音识别研究工作起步于五十年代,但近年来发展很快。
研究水平也从实验室逐步走向实用。
从1987年开始执行国家863计划后,国家863智能计算机专家组为语音识别技术研究专门立项,每两年滚动一次。
我国语音识别技术的研究水平已经基本上与国外同步,在汉语语音识别技术上还有自己的特点与优势,并达到国际先进水平。
中科院自动化所、声学所、清华大学、北京大学、哈尔滨工业大学、上海交通大学、中国科技大学、北京邮电大学、华中科技大学等科研机构都有实验室进行过语音识别方面的研究,其中具有代表性的研究单位为清华大学电子工程系与中科院自动化研究所模式识别国家重点实验室。
清华大学电子工程系语音技术与专用芯片设计课题组,研发的非特定人汉语数码串连续语音识别系统的识别精度,达到94.8%(不定长数字串)和96.8%(定长数字串)。
在有5%的拒识率情况下,系统识别率可以达到96.9%(不定长数字串)和98.7%(定长数字串),这是目前国际最好的识别结果之一,其性能已经接近实用水平。
研发的5000词邮包校核非特定人连续语音识别系统的识别率达到98.73%,前三选识别率达99.96%;并且可以识别普通话与四川话两种语言,达到实用要求。
中科院自动化所及其所属模式科技(Pattek)公司2002年发布了他们共同推出的面向不同计算平台和应用的天语中文语音系列产品——PattekASR,结束了中文语音识别产品自1998年以来一直由国外公司垄断的历史。
第二章智能家居监控系统的方案设计
二.1系统实现过程分析
在此设计中,主要体现了无线收发一体化,即无线在始终的进行着收和发,这样能更好的实现实时性。
主控通过AT89C52单片机做控制,将数据通过串口发送至电脑上,通过上位机界面显示,在微软公司的语音识别包的基础上,以电脑为载体,可以通过语音来控制家中电器的工作,同时了解家中一切是否正常。
这种方案的最大好处在于能够帮助一些行动不便的老人或者一些残疾人,在不需要走动的情况下了解家中安全状态,且可通过说话来直接控制家中电器的工作。
如图2.1所示。
图2.1系统整体结构框图
二.2单片机最小系统板设计
本设计采用自己设计的最小系统开发板,分为四个模块,主控模块、现场控制模块、通信模块、电源模块。
下面分别介绍各个模块。
二.2.1主控模块
该系统采用的是Atmel公司生产的AT89C52单片机为主控器。
AT89C52是一个低电压,高性能CMOS8位单片机,片内含8kbytes的可反复擦写的Flash只读程序存储器和256bytes的随机存取数据存储器(RAM),器件采用ATMEL公司的高密度、非易失性存储技术生产,兼容标准MCS-51指令系统,片内置通用8位中央处理器和Flash存储单元,AT89C52单片机在电子行业中有着广泛的应用。
在单片机的引脚外围固定的引脚,如VCC(40),GND(20)已经正确固定到电源和地上。
X1(18),X2(19)是接晶振的引脚已经外接到11.0592MHZ和30PF的电容。
RST(9)是单片机的复位引脚,通过RC回路,作为单片机的上电复位。
作为P3口的第二功能端口,P3.0(10),P3.1(11)为单片机的通信引脚,和MAX232芯片连接。
方便在下载程序时,只要上电复位即可完成下载的硬件操作。
另外,为了提高P0口的驱动能力,在P0口的各引脚上接了上拉电阻5.1K到电源Vcc=5V。
采用一片MAX232,为RS232与TTL电平的转换,使得可以方面使用电脑的COM口,对单片机进行程序的烧录。
图2.2主控模块晶振电路
图2.3复位电路
另外,通过单片机驱动无线模块,无线模块在数据传输过程中起到了至关重要的作用,先简单介绍下主控单片机原理图,如果想让单片机正常工作,最重要的是晶振电路和复位电路了,其原理如图2.2和2.3所示。
二.2.2现场控制模块
这个控制模块也是以AT89C52为主体,通过读取无线接收到的数据或者通过将数据通过无线发送至主控,同时通过12864液晶显示器显示现场得到的数据。
AT89C52主体电路如图2.4所示。
图2.4AT89C52主体电路
12864是128*64点阵液晶模块的点阵数简称,它具有屏显成本相对较低,适用于各类仪器,小型设备的显示领域。
是比较常用的显示器,基本电路图如图2.5所示。
图2.512864液晶显示原理图
为了测试按键程序,我设计了1个按键,已备使用,电路图如图2.6所示。
图2.6按键原理图
该模块还设计了一个蜂鸣器电路,蜂鸣器是用三极管8550来驱动的,如果单片机的输出信号为低电平给三极管的基极,三极管就会道通,蜂鸣器两端分别接到了高低电平,蜂鸣器响。
电路图如图2.7所示。
图2.7蜂鸣器原理图
二.2.3无线通信模块
通信模块由无线nrf905来实现,本设计中采用的无线传输距离由资料数据显示为两百米,完全能够实现在家中的信息传递。
设计电路如图2.8所示。
图2.8无线模块电路
二.2.4电源模块
电源模块是为了整个系统版供电而设计的,此模块的设计采用的是外部直流电源供电,输出电压为5V,电流为1A。
图2.9电源模块原理图
最关键的是无线模块的供电要求电压为3.3V左右,因此又设计了一个无线供电模块,分别如图2.9和2.10所示。
图2.10无线供电模块
二.2.5串口通信
在单片机近距离通信中,用的最广的是串口通信,以MAX232为核心,通过单片机的程序驱动,从而实现单片机与上位机的通信,同时为了能够实现更远距离的通信,也可以选用MAX485,但必须用到电平转换。
具体MAX232的串口通信电路如图2.11所示。
图2.11串口通信电路图
二.3智能家居监控系统模块化设计
所谓的模块化设计,简单地说就是将产品的某些要素组合在一起,构成一个具有特定功能的子系统,将这个子系统作为通用性的模块与其他产品要素进行多种组合,构成新的系统。
根据模块化设计思路和整个系统所要实现的功能,可以讲此系统分为五大模块来设计:
(1)门禁模块
主控器采用矩阵键盘,矩阵键盘有按键按下时,被按下按键处的行线和列线被接通,使得开关之间接通,并且在液晶显示器上显示相应的数值,当输入密码正确时,主控器发出信号使得绿灯亮,并且控制电机转动,打开门,输入密码错误时,控制器输出为高电平,红灯点亮,电机不转动,再次输入新密码,当输入密码超