03数字语音自动录放系统的设计.docx

上传人:b****6 文档编号:6988615 上传时间:2023-01-15 格式:DOCX 页数:44 大小:65.19KB
下载 相关 举报
03数字语音自动录放系统的设计.docx_第1页
第1页 / 共44页
03数字语音自动录放系统的设计.docx_第2页
第2页 / 共44页
03数字语音自动录放系统的设计.docx_第3页
第3页 / 共44页
03数字语音自动录放系统的设计.docx_第4页
第4页 / 共44页
03数字语音自动录放系统的设计.docx_第5页
第5页 / 共44页
点击查看更多>>
下载资源
资源描述

03数字语音自动录放系统的设计.docx

《03数字语音自动录放系统的设计.docx》由会员分享,可在线阅读,更多相关《03数字语音自动录放系统的设计.docx(44页珍藏版)》请在冰豆网上搜索。

03数字语音自动录放系统的设计.docx

03数字语音自动录放系统的设计

数字语音自动录放系统的设计

摘要

数字语音自动录放系统是用来完成自动应答、信息查询和语音留言等功能的通信类产品。

它的出现是伴随着电话机的推广和普及而来的。

从早期的基于磁带录音机的答录器到后来基于语音合成和数字存储的数字语音自动录放系统,可以笼统的划分为两代产品,它们各有鲜明的优缺点。

第一代磁带机的答录器结构简单,可以存储很长时间的语音信息。

但由于是使用需要大量机械装置的磁带录音机,它的机械故障率较高,磨损严重,音质也不佳。

并且由于磁带属于顺序存储介质,它的信息定位非常困难,因此功能较为单一,一般来说只能作为留言机来使用。

第二代数字语音自动录放系统是基于语音合成技术和数字存储方式的,这种数字语音自动录放系统较磁带答录器的性能有很大的提高,语音音质好,信息定位方便,可以使用于更多的用途。

但由于采用了大量的数/模、模/数转换,导致语音的自然度有所损失,同时语音存储长度也不够理想,不能满足长时间录放音的需要。

基于此,本文提出了一种新型的数字语音自动录放系统的设计方法,它采用单片机作为核心控制单元,T6668语音芯片作为语音合成及存储器件。

这种数字语音自动录放系统的语音存储不需要A/D、D/A转换器件,因此音质十分自然。

此外还具有体积小,录放时间长,使用范围广等许多优点。

关键词 数字语音自动录放系统;T6668语音芯片;AT89C51

Thedesignofautomaticalrecordandanswersystemofdigitalvoice

Abstract

Theautomaticalrecordandanswersystemofdigitalvoiceisakindofdevicethatcanbeusedinautomaticanswererormessagequerysystemsortelephoneleavewordmachine.Itisoftenusedaccompaniedwithatelephone.Theearlierequipmentisbasedonataperecorder.Soitcanstorelongtimevoicemessage,butthiskindofdeviceismadeofmanymechanicalequipments,whichoftenmakeitintotroubles.Andwhenithasbeenusedformanytimes,thequalityofvoicewouldbebad.Becausethetaperecorderisasequentialstoragedevice,theorientationofmessageisverydifficult.Theotherkindofdeviceisbasedonvoicesyntheticchipanddigitalstoragechip.Comparingtotheearlierdevice,itisabigimprovement.Ithasbettervoicequality,andtheorientationofmessageisveryfast.ButitusesmanyD/AandA/Dconverters,sosomenaturalqualitieshavelost.Anditsvolumeofstorageistoosmall.

Inthispaper,wesupplyanewmethodtodesigntheautomaticalrecordandanswersystemofdigitalvoice.Itusesamicro-controllerunitasthecentercontroller,andT6668voicechipasthevoicesyntheticchipandstoragechip.Thiskindofdevicehasgoodvoicequalityandbigstoragevolume.Itcanbeusedinmanyways.

Keywordstheautomaticalrecordandanswersystemofdigitalvoice;T6668voicechip;AT89C51

摘要……I

AbstractII

第1章绪论1

1.1课题背景及意义1

1.2语音合成技术在人机交互中的重要地位1

1.3语音合成技术的发展2

1.4语音合成技术的应用3

1.5课题的研究内容与方法4

第2章语音合成应用及其综合应用系统评述5

2.1概述5

2.2语音合成的各种方法5

2.3具有合成语音输出系统的构成6

2.4常用语音合成技术在典型芯片中的应用6

2.4.1TC8830AF6

2.4.2TMS52207

2.4.3T66687

2.5语音信号存储器7

2.6合成语音输出的综合应用系统评述9

第3章T6668语音芯片介绍及与单片机接口技术10

3.1系统特性10

3.2语音合成芯片T6668简介10

3.2.1常见语音芯片比较10

3.2.2芯片特点11

3.2.3T6868应用的局限性12

3.3T6668的引脚功能及内部结构介绍12

3.3.1T6668的引脚功能12

3.3.2T6668的内部结构14

3.4探索T6668索引区的秘密16

3.4.1T6668的索引区16

3.4.2索引区内记录起止地址的方法17

3.5T6668主要工作方式18

3.5.1手动操作模式18

3.5.2CPU操作模式18

3.5.3T6668能执行的九条命令18

3.5.4状态寄存器19

3.5.5CPU操作模式下控制的两种模式20

3.6AT89C51单片机介绍20

3.6.1AT89C51单片机综合特性介绍21

3.6.2AT89C51单片机引脚介绍22

3.7T6668与微处理器的接口技术25

3.7.1串一并转换接口25

3.7.2中断方式接口26

第4章录音电话的硬件结构及软件设计27

4.1电话网中的有关信号27

4.2系统特性27

4.3录音电话的硬件结构30

4.3.1铃流、忙音的检测和摘机模似电路30

4.3.2T6668语音处理芯片与89C51的连接30

4.3.3T6668与DRAM的连接30

4.3.4模拟量I/O(输入/输出)31

4.4录音电话的监控程序31

4.4.1上电复位程序(主程序)32

4.4.2命令发送子程序33

4.4.3铃流检测子程序33

4.4.4留言录入和发送子程序34

4.4.5忙音检测36

4.4.6录音程序36

结论39

致谢40

参考文献41

附录A42

附录B45

第1章绪论

1.1课题背景及意义

语音合成技术及其产品的应用,在我们的日常生活中扮演着越来越重要的角色。

在这种前提下,我们充分研究了当前国内外数字语音自动录放系统产品的现状,提出了一种新的语音合成技术与单片机综合应用系统。

数字语音自动录放系统是语音合成技术在通信领域的应用。

它可以作为小型程控电话交换机的外围设备,对用户的操作进行语音提示,达到与用户交互的目的。

也可以用作信息查询系统,如天气预报自动查询台。

或者是作为一部高质量的留言电话来使用。

当前的数字语音自动录放系统主要有两种设计方式:

一种是以磁带作为存储介质,它的主要部件是一个磁带录音机,辅之以少量的外围电路。

这种答录器结构简单、价格低廉,技术上十分成熟,国内外很早就有产品问世。

但是它的缺点是十分突出的。

这种答录器的录放音只能是顺序的进行的,当利用菜单来跳转时,需要很长的定位时间。

而且,由于磁带录音机使用了大量的机械装置,使得机械故障率较高。

此外,磁带录音音质较差,磁带、磁头磨损严重等问题也是不容忽视的。

另外一种设计是用数字存储器作为存储介质,配合专用DSP芯片来实现的。

DSP是从微处理器的基础上发展起来的一种完成密集的数字信号处理算法的高速微处理器和微计算器。

数字存储器使用较多的为256k的动态DRAM。

在8K比特的抽样频率下,8片41256的DRAM能存储大约4分钟的语音信息。

近年来,许多电话厂家纷纷推出了带语音存储功能的电话机,他们所采用的设计就是这种结构。

这种设计具有以下一些优点:

使用软件完成语音压缩与解压缩,电路较简单;数字存储器DRAM为非顺序存储介质,无须长时间的定位,寻址速度非常快;存储芯片的使用寿命很长,而且也不会因长时间使用后,存储的语音音质降低。

但是这种设计也有明显的局限性。

基于此,我们的设想和目的是:

利用单片机技术,采用带有存储介质的语音合成芯片,研制出一种与公用电话交换网(PSTN)完全兼容的数字语音自动录放系统。

这种数字语音自动录放系统有以下特点:

价格便宜、使用方便、功能强大,存储容量大并且易于扩展,使用范围广,具有较高的兼容性和可靠性等。

目前,在国内外基于上述思想的设计思路,还很少见之与报道。

因此,我们认为,这一产品的研制和开发将具有非常重要的现实意义。

1.2语音合成技术在人机交互中的重要地位

人类进入现代社会,依靠各种机电设备从事劳动、生产和科学研究。

当人们操纵这些机电系统时,就自然而然地出现了人与机电系统间的信息交流,即系统不断报告自己的运行状态和结果,而人们根据这些状态、结果发出其下一步应进入何种状态的命令,这就是人机对话。

早期的机械系统常以其自然的运行状态(力、热、声、光、位移、速度等)来表示自己的运行状态和结果,而人们根据这些状态作出判断,直接实现对机械系统的控制操作。

随着电子技术的发展,可以很方便的把各种物理状态转换成易于传输,经过加工后集中反映了各种信息的信号(如数字、曲线、图表、声响等),人们对系统的操作、控制不采用直接方式,而是向系统输入各种指令信号(如数字、符号、状态等),系统则根据这些指令信号进入规定的运行状态。

因此,只有当人、机之间以规定的信号方式进行信息交流时,才开始有了人机对话。

长期以来,机器在与人的信息交流中一直处于“聋哑”状态。

人对机器的输入主要靠各种形式的按键、键盘,机器要报告运行状态、结果只能通过各种显示装置。

这基本上属于“接触”式的人机对话。

它把人和对象系统限制在近距离面对面的空间里,所交换的信号基本上是数字量或数字量的转化形式。

这种较原始的人机对话不能满足进一步智能化的发展要求。

语音是众多信息载体中具有最大信息容量的信号,具有最高的智能水平,人们在提高机器智能化水平时,在人机对话方面就是寻求最好的语音信息交换手段。

语音作为人机对话的手段使人机对话向人-人对话发展,在形式上最终填补了人机对话的空白。

语音的对话方式使人-机界面从数字领域进入模糊领域。

1.3语音合成技术的发展

声音作为一种传输媒介,是人与人交往、交流思想、表达内容的最直接工具,这种工具的特殊性决定了它是一种重要的信息交流方式。

寻求一种模拟人类语言功能的装置系统,一直是人们孜孜以求的美好愿望。

1779年,由俄国沙皇悬赏“讲话者机器方案”而制作的元音合成器,算是第一个能发出声响的合成器。

当然,这还称不上真正意义的语音合成器。

1791年由风箱、皮筒、金属笛管等拼凑组装而成的合成器,从生理学的角度模仿人的口腔与鼻腔发音,在发声方面又向前迈进了一步。

但其发出的声音与人类语音仍然相去很远。

1902年以后,随着电的发现与利用,基于电的合成器便以彻底更新的设计思路,引导人们对语音的合成进行研究。

人类从事语音合成技术的研究虽然已有较长的时间,但是语音合成技术的商品化,则还是随着50年代初期数字电子计算机的出现,才在实践上迈出了可喜的一步。

80年代以后,随着微电子技术的迅速发展,大规模集成电路的语音处理芯片开始进入市场,而配合微型计算机组成各种复杂程度的语音处理系统,使得语音合成技术进入了一个更新的应用时代。

1989年,仍然是T1公司,在美国商业周刊(BusinessWeek)的国际版刊出一种语音合成的新产品——会“说话’的广告,它只占了四页,只需撕去开关挚上的标签,便会发出一段语音清晰甜美、历时1s秒的话音广告。

它的措施是利用一个仅有婴儿指甲大小的集成电路——包括了语音合成系统所需的一个8位微处理器、高级语音合成器和只读存储器(ROM)、随机存取存储器(RAM)及输入输出电路等,结合一个信用卡大小的模块作为发声装置,三颗纽扣电池提供电力,使得这套系统能够将广告内容播放达650次。

进入6O年代以后,由于语音处理技术取得了重大的进展,时序解析的数字方法引入语音分析,尤其在语音处理理论和模型方面的建树,诸如确立LPC与PARCOR技术的地位,更加深了对语音合成的应用潜力的认识,促进了语音合成技术的飞速发展。

70年代开始,语音合成技术渐趋成熟,规则合成法的提出,共振峰方式合成器得到重视,同时,相应的产品也接踵问世,意味着语音合成技术将优质语音带进产品是完全能够实现的,这也进一步推动了语音合成技术的发展。

1978年,在美国芝加哥举行的电子消费品展览上,美国德克萨斯仪器公司(TEXASINSTRUMENTS)展示一种叫做“说和拼”(speak&spell)语言学习辅助工具。

这是人类历史上第一种可以大量生产的发声电子产品,虽然信息量为1200比特(bps),属于超低速的声音编码器,但是它是由8位的微处理器和128K位的ROM,以及其它的专用集成电路组成的线路结构,不仅轻巧便携、价格低,也成为语音合成技术将优质语音应用于畅销产品的先例。

今天,语音合成产品更是与我们的生活密切相关,给我们带来了很大的便利。

我们乘坐公共汽车时,常可以听到语音报站器自动播报站名,声音清晰、洪亮,这就是语音合成芯片的一个简单应用。

市场上卖的非常火爆的英语学习机,是用语音合成芯片与普通的磁带录音机配合,一般可以录制60~240秒的数字语音信号,克服了磁带只能顺序放音的缺点,给英语学习者带来了极大的方便。

1.4语音合成技术的应用

语音合成技术产品的广泛使用,拉近了人与机器之间的距离,也给我们的生活带来了许多乐趣。

1.家庭民用产品与装置

语音合成技术应用于日常生活,可以给我们提供会说话的玩具、游戏机,和能够进行语音提示的家用电器。

比如,钟表或记时器报告时间:

“现在是上午8点整”,听起来要比“当、当、当”的声音要悦耳得多。

2.商业与银行

大型商场的门口或自动扶梯旁,语音播放系统与自动感应系统相互配合,给顾客一声轻轻的问候或一句适当的提示,都能给顾客带来些许暖意。

银行方面,报告兑汇率、利息等信息,或者给用户进行操作提示,也是颇受欢迎的。

3.通讯

语音合成技术在通讯方面的应用更加具体、广泛。

从电话机到程控交换机,从自动天气预报到各种信息查询,从自动寻呼系统到股票交易系统,语音合成技术的作用都得到了充分的体现。

4.检浏与控制

在检测与控制领域,语音合成技术的应用也十分普遍。

语音输出提供了一条更为直接的参数获取途径,可用来辅助捕获信息或提示与操作者有关的操作步骤。

在生产设备的监控系统中加入语音报警装置,则不论操作者是否注意到,都可以及时的得到警报,从而能预防重大事故的发生。

5.运输工具

可用于公共汽车、地铁、出租车和电梯等运输工具。

如车站自动报站器可以减轻售票员的劳动强度,也能够更为有效的提醒乘客注意。

6.其它

语音合成技术在军事等其它领域也有很重要的作用,如雷达的方位情况报告等。

1.5课题的研究内容与方法

这一课题的主要研究内容有:

探索和研究实现多功能数字语音自动录放系统所必须解决的一些理论上的问题和具体实现上的关健技术问题;提出一种实用的多功能数字语音自动录放系统的设计方案,并在此基础上研制一种具有较高性价比、高可靠性、功能完善、可与公用交换电话网(PSTN)实现无缝连接的稳定的数字语音自动录放系统。

本课题的研究分为理论分析和实验研究两个方面进行。

在理论上将探索一种适用于多种用途的语音产品开发模型,并选择出最优模型结构;在此基础上,制作出使用产品。

拟采用的技术路线为:

电路逻辑设计——电路结构定型——软件设计方案——软、硬件联机调试——各项性能指标测试令样机产品。

本课题的实验方案分硬件和软件两个方面。

1)硬件上:

采用ATMEL公司的AT89C51单片机为中心,控制外围电路来实现铃流信号检测、忙音检测、DTMF双音多频信号检测以及录放音等功能。

语音合成芯片选用东芝公司的T6668,它内置大容量、可读写、稳定性强的DRAM存储介质。

然后根据不同的用途进行不同容量扩展。

2)软件上:

主要是用单片机汇编语言来具体实现各种功能。

第2章语音合成应用及其综合应用系统评述

2.1概述

在日常生活中,人机接口这一界面上的一个主要目标将是语音合成系统。

语音系统,特别是一个声音再生系统,它利用语音合成(LSI),已经迅速得到重视并应用,起着愈来愈明显的作用。

合成语音输出是将语音合成技术揉合进入一个单片机控制应用系统中去产生的效果,它可以反映本机或控制对像的有关情况,从而缓和人机界面上一直存在的视而无声的单调气氛。

合成语音输出既可以辅助反映信息的输入/输出情况,也可以及时反映系统的诸多综合情况,如报告中间过程、指导操作、解释当前控制环节等。

本章基于实现合成语音输出能力,给出几个典型实用配接口电路,结合单片机应用,指出语音合成技术在机电仪器产品设计中的应用前景。

2.2语音合成的各种方法

数字语音信号处理的特征是获得语音信号的离散表示,以及在处理这一离散表示时所使用的较为特殊的方法。

目前,语音合成主要有两种方法,即波形存储法和参数合成法。

波形存储法是一种相对简单的语音合成技术。

它是最早的数码压缩和编码方式,直接对音频波形进行量化。

常见的有PCM(脉冲编码调制法)、ADPCM(自适应差分PCM法)、ADM(自适应增量调制法)等。

这类算法具有声音自然度和保真度高的优点,缺点是数据存储量大。

以CCITTITUG6.726标准为例,其算法采用了ADPCM,数据压缩后存储速率为32kbps,声音保真度和自然度都相当理想,频率响应范围可达l0kHz。

但是高达32kbps的存取速率,使得一片4M位的存储器只能存储125秒的语音信息。

参数合成法又叫分析合成法,是指对语音分析后将音调、共振峰、频谱、发音域函数等语音特征参数记录下来,然后根据这些特征将声音再合成重现。

其最大的优点在于可以以较小的数据存储量实现长时间数码录音。

参数合成法主要包括LPC(线性预测编码)和PARCOR(偏自相关系数法)等。

近年来,有出现了MELP混合激励线性预测编码)、CELP(码本激励线性预测编码)、MBE(多频段激励编码)等。

LPC方式有1.6kbps的存取速率就能完成语音编码,但是声音自然度和保真度很不理想;PARCOR方式可以得到还原度较高的语音,但是它与LPC方式一样,在参数编码的采样、分析、计算等方面非常复杂,用单一芯片来实现难度较大;MELP方式存取速率为2.4kbps和3.2kbps,声音自然度和保真度较LPC有了一定的改进,但仍有明显的不自然感觉;CELP方式具有了较逼真的语音效果,特别是在13.2kbps或9.6kbps高码率情况下,基本上能反映出所录语音的特点;CELP在较低码率(如4.8kbps或5.2kbps)情况下声音自然度也还可以接受。

MBE是有美国麻省理工学院最新发展的编码方法,其码率可以在2.4-9,6kbps范围内由用户选择,语音自然度和保真度要比其它方式高一个等级,可以说是目前最好的参数编码方式。

目前较多的参数编码芯片采用CELP方式,如LUCENT公司的LR-30,MXIC公司的93521,Tl公司的TSP50C-34等。

采用MBE方式的有DVS公司的AMBE-1000芯片。

参数编码芯片通常需要和编解码芯片(CODEC)一起使用。

通常人的语音最高为3800Hz。

根据采样原理可知,采样频率必须大于模拟量信号最高频率成分的两倍以上,因此一般使用的CODEC的采样频率是8kHz,实现的语音频率最高为3.8kHz。

2.3具有合成语音输出系统的构成

语音合成技术的发展与集成电路工艺技术有关,当大规模集成电路工艺走向成熟,也就开辟了语音合成技术的应用领域,保证了语音合成技术向实用化、民用化方向深入发展。

一般来说,语音合成方法为波形存贮法和参数法,具体则有脉冲编码调制方式PCM,差分编码调制方式DPCM,δ调制方式、自适应δ调制方式ADM,线性预测编码方式LPC、偏自相关方式PAR-COR等。

另外还有音素法、线性增量调制LDM、连续可变斜率增量调制CVSD等。

依照上述方式,许多集成电路厂商成功地推出了一系列的语音合成专用芯片。

例如TSP50C10/ll,它采用线性预测编码方式((LPC-12);T6668,TC8830AF则采用ADM方式;TC8831则采用PARCOR方式。

还有诸如:

SP-0256A-AL2采用LPC方式,μPD77P56G采用DPCM方式等等。

所有这些集成芯片都旨在建立一个语音合成系统,使得优质语音输出成为现实,以支持建立一种更具合理的人机对话关系。

合成语音输出系统的构成主要由二部分组成:

语音合成处理中心和合成声音信号输出。

对于语音合成所需要的语音数字表示数据,一般由二种途径来获得:

声音信号输入,由话筒捡拾声音信号,然后经由放大滤波再经采样量化分析处理,以得到波形编码数据;另一途径就是由数据处理获得参数合成所需数据。

语音合成处理中心节语音处理芯片,它可以分析/合成语音。

2.4常用语音合成技术在典型芯片中的应用

考虑单片机应用系统中实现合成语音输出,下面对T6668,TC8830AF和TMS5220结合MCS-S1系列89C51单片机作一说明:

2.4.1TC8830AF

TC8830AF采用ADM合成方式,具有手动和CPU操作模式,而且其外围使用SRAM型存储器作为语音数据保存CPU操作模式,TC8800AF提供CPU接口,11条可得到响应的命令,使得TC8830AF的语音存储器可以为CPU使用,即可以扩展单片机系统的存储器,也可以交由CPU管理TC8830AF的语音存贮器。

2.4.2TMS5220

TM5220使用LPC合成方式,通过CPU发出有关命令。

TMS5220便可以将50位一帧(满位一帧)的语音数据分析合成为指定意义的语声输出。

2.4.3T6668

T6668语音LIS采用ADM合成方式,使用动态DRAM为其外用语音数据存贮器,而且具有手动和CPU二种操作模式供选择使用。

CPU操作模式,T6668提供与CPU连接的接口,通过该接口,CPU可以给定T6668能予以响应的9条命令。

由于T6668具有这种CPU接口能力,因此对于单片机应用系统而言,可以实现:

使用T6668外围DRAM为单片机系统存贮器;使用单片机系统存贮器用作T6668语音数据存贮器。

该接口电路特点是语音数据是固定非易失性的。

它利用T6668的CPU接口特点,即CPU给定比特率,起始地址和终止地址,而且起始地址和终止地址间隔为8位,这样的话,只要CPU将一个8位语声数据反映在74LS165(并入/串出寄存器)上,T66

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 工作范文 > 行政公文

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1