DSP芯片的原理与设计1Word文件下载.docx
《DSP芯片的原理与设计1Word文件下载.docx》由会员分享,可在线阅读,更多相关《DSP芯片的原理与设计1Word文件下载.docx(15页珍藏版)》请在冰豆网上搜索。
图1.1典型的DSP系统
输入信号首先进行带限滤波和抽样,然后进行A/D(AnalogtoDigital)变换将信号变换成数字比特流。
根据奈奎斯特抽样定理,为保证信息不丢失,抽样频率至少必须是输入带限信号最高频率的2倍。
DSP芯片的输入是A/D变换后得到的以抽样形式表示的数字信号,DSP芯片对输入的数字信号进行某种形式的处理,如进行一系列的乘累加操作(MAC)。
数字处理是DSP的关键,这与其他系统(如交换系统)有很大的不同,在交换系统中,处理器的作用是进行路由选择,它并不对输入数据进行修改。
因此虽然两者都是实时系统,但两者的实时约束条件却有很大的不同。
最后,经过处理后的数字样值再经D/A(DigitaltoAnalog)变换转换为模拟样值,之后再进行插和平滑滤波就可得到连续的模拟波形。
必须指出的是,上面给出的DSP系统模型是一个典型模型,但并不是所有的DSP系统都必须具有模型中的所有部件。
如语音识别系统在输出端并不是连续的波形,而是识别结果,如数字、文字等;
有些输入信号本身就是数字信号(如CD:
CompactDisk),因此就不必进行模数变换了。
1.2.2DSP系统的特点
数字信号处理系统是以数字信号处理为基础,因此具有数字处理的全部优点:
(1)接口方便。
DSP系统与其他以现代数字技术为基础的系统或设备都是相互兼容的,与这样的系统接口以实现某种功能要比模拟系统与这些系统接口要容易得多;
(2)编程方便。
DSP系统中的可编程DSP芯片可使设计人员在开发过程中灵活方便地对软件进行修改和升级;
(3)稳定性好。
DSP系统以数字处理为基础,受环境温度以与噪声的影响较小,可靠性高;
(4)精度高。
16位数字系统可以达到
的精度;
(5)可重复性好。
模拟系统的性能受元器件参数性能变化比较大,而数字系统基本不受影响,因此数字系统便于测试、调试和大规模生产;
(6)集成方便。
DSP系统中的数字部件有高度的规性,便于大规模集成。
当然,数字信号处理也存在一定的缺点。
例如,对于简单的信号处理任务,如与模拟交换线的接口,若采用DSP则使成本增加。
DSP系统中的高速时钟可能带来高频干扰和电磁泄漏等问题,而且DSP系统消耗的功率也较大。
此外,DSP技术更新的速度快,数学知识要求多,开发和调试工具还不尽完善。
虽然DSP系统存在着一些缺点,但其突出的优点已经使之在通信、语音、图像、雷达、生物医学、工业控制、仪器仪表等许多领域得到越来越广泛的应用。
1.2.3DSP系统的设计过程
总的来说,DSP系统的设计还没有非常好的正规设计方法。
图1.2所示是DSP系统设计的一般过程。
图1.2DSP系统的设计流程
在设计DSP系统之前,首先必须根据应用系统的目标确定系统的性能指标、信号处理的要求,通常可用数据流程图、数学运算序列、正式的符号或自然语言来描述。
第二步是根据系统的要求进行高级语言的模拟。
一般来说,为了实现系统的最终目标,需要对输入的信号进行适当的处理,而处理方法的不同会导致不同的系统性能,要得到最佳的系统性能,就必须在这一步确定最佳的处理方法,即数字信号处理的算法(Algorithm),因此这一步也称算法模拟阶段。
例如,语音压缩编码算法就是要在确定的压缩比条件下,获得最佳的合成语音。
算法模拟所用的输入数据是实际信号经采集而获得的,通常以计算机文件的形式存储为数据文件。
如语音压缩编码算法模拟时所用的语音信号就是实际采集而获得并存储为计算机文件形式的语音数据文件。
有些算法模拟时所用的输入数据并不一定要是实际采集的信号数据,只要能够验证算法的可行性,输入假设的数据也是可以的。
在完成第二步之后,接下来就可以设计实时DSP系统,实时DSP系统的设计包括硬件设计和软件设计两个方面。
硬件设计首先要根据系统运算量的大小、对运算精度的要求、系统成本限制以与体积、功耗等要求选择合适的DSP芯片。
然后设计DSP芯片的外围电路与其他电路。
软件设计和编程主要根据系统要求和所选的DSP芯片编写相应的DSP汇编程序,若系统运算量不大且有高级语言编译器支持,也可用高级语言(如C语言)编程。
由于现有的高级语言编译器的效率还比不上手工编写汇编语言的效率,因此在实际应用系统中常常采用高级语言和汇编语言的混合编程方法,即在算法运算量大的地方,用手工编写的方法编写汇编语言,而运算量不大的地方则采用高级语言。
采用这种方法,既可缩短软件开发的周期,提高程序的可读性和可移植性,又能满足系统实时运算的要求。
DSP硬件和软件设计完成后,就需要进行硬件和软件的调试。
软件的调试一般借助于DSP开发工具,如软件模拟器、DSP开发系统或仿真器等。
调试DSP算法时一般采用比较实时结果与模拟结果的方法,如果实时程序和模拟程序的输入一样,则两者的输出应该一致。
应用系统的其他软件可以根据实际情况进行调试。
硬件调试一般采用硬件仿真器进行调试,如果没有相应的硬件仿真器,且硬件系统不是十分复杂,也可以借助于一般的工具进行调试。
系统的软件和硬件分别调试完成后,就可以将软件脱离开发系统而直接在应用系统上运行。
当然,DSP系统的开发,特别是软件开发是一个需要反复进行的过程,虽然通过算法模拟基本上可以知道实时系统的性能,但实际上模拟环境不可能做到与实时系统环境完全一致,而且将模拟算法移植到实时系统时必须考虑算法是否能够实时运行的问题。
如果算法运算量太大不能在硬件上实时运行,则必须重新修改或简化算法。
1.3可编程DSP芯片
1.3.1什么是DSP芯片
DSP芯片,也称数字信号处理器,是一种特别适合于进行数字信号处理运算的微处理器,其主要应用是实时快速地实现各种数字信号处理算法。
根据数字信号处理的要求,DSP芯片一般具有如下主要特点:
(1)在一个指令周期可完成一次乘法和一次加法;
(2)程序和数据空间分开,可以同时访问指令和数据;
(3)片具有快速RAM,通常可通过独立的数据总线在两块中同时访问;
(4)具有低开销或无开销循环与跳转的硬件支持;
(5)快速的中断处理和硬件I/O支持;
(6)具有在单周期操作的多个硬件地址产生器;
(7)可以并行执行多个操作;
(8)支持流水线操作,使取指、译码和执行等操作可以重叠执行。
当然,与通用微处理器相比,DSP芯片的其他通用功能相对较弱些。
1.3.2DSP芯片的发展
世界上第一个单片DSP芯片应当是1978年AMI公司发布的S2811,1979年美国Intel公司发布的商用可编程器件2920是DSP芯片的一个主要里程碑。
这两种芯片部都没有现代DSP芯片所必须有的单周期乘法器。
1980年,日本NEC公司推出的μPD7720是第一个具有乘法器的商用DSP芯片。
在这之后,最成功的DSP芯片当数美国仪器公司(TexasInstruments,简称TI)的一系列产品。
TI公司在1982年成功推出其第一代DSP芯片TMS32010与其系列产品TMS32011、TMS320C10/C14/C15/C16/C17等,之后相继推出了第二代DSP芯片TMS32020、TMS320C25/C26/C28,第三代DSP芯片TMS320C30/C31/C32,第四代DSP芯片TMS320C40/C44,第五代DSP芯片TMS320C5X/C54X,第二代DSP芯片的改进型TMS320C2XX,集多片DSP芯片于一体的高性能DSP芯片TMS320C8X以与目前速度最快的第六代DSP芯片TMS320C62X/C67X等。
TI将常用的DSP芯片归纳为三大系列,即:
TMS320C2000系列(包括TMS320C2X/C2XX)、TMS320C5000系列(包括TMS320C5X/C54X/C55X)、TMS320C6000系列(TMS320C62X/C67X)。
如今,TI公司的一系列DSP产品已经成为当今世界上最有影响的DSP芯片。
TI公司也成为世界上最大的DSP芯片供应商,其DSP市场份额占全世界份额近50%。
第一个采用CMOS工艺生产浮点DSP芯片的是日本的Hitachi公司,它于1982年推出了浮点DSP芯片。
1983年日本Fujitsu公司推出的MB8764,其指令周期为120ns,且具有双部总线,从而使处理吞吐量发生了一个大的飞跃。
而第一个高性能浮点DSP芯片应是AT&
T公司于1984年推出的DSP32。
与其他公司相比,Motorola公司在推出DSP芯片方面相对较晚。
1986年,该公司推出了定点处理器MC56001。
1990年,推出了与IEEE浮点格式兼容的浮点DSP芯片MC96002。
美国模拟器件公司(AnalogDevices,简称AD)在DSP芯片市场上也占有一定的份额,相继推出了一系列具有自己特点的DSP芯片,其定点DSP芯片有ADSP2101/2103/2105、ASDP2111/2115、ADSP2161/2162/2164以与ADSP2171/2181,浮点DSP芯片有ADSP21000/21020、ADSP21060/21062等。
自1980年以来,DSP芯片得到了突飞猛进的发展,DSP芯片的应用越来越广泛。
从运算速度来看,MAC(一次乘法和一次加法)时间已经从20世纪80年代初的400ns(如TMS32010)降低到10ns以下(如TMS320C54X、TMS320C62X/67X等),处理能力提高了几十倍。
DSP芯片部关键的乘法器部件从1980年的占模片区(diearea)的40%左右下降到5%以下,片RAM数量增加一个数量级以上。
从制造工艺来看,1980年采用4μm的N沟道MOS(NMOS)工艺,而现在则普遍采用亚微米(Micron)CMOS工艺。
DSP芯片的引脚数量从1980年的最多64个增加到现在的200个以上,引脚数量的增加,意味着结构灵活性的增加,如外部存储器的扩展和处理器间的通信等。
此外,DSP芯片的发展使DSP系统的成本、体积、重量和功耗都有很大程度的下降。
表1.1是TI公司DSP芯片1982年、1992年、1999年的比较表。
表1.2则是世界上主要DSP芯片供应商的代表芯片的一些数据。
表1.1TIDSP芯片发展比较表(典型值)
年份
1982年
1992年
1999年
制造工艺
4mNMOS
0.8mCMOS
0.3mCMOS
MIPS
5MIPS
40MIPS
100MIPS
MHz
20MHz
80MHz
100MHz
部RAM
144字
1K字
32K字
部ROM
1.5K字
4K字
16K字
价格
$150.00
$15.00
$5.00~$25.00
功耗
250mW/MIPS
12.5mW/MIPS
0.45mW/MIPS
集成晶体管数
50K
500K
表1.2单片可编程DSP芯片
公司
DSP芯片
推出时间(年)
MAC周期(ns)
定点位数
浮点位数
AMI
S2811
1978
300
12/16
NEC
PD7720
PD77230
1980
1985
250
150
16/32
32
TI
TMS32010
TMS32020
TMS320C25
TMS320C30
TMS320C40
TMS320C50
TMS320C203
TMS320LC549
TMS320C62X
1982
1987
1989
1992
1990
1996
1997
390
200
100
60
40
35
12.5
10
5
24/32
32/40
Motorola
MC56001
MC96002
MC56002
1986
1991
75
50
24
32/64
24/48
32/44
AT&
T
DSP32C
DSP16A
DSP3210
1988
80
25
16或24
16/36
AD
ADSP2101
ADSP21020
16
1.3.3DSP芯片的分类
DSP芯片可以按照下列三种方式进行分类。
1.按基础特性分
这是根据DSP芯片的工作时钟和指令类型来分类的。
如果在某时钟频率围的任何时钟频率上,DSP芯片都能正常工作,除计算速度有变化外,没有性能的下降,这类DSP芯片一般称为静态DSP芯片。
例如,日本OKI电气公司的DSP芯片、TI公司的TMS320C2XX系列芯片属于这一类。
如果有两种或两种以上的DSP芯片,它们的指令集和相应的机器代码机管脚结构相互兼容,则这类DSP芯片称为一致性DSP芯片。
例如,美国TI公司的TMS320C54X就属于这一类。
2.按数据格式分
这是根据DSP芯片工作的数据格式来分类的。
数据以定点格式工作的DSP芯片称为定点DSP芯片,如TI公司的TMS320C1X/C2X、TMS320C2XX/C5X、TMS320C54X/C62XX系列,AD公司的ADSP21XX系列,AT&
T公司的DSP16/16A,Motolora公司的MC56000等。
以浮点格式工作的称为浮点DSP芯片,如TI公司的TMS320C3X/C4X/C8X,AD公司的ADSP21XXX系列,AT&
T公司的DSP32/32C,Motolora公司的MC96002等。
不同浮点DSP芯片所采用的浮点格式不完全一样,有的DSP芯片采用自定义的浮点格式,如TMS320C3X,而有的DSP芯片则采用IEEE的标准浮点格式,如Motorola公司的MC96002、FUJITSU公司的MB86232和ZORAN公司的ZR35325等。
3.按用途分
按照DSP的用途来分,可分为通用型DSP芯片和专用型DSP芯片。
通用型DSP芯片适合普通的DSP应用,如TI公司的一系列DSP芯片属于通用型DSP芯片。
专用DSP芯片是为特定的DSP运算而设计的,更适合特殊的运算,如数字滤波、卷积和FFT,如Motorola公司的DSP56200,Zoran公司的ZR34881,Inmos公司的IMSA100等就属于专用型DSP芯片。
本书主要讨论通用型DSP芯片。
1.3.4DSP芯片的选择
设计DSP应用系统,选择DSP芯片是非常重要的一个环节。
只有选定了DSP芯片,才能进一步设计其外围电路与系统的其他电路。
总的来说,DSP芯片的选择应根据实际的应用系统需要而确定。
不同的DSP应用系统由于应用场合、应用目的等不尽一样,对DSP芯片的选择也是不同的。
一般来说,选择DSP芯片时应考虑到如下诸多因素。
1.DSP芯片的运算速度。
运算速度是DSP芯片的一个最重要的性能指标,也是选择DSP芯片时所需要考虑的一个主要因素。
DSP芯片的运算速度可以用以下几种性能指标来衡量:
(1)指令周期:
即执行一条指令所需的时间,通常以ns(纳秒)为单位。
如TMS320LC549-80在主频为80MHz时的指令周期为12.5ns;
(2)MAC时间:
即一次乘法加上一次加法的时间。
大部分DSP芯片可在一个指令周期完成一次乘法和加法操作,如TMS320LC549-80的MAC时间就是12.5ns;
(3)FFT执行时间:
即运行一个N点FFT程序所需的时间。
由于FFT运算涉与的运算在数字信号处理中很有代表性,因此FFT运算时间常作为衡量DSP芯片运算能力的一个指标;
(4)MIPS:
即每秒执行百万条指令。
如TMS320LC549-80的处理能力为80MIPS,即每秒可执行八千万条指令;
(5)MOPS:
即每秒执行百万次操作。
如TMS320C40的运算能力为275MOPS;
(6)MFLOPS:
即每秒执行百万次浮点操作。
如TMS320C31在主频为40MHz时的处理能力为40MFLOPS;
(7)BOPS:
即每秒执行十亿次操作。
如TMS320C80的处理能力为2BOPS。
2.DSP芯片的价格。
DSP芯片的价格也是选择DSP芯片所需考虑的一个重要因素。
如果采用价格昂贵的DSP芯片,即使性能再高,其应用围肯定会受到一定的限制,尤其是民用产品。
因此根据实际系统的应用情况,需确定一个价格适中的DSP芯片。
当然,由于DSP芯片发展迅速,DSP芯片的价格往往下降较快,因此在开发阶段选用某种价格稍贵的DSP芯片,等到系统开发完毕,其价格可能已经下降一半甚至更多。
3.DSP芯片的硬件资源。
不同的DSP芯片所提供的硬件资源是不一样的,如片RAM、ROM的数量,外部可扩展的程序和数据空间,总线接口,I/O接口等。
即使是同一系列的DSP芯片(如TI的TMS320C54X系列),系列中不同DSP芯片也具有不同的部硬件资源,可以适应不同的需要。
4.DSP芯片的运算精度。
一般的定点DSP芯片的字长为16位,如TMS320系列。
但有的公司的定点芯片为24位,如Motorola公司的MC56001等。
浮点芯片的字长一般为32位,累加器为40位。
5.DSP芯片的开发工具。
在DSP系统的开发过程中,开发工具是必不可少的。
如果没有开发工具的支持,要想开发一个复杂的DSP系统几乎是不可能的。
如果有功能强大的开发工具的支持,如C语言支持,则开发的时间就会大大缩短。
所以,在选择DSP芯片的同时必须注意其开发工具的支持情况,包括软件和硬件的开发工具。
6.DSP芯片的功耗。
在某些DSP应用场合,功耗也是一个需要特别注意的问题。
如便携式的DSP设备、手持设备、野外应用的DSP设备等都对功耗有特殊的要求。
目前,3.3V供电的低功耗高速DSP芯片已大量使用。
7.其他。
除了上述因素外,选择DSP芯片还应考虑到封装的形式、质量标准、供货情况、生命周期等。
有的DSP芯片可能有DIP、PGA、PLCC、PQFP等多种封装形式。
有些DSP系统可能最终要求的是工业级或军用级标准,在选择时就需要注意到所选的芯片是否有工业级或军用级的同类产品。
如果所设计的DSP系统不仅仅是一个实验系统,而是需要批量生产并可能有几年甚至十几年的生命周期,那么需要考虑所选的DSP芯片供货情况如何,是否也有同样甚至更长的生命周期等。
在上述诸多因素中,一般而言,定点DSP芯片的价格较便宜,功耗较低,但运算精度稍低。
而浮点DSP芯片的优点是运算精度高,且C语言编程调试方便,但价格稍贵,功耗也较大。
例如TI的TMS320C2XX/C54X系列属于定点DSP芯片,低功耗和低成本是其主要的特点。
而TMS320C3X/C4X/C67X属于浮点DSP芯片,运算精度高,用C语言编程方便,开发周期短,但同时其价格和功耗也相对较高。
DSP应用系统的运算量是确定选用处理能力为多大的DSP芯片的基础。
运算量小则可以选用处理能力不是很强的DSP芯片,从而可以降低系统成本。
相反,运算量大的DSP系统则必须选用处理能力强的DSP芯片,如果DSP芯片的处理能力达不到系统要求,则必须用多个DSP芯片并行处理。
那么如何确定DSP系统的运算量以选择DSP芯片呢?
下面我们来考虑两种情况。
1.按样点处理
所谓按样点处理就是DSP算法对每一个输入样点循环一次。
数字滤波就是这种情况。
在数字滤波器中,通常需要对每一个输入样点计算一次。
例如,一个采用LMS算法的256抽头的自适应FIR滤波器,假定每个抽头的计算需要3个MAC周期,则256抽头计算需要256×
3=768个MAC周期。
如果采样频率为8kHz,即样点之间的间隔为125s,DSP芯片的MAC周期为200ns,则768个MAC周期需要153.6s的时间,显然无法实时处理,需要选用速度更高的DSP芯片。
表1.3示出了两种信号带宽对三种DSP芯片的处理要求,三种DSP芯片的MAC周期分别为200ns、50ns和25ns。
从表中可以看出,对话带的应用,后两种DSP芯片可以实时实现,对声频应用,只有第三种DSP芯片能够实时处理。
当然,在这个例子中,没有考虑其他的运算量。
表1.3用DSP芯片实现数字滤波
应用
领域
采样率
(kHz)
采样周期
(s)
256抽头LMS滤波
运算量(MAC数)
每样点允许MAC
指令数(200ns)
每样点允许MAC
指令数(50ns)
每样点允许M