DSP芯片基础知识.docx-资源下载

DSP芯片基础知识.docx

1、DSP芯片基础知识DSP芯片基础知识发布日期：2006-3-411:55:52作者：Eric出处：不详DSP芯片介绍 1 什么是DSP芯片DSP芯片，也称数字信号处理器，是一种具有特殊结构的微处理器。DSP芯片的内部采用程序和数据分开的哈佛结构，具有专门的硬件乘法器，广泛采用流水线操作，提供特殊的DSP 指令，可以用来快速地实现各种数字信号处理算法。根据数字信号处理的要求，DSP芯片一般具有如下的一些主要特点：（1）在一个指令周期内可完成一次乘法和一次加法。（2）程序和数据空间分开，可以同时访问指令和数据。（3）片内具有快速RAM，通常可通过独立的数据总线在两块中同时访问。（4）具有低

2、开销或无开销循环及跳转的硬件支持。（5）快速的中断处理和硬件I/O支持。（6）具有在单周期内操作的多个硬件地址产生器。（7）可以并行执行多个操作。（8）支持流水线操作，使取指、译码和执行等操作可以重叠执行。与通用微处理器相比，DSP芯片的其他通用功能相对较弱些。2 DSP芯片的发展世界上第一个单片DSP芯片是1978年AMI公司宣布的S2811，1979年美国Iintel公司发布的商用可编程期间2920是DSP芯片的一个主要里程碑。这两种芯片内部都没有现代DSP芯片所必须的单周期芯片。 1980年。*NEC公司推出的PD7720是第一个具有乘法器的商用DSP 芯片。第一个采用CMOS工

3、艺生产浮点DSP芯片的是*的Hitachi 公司，它于1982年推出了浮点DSP芯片。1983年，*的Fujitsu公司推出的MB8764，其指令周期为120ns ，且具有双内部总线，从而处理的吞吐量发生了一个大的飞跃。而第一个高性能的浮点DSP芯片应是AT&T公司于1984年推出的DSP32。在这么多的DSP芯片种类中，最成功的是美国德克萨斯仪器公司（Texas Instruments，简称TI）的一系列产品。TI公司灾982年成功推出启迪一代DSP芯片TMS32010及其系列产品TMS32011、TMS32C10/C14/C15/C16/C17等，之后相继推出了第二代DSP芯片TMS320

4、20、TMS320C25/C26/C28，第三代DSP芯片TMS32C30/C31/C32，第四代DSP芯片TMS32C40/C44，第五代DSP芯片TMS32C50/C51/C52/C53以及集多个DSP于一体的高性能DSP芯片TMS32C80/C82等。自1980年以来，DSP芯片得到了突飞猛进的发展，DSP芯片的应用越来越广泛。从运算速度来看，MAC（一次乘法和一次加法）时间已经从80年代初的400ns（如TMS32010）降低到40ns（如TMS32C40），处理能力提高了10多倍。DSP芯片内部关键的乘法器部件从1980年的占模区的40左右下降到5以下，片内RAM增加一个数量级以上。

5、从制造工艺来看，1980年采用4的N沟道MOS工艺，而现在则普遍采用亚微米CMOS工艺。DSP芯片的引脚数量从1980年的最多64个增加到现在的200个以上，引脚数量的增加，意味着结构灵活性的增加。此外，DSP芯片的发展，是DSP系统的成本、体积、重量和功耗都有很大程度的下降。3 DSP芯片的分类DSP的芯片可以按照以下的三种方式进行分类。1. 按基础特性分这是根据DSP芯片的工作时钟和指令类型来分类的。如果DSP芯片在某时钟频率范围内的任何频率上能正常工作，除计算速度有变化外，没有性能的下降，这类DSP芯片一般称之为静态DSP芯片。如果有两种或两种以上的DSP芯片,它们的指令集和相应的机器代

6、码机管脚结构相互兼容,则这类DSP芯片称之为一致性的DSP芯片。2. 按数据格式分这是根据DSP芯片工作的数据格式来分类的。数据以定点格式工作的DSP芯片称之为定点DSP芯片。以浮点格式工作的称为DSP芯片。不同的浮点DSP芯片所采用的浮点格式不完全一样，有的DSP芯片采用自定义的浮点格式，有的DSP芯片则采用IEEE的标准浮点格式。3. 按用途分按照DSP芯片的用途来分，可分为通用型DSP芯片和专用型的DSP芯片。通用型DSP芯片适合普通的DSP应用，如TI公司的一系列DSP芯片。专用型DSP芯片市为特定的DSP运算而设计，更适合特殊的运算，如数字滤波，卷积和FFT等。4 DSP芯片的选择设

7、计DSP应用系统，选择DSP芯片时非常重要的一个环节。只有选定了DSP芯片才能进一步设计外围电路集系统的其它电路。总的来说，DSP芯片的选择应根据实际的应用系统需要而确定。一般来说，选择DSP芯片时考虑如下诸多因素。1 DSP芯片的运算速度。运算速度是DSP芯片的一个最重要的性能指标，也是选择DSP芯片时所需要考虑的一个主要因素。DSP芯片的运算速度可以用以下几种性能指标来衡量：（1）指令周期。就是执行一条指令所需要的时间，通常以ns为单位。（2） MAC时间。即一次乘法加上一次加法的时间。（3） FFT执行时间。即运行一个N点FFT程序所需的时间。（4） MIPS。即每秒执行百万条指令。（

8、5） MOPS。即每秒执行百万次操作。（6） MFLOPS。即每秒执行百万次浮点操作。（7） BOPS。即每秒执行十亿次操作。2 DSP芯片的价格。根据一个价格实际的应用情况，确定一个价格适中的DSP芯片。3 DSP芯片的硬件资源。4 DSP芯片的运算速度。5 DSP芯片的开发工具。6 DSP 芯片的功耗。7 其它的因素，如封装的形式、质量标准、生命周期等。DSP应用系统的运算量是确定选用处理能力多大的DSP芯片的基础。那么如何确定DSP系统的运算量以选择DSP芯片呢？1 按样点处理按样点处理就是DSP算法对每一个输入样点循环一次。例如；一个采用LMS算法的256抽头德的自适应FIR滤波器，假

9、定每个抽头的计算需要3个MAC周期，则256抽头计算需要256*3=768个MAC周期。如果采样频率为8KHz，即样点之间的间隔为125s的时间，DSP芯片的MAC周期为200s，则768个周期需要153.6s的时间，显然无法实时处理，需要选用速度更快的芯片。2 按帧处理有些数字信号处理算法不是每个输入样点循环一次，而是每隔一定的时间间隔（通常称为帧）循环一次。所以选择DSP芯片应该比较一帧内DSP芯片的处理能力和DSP算法的运算量。假设DSP芯片的指令周期为P（ns），一帧的时间为（ns），则该DSP芯片在一帧内所提供的最大运算量为/ P 条指令。5 DSP芯片的基本结构DSP芯片的基本结构

10、包括：（1）哈佛结构；（2）流水线操作；（3）专用的硬件乘法器；（4）特殊的DSP指令；（5）快速的指令周期。哈佛结构哈佛结构的主要特点是将程序和数据存储在不同的存储空间中，即程序存储器和数据存储器是两个相互独立的存储器，每个存储器独立编址，独立访问。与两个存储器相对应的是系统中设置了程序总线和数据总线，从而使数据的吞吐率提高了一倍。由于程序和存储器在两个分开的空间中，因此取指和执行能完全重叠。流水线与哈佛结构相关，DSP芯片广泛采用流水线以减少指令执行的时间，从而增强了处理器的处理能力。处理器可以并行处理二到四条指令，每条指令处于流水线的不同阶段。入图示出一个三级流水线操作的例子。CLLOU

11、T1取指 N N-1 N-2译码 N-1 N N-2执行 N-2 N-1 N图4-1 三级流水线操作专用的硬件乘法器乘法速度越快，DSP处理器的性能越高。由于具有专用的应用乘法器，乘法可在一个指令周期内完成。特殊的DSP指令DSP芯片是采用特殊的指令。快速的指令周期哈佛结构、流水线操作、专用的硬件乘法器、特殊的DSP指令再加上集成电路的优化设计可使DSP芯片的指令周期在200ns以下。6 DSP系统的特点数字信号处理系统是以数字信号处理为基础，因此具有数字处理的全部特点：（1）接口方便。DSP系统与其它以现代数字技术为基础的系统或设备都是相互兼容，这样的系统接口以实现某种功能要比模拟系统与这

12、些系统接口要容易的多。（2）编程方便。DSP系统种的可编程DSP芯片可使设计人员在开发过程中灵活方便地对软件进行修改和升级。（3）稳定性好。DSP系统以数字处理为基础，受环境温度以及噪声的影响较小，可靠性高。（4）精度高。16位数字系统可以达到的精度。（5）可重复性好。模拟系统的性能受元器件参数性能变化比较大，而数字系统基本上不受影响，因此数字系统便于测试，调试和大规模生产。（6）集成方便。DSP系统中的数字部件有高度的规范性，便于大规模集成。7 DSP芯片的应用自从DSP芯片诞生以来，DSP芯片得到了飞速的发展。DSP芯片高速发展，一方面得益于集成电路的发展，另一方面也得益于巨大的

13、市场。在短短的十多年时间，DSP芯片已经在信号处理、通信、雷达等许多领域得到广泛的应用。目前，DSP芯片的价格也越来越低，性能价格比日益提高，具有巨大的应用潜力。DSP芯片的应用主要有：（1）信号处理-如，数字滤波、自适应滤波、快速傅里叶变换、相关运算、频谱分析、卷积等。（2）通信-如，调制解调器、自适应均衡、数据加密、数据压缩、回坡抵消、多路复用、传真、扩频通信、纠错编码、波形产生等。（3）语音-如语音编码、语音合成、语音识别、语音增强、说话人辨认、说话人确认、语音邮件、语音储存等。（4）图像/图形-如二维和三维图形处理、图像压缩与传输、图像增强、动画、机器人视觉等。（5）军事-如

14、保密通信、雷达处理、声纳处理、导航等。（6）仪器仪表-如频谱分析、函数发生、锁相环、地震处理等。（7）自动控制-如引擎控制、深空、自动驾驶、机器人控制、磁盘控制。（8）医疗-如助听、超声设备、诊断工具、病人监护等。（9）家用电器-如高保真音响、音乐合成、音调控制、玩具与游戏、数字电话/电视等 DSP开发相关知识文章所属类别：dsp录入时间：2005-4-41McBSP(MultichannelBufferedSerialPort)串口利用DMA中的多帧（Multi-Frame）方式通信的中断处理在实际通信应用中，一个突发之后，程序必须为下一个突发作准备。因此一般采用串口的DMA多帧方式

15、但在串口以DMA方式传输数据时却有一些问题要讨论。首先DMA的传输同步事件应设McBSP的传输事件即XEVT，这样一字节传输后会自动准备另一字节（McBSP的READY上升沿触发DMA传输）。中断发生时意味着一个块已传完，这时DMA的使能自动关闭，McBSP的READY将一直保持高状态。但是在下一次突发传输直接使能DMA时却启动不了传输（相信会有许多我遇到此类问题）。这是因为无法产生McBSP触发启动所需的READY上升沿。解决办法是在中断程序中先关闭McBSP的发送，使READY=0，随后在程序中发送使能DMA，再打开McBSP的发送即可。如先打开McBSP的发送后打开DMA，也是不会工作的

16、。因为McBSP的READY已经由0变到1了，无法再产生READY上升沿。2关闭DMA与关闭McBSP的区别在通信领域，为了充分利用DSP的片上外设资源，常常利用DMA把从串口来的数据或要发的数据放入缓冲区，再处理。对DMA而言，只要其在数据缓冲区的指针指向了中断应发生的位置，就产生中断。但此时最后一个数据只是进入了McBSP而并未真正发出去，所以在传送结束的中断程序中只能关闭DMA不能关闭McBSP。因为此时McBSP的发寄存器DXR中还有一个字没有发出。3McBSP串口配置的关键时序主要是寄存器SPCR2的配置：在保持RRST、XRST、FRST各位为0的前提下，配置好其它串口控制寄存器。

17、等待至少2个CLKR/T时钟以确保DSP内部的同步。（1）可以向DXR装载数据或使能DMA。（2）使能GRST（GRST=1）（如果需要DSP内部产生采样时钟）。（3）使能RRST或XRST，注意此时要保证SPCR中仅有此一位发生改变。（4）使能FRST（FRST=1）（如果需要DSP内部产生帧同步）。（5）等待2个R/TCLK时钟周期后，收或发端便会有效。4汇编语言程序中的变量汇编语言程序中的公用变量应在文件中定义，如.defcarry。汇编语言程序中使用的局部变量不需定义，可直接声明，例如trn_num.word00h。如果在两个asm文件中有两个都没有定义的同名变量，则编译程序会认为分他

18、们不是同一变量。在汇编程序的开头应有.mmregs宏语句。它一方面表示对默认定义的确认（ah,bh,trn等），另一方面可以对所用寄存器重新定义。如：.mmregsDMPREC.set54h;定义DMA优先和使能寄存器地址在54hDMSA.set55hDMSDN.set57hDXR10.set23h;定义串口1的发送寄存器地睛在23h5ST1寄存器中CPL位的影响CPL位是编译模式控制位，它表示在相对直接寻址时采用哪种指针。当CPL=0时，使用页指针DP；当CPL=1时，使用堆栈指针SP。实际使用中二者没有什么差别，但使用SP寻址的程序更易读。在程序中经常使用CPL=1。6指令的歧义6.1比较

19、下面指令STLMB，AR4；把bl内容送入寄存器AR4（）STLMB,*AR4；把bl内容送入寄存器AR4（）前者实际执行的是把bl内容送入一个系统用的缓冲区，后者也可用：MVDMBL，AR4；把bl内容送入寄存器AR4（）其他易导致歧义的语句还有：LDAR5，A；把AR5的内容送入寄存器A（）LDMAR5，A；把AR5的内容送入寄存器A（）ANDM#0x107e,AR4；把#107e加到寄存器AR4（）ANDN#0x107e，*AR4;把#107e加到寄存器AR4（）仅对某些寄存器有效的指令：MVDD*AR2+，*AR3+；把以AR2为地址的内容拷入AR3的地址中此类指令用作数据块搬移特别有

20、效，但仅对AR2、AR3、AR4、AR5有效。易错语句中对程序运行危害最大的是：ST#0，*（bsp0_out_sign）;bsp0_out_sign是一个变量名（）STM#0，bsp0_out_sign；此语句被编译为STM#0,PMST或STM#0，IMR（）这种语句会导致程序运行中的随机故障，且极难发现。6.2流水冲突分析以下程序：STMto_dce_buff,AR4LDMAR4,BADDA,B;B=AR4+ALMVDMBL,AR4;AR4=to-dce-buff+AL实际上，上段程序得不到AR4=to-dce-buff+AL的结果。这是因为DSP一般采用深度为36级的流水结构，产生了无

21、法解决的冲突，所以它不能被正确执行。解决的办法是在赋值和引用之间插入一条或几条其他的指令，或NOP语句即可。7汇编与C语言混合编程的关键问题7.1C程序变量与汇编程序变量的共用为了使程序更易于接口和维护，可以在汇编程序中引用与C程序共享的变量：.ref_to_dce_num,_to_dte_num,_to_dce_buff,_to_dte_buff在汇编程序中引用而在C程序可直接定义的变量：unsignedcharto_dte_buffBUFF_SIZE;/DSP发向PC机的数据intto_dte_num;/缓冲区中存放的有效字节数intto_dte_store：/缓冲区的存放指针intto_

22、dte_read;/缓冲区的读取指针这样经过链接就可完成对应。7.2程序入口问题在C程序中，程序的入口是main（）函数。而在汇编程序中其入口由*.cmd文件中的命令决定，如：-emain_start；程序入口地址为main_start。这样，混合汇编出来的程序得不到正确结果。因为C到ASM的汇编有默认的入口c-int00，从这开始的一段程序为C程序的运行做准备工作。这些工作包括初始化变量、设置栈指针等，相当于系统壳不能耐跨越。这时可在*.cmd文件中去掉语句：-emain_start。如仍想执行某些汇编程序，可以C函数的形式执行，如：main_start()；/其中含有其他汇编程序但前提是在

23、汇编程序中把_main_start作为首地址，程序以rete结尾（作为可调用的函数）的程序段，并在汇编程序中引用_main_start，即.ref_main_start。7.3移位问题在C语言中把变量设为char型时，它是8位的，但在DSP汇编中此变量仍被作为16位处理。所以会出现在C程序中的移位结果与汇编程序移位结果不同的问题。解决的办法是在C程序中，把移位结果再用0X00FF去“与”一下即可。7.4堆栈问题在汇编程序中对堆栈的依赖很小，但在C程序中分配局部变量、变量初始化、传递函数变量、保存函数返回地址、保护临时结果功能都是靠堆栈完成。而C编译器无法检查程序运行时堆栈能否溢出。所以应尽量多

24、给堆栈分配空间。C编译器的默认大小为1KB。在程序不正常跑飞时应注意检查是否堆栈溢出。7.5程序跑飞问题编译后的C程序跑飞一般是对不存在的存储区访问造成的。首先要查.MAP文件并与memerymap图对比，看是否超出范围。如果在有中断的程序中跑飞，应重点查在中断程序中是否对所用到的寄存器进行了压栈保护。如果在中断程序中调用了C程序，则要查汇编后的C程序中是否用到了没有被保护的寄存器并提供保护（在C程序的编译中是不对A、B等寄存器进行保护的）。8命令文件的编写在编辑*.cmd文件时编译连接器默认：page0就是ROM区，page1就是RAM区。下列段必须放在ROM区。.textload=PROG

25、PAGE0;程序段.constload=dataPAGE0;常数段.cinitload=dataPAGE0;初始化段.switchload=dataPAGE0;switch指令常数表值得注意的是尽量不要用FILL选项，一旦进行填充会使生成的.out文件增大甚至超过内部的存储空间而无法Bootload。9BOOtload问题一般都采用从EPROM引导，但通常很费脑筋。下面介绍一下可为54X系列DSP内部引导程序识别的EPROM存储结构，如表1所示。表1EPROM内容地址08AAh或10AAhSWWSR(等待状态产生寄存器）值16BSCR（页切换控制寄存器）值16人口点XPC（外部存储器映射寄存器

26、）值7人口点PC（程序地址寄存器）值16第一块的大小16第一块的人口点XPC（外部存储器映射寄存器）值7第一块的人口点PC（程序地址寄存器）值16代码（1）16代码（N）16最后一块的大小16最后一块的人口点XPC（外部存储器映射寄存器）值7最后一块的人口点PC（程序地址寄存器）值16代码（1）16代码（N）160000h(标志引导表结束)EPROM的启始地址（如8000h)首地址FFFFh假使已经生成了*.out文件，生成时必须带有芯片，此处为MS320VC5409，版本参数如：asm500init_54x-v548）。.hex文件与EPROM的存储空间相对应，其生成的参数由.cmd文件决定

27、。下面以实例介绍.cmd文件中的参数编写及意义。cdpd.out；将cdpd.out文件转换成.hex文件-SWWSR7fffh；将外部设备的等待时间设为7个等待状态-BSCR0f800h；设置4K为一页，页面切换时插入1个等待状态-ocdpd.hex；转换成cdpd.hex文件-i;intel格式-boot;把所有的程序块装入EPROM-bootorg8000h；从EPROM存储器的8000h处开始写入程序内容-memwidth8;系统数据宽度转为8位，以避免生成2个文件-romwidth8;EPROM数据宽度为8位-e0840h;从8040h开始执行程序-mapwfcdpd.mxp；生成EPROM存储器占用映射这时生成的cdpd.hex可以直接写入EPROM。需要说明320C5409的外部RAM范围从8000hFFFFh，所以设首地址为8000h。但是对C54x系列而言，其转换有个BUG，即它总是不能在0XFFFF处写入从外部EPROM存储器装载的开始地址，只好自己填入。对本例而言在0XFFFE处写0X80，在0XFFFF处写0X00。

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
特别说明：	请自助下载，系统不会自动发送文件的哦；如果您已付费，想二次下载，请登录后访问：我的下载记录
支付方式：
验证码：	换一换

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？