改善对调频连续波雷达中差拍信号的处理能力.docx
《改善对调频连续波雷达中差拍信号的处理能力.docx》由会员分享,可在线阅读,更多相关《改善对调频连续波雷达中差拍信号的处理能力.docx(65页珍藏版)》请在冰豆网上搜索。
改善对调频连续波雷达中差拍信号的处理能力
摘要
本课题的目的是为了改善对调频连续波雷达中差拍信号的处理能力:
在提高处理速度的同时降低设备成本。
为完成这一任务,本课题利用了DSP和PCI技术。
DSP有着强大的信号处理能力,不仅处理速度快,而且可实现多种任务处理,使用方便;PCI局部总线技术,大幅度地提高了数传速率,现有专门的芯片来实现,使得这一技术的应用变得简单易行。
这样,很容易满足信号实时处理的要求;同时,所涉及的起见已批量问世,使得实现的成本很底。
作者应用TI公司的TMS320VC5402和AMCC公司的S5920设计了一个数据采集/处理卡,自己编制了DSP处理软件。
该卡经过测试,性能良好,达到了设计的技术要求。
[关键词]PCI总线DSPTMS320VC5402
S5920实时处理
ABSTRACT
ThetaskofdesignisimprovementontheabilityofprocessingbeatsignalinLinearFM-CWRadar(LFMCW):
cuttingdownthecostingofprocessingdevicewhile
speedingit’soperation.
Tofulfillthistask,thetechnologiesonDSPandPCIlocalbusareemployed.
DSP(digitalsignalprocessor)isverymightinessinprocessingdigitalsignal.Itrunsrapidlyandcanrealizemanywoksbytheuseoftherelatedprogram.PCIlocalbustechnologyhasenlargedgreatlythevelocityfordatatransmission.Thechipexpertinrealizingithasmadetheapplicationsimpleandeasy.Thusthedesireofreal-timeprocessingcaneasilyattain.Thedevicesrelateonthedesignhavecomeoutwithgreatbatch;sothecostingisgettingmorelittleandlittle.
Authorhasdesignedadatacollecting/processingPCIcardwithTI’sTMS320VC540andAMCC’sS5920,andprogrammedthesoftwareforDSPoperation.Theperformanceofthecardisgood,accordingwiththetask.
[KeyWords]PCILocalBusDSPTMS320VC5402
S5920Real-timeprocessing
目录
第一章绪论……………………………………………………………………1
1.1数字化决定信号处理的未来…………………………………………
1.2研制技术要求…………………………………………………………
第二章DSP原理
2.1DSP芯片概述…………………………………………………………
2.2DSP芯片的结构………………………………………………………
2.3TI—C54X………………………………………………………………
第三章PCI接口技术……………………………………………………………
3.1PCI局部总线的特点……………………………………………………
3.2PCI规范简介……………………………………………………………
3.3S5920PCI接口芯片………………………………………………………
第四章信号采集/处理PCI卡设计……………………………………………
1.1总体方案…………………………………………………………………
1.2A/D电路设计………………………………………………………………
1.3DSP电路设计……………………………………………………………
1.4PCI电路设计…………………………………………………………
1.5电源………………………………………………………………………
第五章软件设计
5.1总体方案……………………………………………………………………
5.2DSP软件……………………………………………………………………
5.3图形显示软件………………………………………………………………
5.4驱动程序……………………………………………………………………
第六章信号采集/处理PCI卡的应用……………………………………………
6.1应用功能及说明……………………………………………………………
6.2数字示波器模式……………………………………………………………
6.3数字频谱仪模式……………………………………………………………
结束语…………………………………………………………………………………
致谢……………………………………………………………………………………
参考文献………………………………………………………………………………
第一章绪论
数字信号处理作为信号与信息处理的一个分支学科,已经历了长期的发展历程。
但它又是一个新兴的、极富活力的学科,在科学研究、工业生产以、国防建设和国民经济的各个领域,起着越来越重要的作用。
本论文课题就是数字信号处理技术的一个具体实例。
§1.1数字信号处理的动态
信号包括模拟和数字两种形式。
科学发展的渐进性决定了一个很长时期模拟信号处理和应用的主导地位,它的基本数学模型是基于19世纪提出的拉普拉斯变换和付氏变换。
40年代数字计算机出现了,数字信号的处理技术、理论和应用也得到了很大的发展,在它的发展历史上最有影响的莫过于1965年库利(Cooley)和图基(Tukey)发明的快速付氏变换(FFT,FastFourierTransform)和70年代后期推出的Inter2920第一块脱离了通用微处理器机构的DSP芯片。
FFT极大地降低了付氏变换的计算量,从而为数字信号的实时处理奠定了算法基础;DSP又为实时数字信号处理奠定了数字计算机这一实现基础。
使得数字技术的优点得到了充分的展示:
(注:
数字信号处理技术得益于A/D变换技术、计算机技术、大规模集成电路技术、DSP芯片技术、数字信号处理理论、快速算法等)
1.灵活性
采用数字信号处理技术可以在一个硬件平台上,通过设计各种软件来实现多种多样的信号处理任务,在很多情况下,甚至可以不需重新编程,而只需改变有关的数据和操作就可以完成不同的任务,而在模拟系统中,随着任务的不同,所有的设计都必须改变;另一方面,数字信号处理技术的优越性还表现在可以实行一些在模拟处理中难于实现的信号处理。
2.稳定性好
模拟电路中的电阻、电容、运算放大器、滤波器等器件的特性会随着温度的改变而改变,这就意味着,一个模拟电路的性能在温度变化很大时有较大的改变,而数字电路在其保证的工作范围内受温度变化的影响就要小得多。
此外,对于模拟电路来说,还必须考虑到器件及制造器件的材料的寿命,这些将极大地影响整个电路的性能。
3.精确性
数字系统本身就固有精确性。
如果用1000台计算机去计算同一个序列的和,则它们会提供一模一样的结果,但如果将同样的信号输入到相同配置的1000个模拟系统中,则每个系统的输出都不会相同。
其原因非常简单,模拟系统中器件的性能各不相同。
电阻允许的误差通常为其阻值的5%,更高档的可能是2%或1%,电容的误差是20%或更差。
与次相类似,模拟半导体器件也有其技术规格的范围。
这就意味着,即便设计完全相同的模拟系统,其性能也各不相同。
4.易于实现自适应算法
数字信号处理中的自适应处理技术可以根据所处理信号的某些特征,自适应地调整信号处理方法,以获得最佳的处理效果,而这一点用模拟信号处理系统难于实现。
5.大规模集成
数字信号处理的相关部件可以用超大规模集成电路技术大规模生产,产品规范性、一致性好。
正是因为数字技术有着如此多的特点,使得它的应用一浪高过一浪,在信息时代,数字化将决定信号处理的未来,也难怪有公司公开宣称它的未来就在DSP。
§1.2研制技术要求
1.2.1应用背景
本文的研究任务是研制用于线性调频连续波雷达差拍信号等外同步低频模拟信号的数据采集及实时谱分析处理PCI卡,以三个SMA电缆座与外面输入的模拟信号、触发信号和时钟信号相连接.
1.2.2功能要求
根据实际应用要求,该PCI卡可以由PC机通过软件事先设定为纯采集和谱分析两种工作模式。
第一种模式只完成输入模拟信号到数字信号的转变。
第二种模式要求在完成输入模拟信号到数字信号的转变后,对该数字信号进行谱分析和其他计算。
这两种模式都要求将最终结果传送到PC机的存储器中。
具体要求如下:
1、模拟信号输入
采用SMA电缆座,连接外部系统输入的-2.5~+2.5V双极性模拟信号;输入级为高阻。
2、触发信号输入
采用SMA电缆座,连接外部系统输入的低占空比TTL触发信号。
3、时钟信号输入
采用SMA电缆座,连接外部系统输入的50%占空比TTL时钟信号。
4、PCI工作方式
能实现纯采集工作模式、采集和谱分析工作模式。
5、A/D工作方式
能实现内/外时钟源选择、触发信号触发沿选择、采样频率选择、采样长度
选择。
6、DSP工作方式
可实现FFT长度设定、窗函数启闭、求模运算启闭和峰值运算启闭。
1.2.3技术指标
1、输入模拟信号
信号时宽1~4ms,幅度变化范围-2.5~+2.5V,频谱分布范围0~1MHz,重
复周期6~8ms(与输入同步脉冲同步)。
2、输入同步脉冲
周期6~8ms,脉冲宽度1~2us,TTL电平。
3、输入时钟脉冲
频率≤2MHz,占空比50%,TTL电平。
4、最高采样频率
2MHz
5、最大采样长度
4Kbyte
5、采样分辨率
8bit
第二章DSP原理
DSP包括数字信号处理技术(DSP,DigitalSignalProcessing)和数字信号处理器(DSP,DigitalSignalProcessor)。
本文中涉及的DSP均表示DigitalSignalProcessor,是数字信号处理技术实现的载体,正是这一处理器使信号的实时处理变成了现实。
§2.1DSP芯片技术概述
2.1.11DSP的总体认识
将计算机中央处理器CPU采用大规模集成电路技术集成到一块芯片上就得到微处理器,它标志第四代计算机——微型计算机的诞生,对计算机的普及起到了决定性作用。
随着集成技术的进一步提高,出现了将微处理器、一定容量的存储器和一部分接口电路等计算机的基本部件集成在一块芯片上的单片微型计算机,即单片机。
在微处理器由低档向高档发展的同时,单片机也在不断地发展,各种高性能的专用单片机逐步出现。
DSP就是在这时候出现的很具典型性的专用单片机,但由于它的专用性能的独特性,现在已很少称之为单片机。
DSP在组成上虽也包括一般计算机的基本组成部分,但它一个最明显的特征就是它采用了不同于一般计算机的总线结构——哈佛结构。
这种结构使得计算速度大幅提高,加之它的指令系统里有着专门用于信号处理的单周期指令和硬件乘法器,更进一步提高了它的运算速度。
因此在数字信号处理领域迅速得到了应用,日益扩大的应用反过来促进了DSP的迅速发展。
同时,DSP中的哈佛结构已扩展到了通用计算机中。
概括起来DSP具有如下的一些特点:
1、在一个指令周期内可完成一次乘法和一次加法;
2、程序和数据空间分开,可以同时访问指令和数据;
3、片内具有快速RAM,通常可通过独立的数据总线在两块中同时访问;
4、具有低开销或无开销循环及跳转的硬件支持;
5、快速的中断处理和硬件I/O支持;
6、具有在单周期内操作的多个硬件地址产生器;
7、可以并行执行多个操作;
8、支持流水线操作,使取指、译码和执行等操作可以重叠执行。
当然,与通用微处理器相比,DSP芯片的其他通用功能相对较弱些。
2.1.2DSP芯片的发展
世界上第一个单片DSP芯片应当是1978年AMI公司发布的S2811,而1979年美国Intel公司发布的商用可编程器件2920是DSP芯片的一个主要里程碑。
这两种芯片内部都没有现代DSP芯片所必须有的单周期乘法器。
1980年,日本NEC公司推出的μPD7720是第一个具有乘法器的商用DSP芯片。
在这之后,最成功的DSP芯片当数美国德州仪器公司(TexasInstruments,简称TI)的一系列产品。
TI公司在1982年成功推出其第一代DSP芯片TMS32010及其系列产品TMS32011、TMS320C10/C14/C15/C16/C17等,之后相继推出了第二代DSP芯片TMS32020、TMS320C25/C26/C28。
第三代DSP芯片TMS320C30/C31/C32,第四代DSP芯片TMS320C40/C44。
第五代DSP芯片TMS320C5X/C54X,第二代DSP芯片的改进型TMS320C2XX,集多片DSP芯片于一体的高性能DSP芯片TMS320C8X以及目前速度最快的第六代DSP芯片TMS320C62X/C67X等。
TI将常用的DSP芯片归纳为三大系列,即:
TMS320C2000系列(包括TMS320C2X/C2XX)、TMS320C5000系列(包括TMS320C5X/C54X/C55X)、TMS320C6000系列(TMS320C62X/C67X)。
如今,TI公司的一系列DSP产品已经成为当今世界上最有影响的DSP芯片。
TI公司也成为世界上最大的DSP芯片供应商,其DSP市场份额占全世界份额近50%。
第一个采用CMOS工艺生产浮点DSP芯片的是日本的Hitachi公司,它于1982年推出了浮点DSP芯片。
1983年日本Fujitsu公司推出的MB8764,其指令周期为120ns,且具有双内部总线,从而使处理吞吐量发生了一个大的飞跃。
而第一个高性能浮点DSP芯片应是AT&T公司于1984年推出的DSP32。
与其他公司相比,Motorola公司在推出DSP芯片方面相对较晚。
1986年,该公司推出了定点处理器MC56001。
1990年,推出了与IEEE浮点格式兼容的浮点DSP芯片MC96002。
美国模拟器件公司(AnalogDevices,简称AD)在DSP芯片市场上也占有一定的份额,相继推出了一系列具有自己特点的DSP芯片,其定点DSP芯片有ADSP2101/2103/2105、ASDP2111/2115、ADSP2161/2162/2164以及ADSP2171/2181,浮点DSP芯片有ADSP21000/21020、ADSP21060/21062等。
自1980年以来,DSP芯片得到了突飞猛进的发展,DSP芯片的应用越来越广泛。
从运算速度来看,MAC(一次乘法和一次加法)时间已经从20世纪80年代初的400ns(如TMS32010)降低到10ns以下(如TMS320C54X、TMS320C62X/67X等),处理能力提高了几十倍。
DSP芯片内部关键的乘法器部件从1980年的占模片区(diearea)的40%左右下降到5%以下,片内RAM数量增加一个数量级以上。
从制造工艺来看,1980年采用4μm的N沟道MOS(NMOS)工艺,而现在则普遍采用亚微米(Micron)CMOS工艺。
DSP芯片的引脚数量从1980年的最多64个增加到现在的200个以上,引脚数量的增加,意味着结构灵活性的增加,如外部存储器的扩展和处理器间的通信等。
此外,DSP芯片的发展使DSP系统的成本、体积、重量和功耗都有很大程度的下降。
表1.1则是世界上主要DSP芯片供应商的代表芯片的一些数据。
表1.2是TI公司DSP芯片1982年、1992年、1999年的比较表。
表1.1单片可编程DSP芯片
公司
DSP芯片
推出时间(年)
MAC周期(ns)
定点位数
浮点位数
AMI
S2811
1978
300
12/16
NEC
PD7720
PD77230
1980
1985
250
150
16/32
32
TI
TMS32010
TMS32020
TMS320C25
TMS320C30
TMS320C40
TMS320C50
TMS320C203
TMS320LC549
TMS320C62X
1982
1987
1989
1989
1992
1990
1996
1996
1997
390
200
100
60
40
35
12.5
10
5
16/32
16/32
16/32
24/32
32
16/32
16/32
16/32
16/32
32/40
40
Motorola
MC56001
MC96002
MC56002
1986
1990
1991
75
50
50
24
32/64
24/48
32/44
AT&T
DSP32C
DSP16A
DSP3210
1988
1988
1992
80
25
60
16或24
16/36
24
32/40
32/40
AD
ADSP2101
ADSP21020
1990
1991
60
40
16
32
32/40
表1.2TIDSP芯片发展比较表(典型值)
年份
1982年
1992年
1999年
制造工艺
4mNMOS
0.8mCMOS
0.3mCMOS
MIPS
5MIPS
40MIPS
100MIPS
MHz
20MHz
80MHz
100MHz
内部RAM
144字
1K字
32K字
内部ROM
1.5K字
4K字
16K字
价格
$150.00
$15.00
$5.00~$25.00
功耗
250mW/MIPS
12.5mW/MIPS
0.45mW/MIPS
集成晶体管数
50K
500K
2.1.3DSP芯片的分类
DSP芯片可以按照下列二种方式进行分类。
1、按数据格式分
这是根据DSP芯片工作的数据格式来分类的。
数据以定点格式工作的DSP芯片称为定点DSP芯片,如TI公司的TMS320C1X/C2X、TMS320C2XX/C5X、TMS320C54X/C62XX系列,AD公司的ADSP21XX系列,AT&T公司的DSP16/16A,Motolora公司的MC56000等。
以浮点格式工作的称为浮点DSP芯片,如TI公司的TMS320C3X/C4X/C8X,AD公司的ADSP21XXX系列,AT&T公司的DSP32/32C,Motolora公司的MC96002等。
不同浮点DSP芯片所采用的浮点格式不完全一样,有的DSP芯片采用自定义的浮点格式,如TMS320C3X,而有的DSP芯片则采用IEEE的标准浮点格式,如Motorola公司的MC96002、FUJITSU公司的MB86232和ZORAN公司的ZR35325等。
2、按用途分
按照DSP的用途来分,可分为通用型DSP芯片和专用型DSP芯片。
通用型DSP芯片适合普通的DSP应用,如TI公司的一系列DSP芯片属于通用型DSP芯片。
专用DSP芯片是为特定的DSP运算而设计的,更适合特殊的运算,如数字滤波、卷积和FFT,如Motorola公司的DSP56200,ZORAN公司的ZR34881,Inmos公司的IMSA100等就属于专用型DSP芯片。
§2.2DSP芯片的结构
DSP的独特性能源于它的独特结构,通过对它结构的剖析可进一步把握它的性能。
2.2.1哈佛结构
哈佛结构是不同于传统的冯·诺曼(VonNeuman)结构的并行体系结构,其主要特点是将程序和数据存储在不同的存储空间中,即程序存储器和数据存储器是两个相互独立的存储器,每个存储器独立编、独立访问。
与两个存储器相对应的是系统中设置了程序总线和数据总线两条总线,从而使数据的吞吐率提高了一倍。
而冯·诺曼结构则是将指令、数据、地址存储在同一存储器中,统一编址,依靠指令计数器提供的地址来区分是指令、数据还是地址。
取指令和取数据都访问同一存储器,数据吞吐率低。
在哈佛结构中,由于程序和数据存储器在两个分开的空间中,因此取指和执行能完全重叠运行。
2.2.2流水线
与哈佛结构相关,DSP芯片广泛采用流水线方式以减少指令执行时间,从而增强了处理器的处理能力。
例如TMS320系列处理器的流水线深度从2~6级不等。
第一代TMS320处理器采用二级流水线,第二代采用三级流水线,而第三代则采用四级流水线。
也就是说,处理器可以并行处理2~6条指令,每条指令处于流水线上的不同阶段。
图2.1所示为一个三级流水线操作的例子。
N+1
图2.3三级流水线操作
在三级流水线操作中,取指、译码和执行操作可以独立地处理,这可使指令执行能完全重叠。
在每个指令周期内,三个不同的指令处于激活状态,每个指令处于不同的阶段。
例如,在第N个指令取指时,前一个指令即第N-1个指令正在译码,而第N-2个指令则正在执行。
2.2.3专用的硬件乘法器
在一般形式的FIR滤波器和FFT运算中,乘法是DSP的重要组成部分。
对每个滤波器抽头,必须做一次乘法和一次加法。
乘法速度越快,DSP处理器的性能就越高。
在通用的微处理器中,乘法指令是由一系列加法来实现的,故需许多个指令周期来完成。
相比而言,DSP芯片的特征就是有一个专用的硬件乘法器,可以在一两个时钟内完成一次乘或乘加运算。
可使处理速度以数量级增长。
2.2.4特殊的DSP指令
前面也提到了DSP是一种专用的单片机,它的专就是擅长信号处理。
在DSP的指令系统里有专门用于信号处理的指令,这些指令有专门的硬件作支称,在别的计算机系统里需要一大段程序才能完成的任务,在DSP里只需一条指令就完成了。
2.2.5快速的指令周期
哈佛结构、流水线操作、专用的硬件乘法器、特殊的DSP指令再加上集成电路的优化设计,可使DSP芯片的指令周期在200ns以下。
TMS320系列处理器的指令周期已经从第一代的200ns降低至现在的20ns以下。
快速的指令周期使得DSP芯片能够实时实现许多DSP应用。
这几点是众多DSP芯片的共性,不同厂家的产品,同一厂家的不同代产品又各有特点,在这里没必要将它们的各自特点都罗列出来。
由于在本课题里涉及的是TI公司的C54X,下面就主要介绍C54X,这是一类很具代表性的芯片,从这里可以理解DSP的具体结构。
§2.3TI—C54X4简介
TMS320C54X是16-bit定点DSP,采用改进的哈佛结构。
C54有一组程序总线和三组数据总线,高度并行性的算术逻辑单元ALU、专用硬件逻、片内存储器