高通FIR数字滤波器设计verilog要点.docx

资源描述

高通FIR数字滤波器设计verilog要点.docx

《高通FIR数字滤波器设计verilog要点.docx》由会员分享，可在线阅读，更多相关《高通FIR数字滤波器设计verilog要点.docx（19页珍藏版）》请在冰豆网上搜索。

高通FIR数字滤波器设计verilog要点.docx

高通FIR数字滤波器设计verilog要点

电子科技大学

ASIC课程设计报告二

学号：

201222240937

姓名：

周恒

课题题目：

高通FIR数字滤波器设计

2013年5月

FIR数字滤波器设计

已知FIR型数字滤波器的z域系统函数为：

即：

要求如下：

•设计平台：

基于QuartusII或ISE平台，选择AlteraCycloneII系列的EP2C8F256C8或XilinxSparten3系列的XC3S400（PQ208）；

•testbench的信号输入激励源使用Matlab生成三角波信号；

•输入位宽16位，输出位宽24位，中间级可自行截位；

v设计

（1）直接型FIR设计

画出直接实现结构的框图，完成其verilogHDL电路描述及testbench，完成功能仿真和时序仿真，给出仿真波形图；

一、直接型结构框图如下：

长度为M的因果有限冲激响应滤波器由传输函数H（z）描述：

（1）

它是次数为M-1的z-1的一个多项式。

在时域中，上述有限冲激响应滤波器的输入输出关系为：

（2）

其中y（n）和x（n）分别是输出和输入序列。

有限冲激响应滤波器的一种直接型实现，可由式

（2）生成，M=5的情况如上图所示。

通常一个长度为M的有限冲激响应滤波器由M个系数描述，并且需要M个乘法器和（M-1）个双输入加法器来实现。

本设计包含的模块有4个16位寄存器块、5个16位乘法器、4个32位加法器模块

用QuartusII综合，顶层模块框图如下：

1、寄存器模块

寄存器用于寄存一组二值代码，只要求它们具有置1、置0的功能即可。

在本设计中用D触发器组成寄存器，实现寄存功能。

本设计中使用带异步复位reset_n端的D触发器，当reset_n=1时，输出信号q_out=d_in，当reset_n=0且上升沿脉冲到达时q_out=0。

其综合框图部分截图如下图所示。

●程序代码如下：

moduledff16（reset_n,clk,d_in,q_out）;

inputreset_n,clk;

input[15:

0]d_in;

outputreg[15:

0]q_out;

always@（posedgeclkornegedgereset_n）

begin

if（!

reset_n）

q_out<=16'h0;

else

q_out<=d_in;

end

endmodule

在顶层文件中例化了D1、D2、D3、D4四个寄存器模块

dff16D1（.reset_n（reset_n）,.clk（clk）,.d_in（x_in）,.q_out（q1））,

D2（.reset_n（reset_n）,.clk（clk）,.d_in（q1）,.q_out（q2））,

D3（.reset_n（reset_n）,.clk（clk）,.d_in（q2）,.q_out（q3））,

D4（.reset_n（reset_n）,.clk（clk）,.d_in（q3）,.q_out（q4））;

2、乘法器模块

从资源和速度考虑，常系数乘法运算可用移位相加来实现。

本设计采用加法树乘法器兼顾了资源与速度，将每个乘数例化了一个数组，然后移位相加得出乘积，这样使得乘法运算可以一个周期内完成。

●程序代码如下：

modulemult16（outcome,a,b）;

input[15:

0]a,b;

outputwire[31:

0]outcome;

wire[30:

0]temp0;

wire[29:

0]temp1;

wire[28:

0]temp2;

wire[27:

0]temp3;

wire[26:

0]temp4;

wire[25:

0]temp5;

wire[24:

0]temp6;

wire[23:

0]temp7;

wire[22:

0]temp8;

wire[21:

0]temp9;

wire[20:

0]temp10;

wire[19:

0]temp11;

wire[18:

0]temp12;

wire[17:

0]temp13;

wire[16:

0]temp14;

wire[15:

0]temp15;

function[15:

0]mult16x1;

input[15:

0]operand;

inputsel;

begin

mult16x1=（sel）?

（operand）:

15'b0;

end

endfunction

assigntemp15=mult16x1（a,b[0]）;

assigntemp14=（（mult16x1（a,b[1]））<<1）;

assigntemp13=（（mult16x1（a,b[1]））<<2）;

assigntemp12=（（mult16x1（a,b[1]））<<3）;

assigntemp11=（（mult16x1（a,b[1]））<<4）;

assigntemp10=（（mult16x1（a,b[1]））<<5）;

assigntemp9=（（mult16x1（a,b[1]））<<6）;

assigntemp8=（（mult16x1（a,b[1]））<<7）;

assigntemp7=（（mult16x1（a,b[1]））<<8）;

assigntemp6=（（mult16x1（a,b[1]））<<9）;

assigntemp5=（（mult16x1（a,b[2]））<<10）;

assigntemp4=（（mult16x1（a,b[3]））<<11）;

assigntemp3=（（mult16x1（a,b[4]））<<12）;

assigntemp2=（（mult16x1（a,b[5]））<<13）;

assigntemp1=（（mult16x1（a,b[6]））<<14）;

assigntemp0=（（mult16x1（a,b[7]））<<15）;

wire[31:

0]out1,c1,d1;

wire[29:

0]out2;

wire[27:

0]out3,c2;

wire[25:

0]out4;

wire[23:

0]out5,c3,d2;

wire[21:

0]out6;

wire[19:

0]out7,c4;

wire[17:

0]out8;

assignout1=temp0+temp1;

assignout2=temp2+temp3;

assignout3=temp4+temp5;

assignout4=temp6+temp7;

assignout5=temp8+temp9;

assignout6=temp10+temp11;

assignout7=temp12+temp13;

assignout8=temp14+temp15;

assignc1=out1+out2;

assignc2=out3+out4;

assignc3=out5+out6;

assignc4=out7+out8;

assignd1=c1+c2;

assignd2=c3+c4;

assignoutcome=d1+d2;

endmodule

其综合框图部分截图如下图所示。

本设计例化了5个乘法器分别为m0,m1,m2,m3,m4.

mult16m0（.outcome（mout0）,.a（x_in）,.b（8'd2））,

m1（.outcome（mout1）,.a（q1）,.b（8'd7））,

m2（.outcome（mout2）,.a（q2）,.b（8'd8））,

m3（.outcome（mout3）,.a（q3）,.b（8'd7））,

m4（.outcome（mout4）,.a（q4）,.b（8'd2））;

3、加法器模块

由于本设计只涉及到相加，而没有减法，所以本加法器实现两个32位无符号数的相加运算。

即将输入的两数，在时钟脉冲到来时相加运算，输出结果。

由于加法器相对于乘法器等模块占用的资源少，所以本设计没有再单独设计加法器，而是直接综合出加法器。

●程序代码如下：

moduleadd32（a,b,out）;

input[31:

0]a,b;

output[34:

0]out;

assignout=a+b;

endmodule

在本设计中共有4个加法器a1,a2,a3,a4

add32a1（.a（mout0）,.b（mout1）,.out（aout1））,

a2（.a（aout1）,.b（mout2）,.out（aout2））,

a3（.a（aout2）,.b（mout3）,.out（aout3））,

a4（.a（aout3）,.b（mout4）,.out（aout4））;

二、波形仿真

首先用Matlab产生一个周期为16点位宽为16位三角波：

n=1:

x1（n）=n-1;

n=8:

15;

x1（n）=15-n;

x1=x1*100;

x2=uint16（x1）;

fid=fopen（'E:

/CX/Verilog/design/FIR/FIR1/tri.txt','wt+'）;

fprintf（fid,'%x\n',x2）;

fclose（fid）;

产生的三角波如下：

n=1:

15;

subplot（3,1,1）;

stem（n,x1）;

subplot（3,1,2）;

x1fft=fft（x1）;

stem（n,abs（x1fft））;

三角波时域图

三角波频域图

通过testbench模块将Matlab产生的测试数据tri.txt，将各个模块添加到顶层图中联合测试，最终实现所需要的功能。

测试代码如下所示：

`timescale1ns/1ps

`defineclock50

moduletest;

regclk,reset_n;

reg[15:

0]x_in;

reg[15:

0]data_mem[0:

15];

integeri;

wire[23:

0]y_out;

always#`clockclk=~clk;

initial

begin

clk=0;

reset_n=1;

#20reset_n=0;

#10reset_n=1;

end

initial

begin

$readmemh（"tri.txt",data_mem）;

end

always@（posedgeclkornegedgereset_n）

begin

if（!

reset_n）begin

x_in<=15'b0;

i<=0;

end

elseif（i<=13）begin

x_in<=data_mem[i];

i<=i+1;

end

elsebegin

x_in<=data_mem[i];

i<=0;

end

fir_topfir（.reset_n（reset_n）,.clk（clk）,.x_in（x_in）,.y_out（y_out））;

endmodule

产生的仿真波形如下图所示：

v设计

（2）直接型流水线FIR设计

对上述直接实现结构的FIR数字滤波器给出几种使用流水线方法实现的结构

框图，并选择其中一种流水线型FIR数字滤波器进行verilogHDL电路描述及相应testbench，完成功能仿真及时序仿真，给出仿真波形图；

直接型二级流水线结构FIR：

直接型三级流水线结构FIR：

一、流水线设计

以二级流水线为例，在乘法器与加法器中间插入一级寄存器，将电路分为两级，这样可以增加电路的吞吐能力，并且降低了功耗。

电路实现：

在前面直接型结构的基础上，在乘法器模块和加法器模块之间加一级寄存器模块。

1.位寄存器模块

●程序代码如下：

modulereg32（clk,reset_n,in,out）;

inputclk,reset_n;

input[31:

0]in;

output[31:

0]out;

reg[31:

0]out;

always@（posedgeclkornegedgereset_n）

begin

if（!

reset_n）

out<=31'd0;

else

out<=in;

end

endmodule

本设计例化了5个32位寄存器，分别为r0,r1,r2,r3,r4.

reg32r0（.clk（clk）,.reset_n（reset_n）,.in（mout0）,.out（re0））,

r1（.clk（clk）,.reset_n（reset_n）,.in（mout1）,.out（re1））,

r2（.clk（clk）,.reset_n（reset_n）,.in（mout2）,.out（re2））,

r3（.clk（clk）,.reset_n（reset_n）,.in（mout3）,.out（re3））,

r4（.clk（clk）,.reset_n（reset_n）,.in（mout4）,.out（re4））;

其综合后的结构框图如下图所示：

2.流水线顶层模块

加入流水线后，顶层模块代码如下：

modulefir_top（reset_n,clk,x_in,y_out）;

inputclk,reset_n;

input[15:

0]x_in;

output[23:

0]y_out;

wire[15:

0]q1,q2,q3,q4;

wire[31:

0]mout0,mout1,mout2,mout3,mout4;

wire[31:

0]re0,re1,re2,re3,re4;

wire[34:

0]aout1,aout2,aout3,aout4;

dff16D1（.reset_n（reset_n）,.clk（clk）,.d_in（x_in）,.q_out（q1））,

D2（.reset_n（reset_n）,.clk（clk）,.d_in（q1）,.q_out（q2））,

D3（.reset_n（reset_n）,.clk（clk）,.d_in（q2）,.q_out（q3））,

D4（.reset_n（reset_n）,.clk（clk）,.d_in（q3）,.q_out（q4））;

mult16m0（.outcome（mout0）,.a（x_in）,.b（8'd2））,

m1（.outcome（mout1）,.a（q1）,.b（8'd7））,

m2（.outcome（mout2）,.a（q2）,.b（8'd8））,

m3（.outcome（mout3）,.a（q3）,.b（8'd7））,

m4（.outcome（mout4）,.a（q4）,.b（8'd2））;

reg32r0（.clk（clk）,.reset_n（reset_n）,.in（mout0）,.out（re0））,

r1（.clk（clk）,.reset_n（reset_n）,.in（mout1）,.out（re1））,

r2（.clk（clk）,.reset_n（reset_n）,.in（mout2）,.out（re2））,

r3（.clk（clk）,.reset_n（reset_n）,.in（mout3）,.out（re3））,

r4（.clk（clk）,.reset_n（reset_n）,.in（mout4）,.out（re4））;

add32a1（.a（re0）,.b（re1）,.out（aout1））,

a2（.a（aout1）,.b（re2）,.out（aout2））,

a3（.a（aout2）,.b（re3）,.out（aout3））,

a4（.a（aout3）,.b（re4）,.out（aout4））;

assigny_out=aout4[34:

11];

endmodule

用QuartusII综合出的框图截图如下：

二、波形仿真

首先用Matlab产生一个周期为16点位宽为16位三角波：

n=1:

x1（n）=n-1;

n=8:

15;

x1（n）=15-n;

x1=x1*100;

x2=uint16（x1）;

fid=fopen（'E:

/CX/Verilog/design/FIR/FIR2/tri.txt','wt+'）;

fprintf（fid,'%x\n',x2）;

fclose（fid）;

产生的三角波如下：

n=1:

15;

subplot（3,1,1）;

stem（n,x1）;

subplot（3,1,2）;

x1fft=fft（x1）;

stem（n,abs（x1fft））;

三角波时域图

三角波频域图

通过testbench模块将Matlab产生的测试数据tri.txt，将各个模块添加到顶层图中联合测试，最终实现所需要的功能。

测试代码如下所示：

`timescale1ns/1ps

`defineclock50

moduletest;

regclk,reset_n;

reg[15:

0]x_in;

reg[15:

0]data_mem[0:

15];

integeri;

wire[23:

0]y_out;

always#`clockclk=~clk;

initial

begin

clk=0;

reset_n=1;

#20reset_n=0;

#10reset_n=1;

end

initial

begin

$readmemh（"tri.txt",data_mem）;

end

always@（posedgeclkornegedgereset_n）

begin

if（!

reset_n）begin

x_in<=15'b0;

i<=0;

end

elseif（i<=13）begin

x_in<=data_mem[i];

i<=i+1;

end

elsebegin

x_in<=data_mem[i];

i<=0;

end

fir_topfir（.reset_n（reset_n）,.clk（clk）,.x_in（x_in）,.y_out（y_out））;

endmodule

产生的仿真波形如下图所示：

v直接结构的FIR数字滤波器流水线型FIR数字滤波器进行性能比较。

直接型FIR资源消耗情况流水线型FIR资源消耗情况

流水线型需要的寄存器数量为165个，是直接型的64个的两倍多。

流水线型消耗了更多的资源。

速度对比：

直接型FIR速度情况

流水线型FIR速度情况

QuartusII的速度分析结果，采样流水线型，速度反而降低了！

展开阅读全文