常用数字处理算法的Verilog实现Word格式文档下载.docx

资源描述

常用数字处理算法的Verilog实现Word格式文档下载.docx

《常用数字处理算法的Verilog实现Word格式文档下载.docx》由会员分享，可在线阅读，更多相关《常用数字处理算法的Verilog实现Word格式文档下载.docx（16页珍藏版）》请在冰豆网上搜索。

常用数字处理算法的Verilog实现Word格式文档下载.docx

在使用了并行加法器后，仍旧只有在输出稳定后才能输入新的数进行下一次计算，即计算的节拍必须大于运算电路的延迟；

此外，许多门级电路和布线的延迟会随着位数的增加而累加，因此加法器的频率还是受到了限制。

但如果采用流水线，就有可能将一个算术操作分解为一些小规模的基本操作，将进位和中间值存储在寄存器中，并在下一个时钟周期内继续运算，这样就可以提高电路的利用效率。

将流水线规则应用于FPGA中，只需要很少或根本不需要额外的成本。

这是因为每个逻辑单元都包含两个触发器，大多数情况下这两个触发器或者没有用到，或者用于存储布线资源，那么就可以利用其来实现流水线结构。

如果采用了流水线后，加法器的速度仍然不能满足需要的话，可以采用第3章中将会提到的串并转换来进一步提高计算的并行度。

由于一个slice中有两个触发器，还需要有1个触发器来作为进位输出，那么采用级流水线，就可以构造一个最大位数为位的加法器。

下面给出一个16位流水线加法器的代码。

例2-2416位2级流水线加法器的Verilog设计

moduleadder16_2（cout,sum,clk,cina,cinb,cin）;

input[15:

0]cina,cinb;

inputclk,cin;

output[15:

0]sum;

outputcout;

regcout;

regcout1;

reg[7:

0]sum1;

reg[15:

always@（posedgeclk）begin//低8位相加;

{cout1,sum1}={cina[7],cina[7:

0]}+{cinb[7],cinb[7:

0]}+cin;

end

always@（posedgeclk）begin//高8位相加，并连成16位

{cout,sum}={{cina[15],cina[15:

8]}+{cinb[15],cinb[15:

8]}+cout1,sum1};

endmodule

上述程序经过synplifyPro综合后，得到如图2-22所示的RTL级结构图。

2-2216位加法器的RTL结构图

在ModelSim6.2b中完成仿真，其结果如图2-23所示，正确地实现了16比特加法。

图2-2316位加法器的RTL结构图

2．乘法器的Verilog实现

∙串行乘法器

两个N位二进制数x、y的乘积，最简单的方法就是利用移位操作来实现，用公式可以表示为：

（2.3）

这样输入量随着k的位置连续地变化，然后累加

。

例2-25用Verilog实现一个8位串行乘法器

moduleade（clk,x,y,p）;

inputclk;

input[7:

0]x,y;

output[15:

0]p;

reg[15:

parameters0=0,s1=1,s2=2;

reg[2:

0]count;

reg[1:

0]state;

0]p1,t;

//比特位加倍

reg[7:

0]y_reg;

always@（posedgeclk）begin

case（state）

s0:

begin//初始化

y_reg<

=y;

state<

=s1;

count=0;

p1<

=0;

={{8{x[7]}},x};

end

s1:

begin//处理步骤

if（count==7）//判断是否处理结束

=s2;

elsebegin

if（y_reg[0]==1）

p1<

=p1+t;

=y_reg>

//移位

=t<

count<

=count+1;

s2:

begin

=p1;

state<

=s0;

endcase

上述程序在SynplifyPro中综合后，得到如图2-24所示的RTL级结构示意图。

图2-24串行乘法器的RTL结构图

图2-25给出了串行乘法器模块在ModelSim中的仿真结果，验证了功能的正确性。

图2-25串行乘法器的局部仿真结果示意图

从仿真结果可以看出，上述串行乘法器，速度比较慢，时延很大，但这种乘法器的优点是所占用的资源是所有类型乘法器中最少的，在低速的信号处理中有着广泛的应用。

∙流水线乘法器

一般的快速乘法器通常采用逐位并行的迭代阵列结构，将每个操作数的N位都并行地提交给乘法器。

但是一般对于FPGA来讲，进位的速度快于加法的速度，这种阵列结构并不是最优的。

所以可以采用多级流水线的形式，将相邻的两个部分乘积结果再加到最终的输出乘积上，即排成一个二叉树形式的结构，这样对于N位乘法器需要log2（N）级来实现。

一个8位乘法器，如图2-26所示。

图2-26流水线乘法器结构图

例2-26用VerilogHDL实现一个4位的流水线乘法器

modulemul_addtree（mul_a,mul_b,mul_out,clk,rst_n）;

parameterMUL_WIDTH=4;

parameterMUL_RESULT=8;

input[MUL_WIDTH-1:

0]mul_a;

0]mul_b;

inputclk;

inputrst_n;

output[MUL_RESULT-1:

0]mul_out;

reg[MUL_RESULT-1:

0]stored0;

0]stored1;

0]stored2;

0]stored3;

0]add01;

0]add23;

always@（posedgeclkornegedgerst_n）

if（!

rst_n）

begin//初始化寄存器变量

mul_out<

=8'

b0000_0000;

stored0<

stored1<

stored2<

stored3<

add01<

add23<

else

begin//实现移位相加

=mul_b[3]?

{1'

b0,mul_a,3'

b0}:

b0;

=mul_b[2]?

{2'

b0,mul_a,2'

=mul_b[1]?

{3'

b0,mul_a,1'

=mul_b[0]?

{4'

b0,mul_a}:

add01<

=stored1+stored0;

add23<

=stored3+stored2;

=add01+add23;

上述程序在SynplifyPro软件中综合后，得到如图2-27所示的RTL级结构示意图。

图2-27流水线乘法器的RTL结构示意图

图2-28给出了流水线乘法器模块在ModelSim中的仿真结果，验证了功能的正确性。

图2-28流水线乘法器的局部仿真结果示意图

从仿真结果可以看出，上述流水线乘法器比串行加法器的速度快很多，在非高速的信号处理中有着广泛的应用。

至于高速信号的乘法一般需要利用FPGA芯片中内嵌的硬核DSP单元来实现。

3．无符号除法器的Verilog实现

两个无符号二进制数（如正整数）相除的时序算法是通过“减并移位”的思想来实现的，即从被除数中重复地减去除数，直到已检测到余数小于除数。

这样可以通过累计减法运算的次数而得到商；

而余数是在减法运算结束时被除数中的剩余值。

当除数较小时，这种基本电路都必须进行多次减

展开阅读全文