MIPS流水线CPU的verilog实现Word格式.docx
《MIPS流水线CPU的verilog实现Word格式.docx》由会员分享,可在线阅读,更多相关《MIPS流水线CPU的verilog实现Word格式.docx(49页珍藏版)》请在冰豆网上搜索。
BEQ、BNE、BGEZ、BGTZ、BLEZ、BLTZ。
(5)无条件跳转指令:
J、JR。
(6)数据传送指令:
LW、SW。
由于在流水线中,数据和控制信息将在时钟周期的上升沿转移到下一级,所以规定流水线转移变量命名遵守如下格式:
名称_流水线级名称
例如:
在ID级指令译码电路(Decode)产生的寄存器写允许信号RegWrite在ID级、EX级、MEM级和WB级上的命名分别为RegWrite_id、RegWrite_ex、RegWrite_mem和RegWrite_wb。
在顶层文件中,类似的变量名称有近百个,这样的命名方式起到了很好的识别作用。
1)流水线中的控制信号
(1)IF级:
取指令级。
从ROM中读取指令,并在下一个时钟沿到来时把指令送到ID级的指令缓冲器中。
该级控制信号决定下一个指令指针的PCSource信号、阻塞流水线的PC_IFwrite信号、清空流水线的IF_flush信号。
(2)ID级:
指令译码器。
对IF级来的指令进行译码,并产生相应的控制信号。
整个CPU的控制信号基本都是在这级上产生。
该级自身不需任何控制信号。
流水线冒险检测也在该级进行,冒险检测电路需要上一条指令的MemRead,即在检测到冒险条件成立时,冒险检测电路产生stall信号清空ID/EX寄存器,插入一个流水线气泡。
(3)EX级:
执行级。
该级进行算术或逻辑操作。
此外LW、SW指令所用的RAM访问地址也是在本级上实现。
控制信号有ALUCode、ALUSrcA、ALUScrB和RegDst,根据这些信号确定ALU操作、选择两个ALU操作数A、B,并确定目标寄存器。
另外,数据转发也在该级完成。
数据转发控制电路产生ForwardA和ForwardB两组控制信号。
(4)MEM级:
存储器访问级。
只有在执行LW、SW指令时才对存储器进行读写,对其他指令只起到一个周期的作用。
该级只需存储器写操作允许信号MemWrite。
(5)WB级:
写回级。
该级把指令执行的结果回写到寄存器文件中。
该级设置信号MemtoReg和寄存器写操作允许信号RegWrite,其中MemtoReg决定写入寄存器的数据来自于MEM级上的缓冲值或来自于MEM级上的存储器。
2)流水线冒险
在流水线CPU中,多条指令通知执行,由于各种各样的原因,在下一个时钟周期中下一条指令不能执行,这种情况称为冒险。
冒险分为三类:
①结构冒险:
硬件不支持多条指令在同一个时钟周期内执行。
MIPS指令集专为流水线设计,因此在MIPSCPU中不存在此类冒险。
②数据冒险:
在一个操作必须等待另一操作完成后才能进行时,流水线必须停顿,这种情况称为数据冒险。
数据冒险分为两类:
ⅰ数据相关:
流水线内部其中任何一条指令要用到任何其他指令的计算结果时,将导致数据冒险。
通常可以用数据转发(数据定向)来解决此类冒险。
ⅱ数据冒险:
此类冒险发生在当定向的目标阶段在时序上早于定向的源阶段时,数据转发无效。
通常是引入流水线阻塞,即气泡(bubble)来解决。
。
③控制冒险:
CPU需要根据分支指令的结果做出决策,而此时其他指令可能还在执行中,这时会出现控制冒险,也称为分支冒险。
解决此类冒险的常用方法是延迟分支。
2.1)数据相关与转发
下面通过具体例子来阐述数据相关。
见图3.2
图3.2数据相关性问题实例图
可见,后4条指令都依赖于第一条指令得到寄存器$2的结果,但sub指令要在第五周期才写回寄存器$2,但在第三、四、五个时钟周期$2分别要被and、or和add三个指令用到,所以这三个指令得到的是错误的未更新的数据,会引起错误的结果;
而第六个时钟周期$2要被sw指令用到,此时得到的才是正确的已更新的数据。
这种数据之间的互相关联引起的冒险就是数据相关。
可以看出,当一条依赖关系的方向与时间轴的方向相反时,就会产生数据冒险。
(1)一阶数据相关与转发(EX冒险)
首先讨论指令sub与and之间的相关问题。
sub指令在第五周期写回寄存器$2,而and指令在第四周期就对sub指令的结果$2提出申请,显然将得到错误的未更新的数据。
像这类第I条指令的源操作寄存器与第I-1条指令(即上一条指令)的目标寄存器相重,导致的数据相关称为一阶数据相关。
见图3.3中实线所示。
图3.3一阶数据相关实例图
可以发现,sub指令的结果其实在EX级结尾,即第三周期末就产生了;
而and指令在第四时钟周期向sub指令结果发出请求,请求时间晚于结果产生时间,所以只需要sub指令结果产生之后直接将其转发给and指令就可以避免一阶数据相关。
如图3.3虚线所示。
转发数据为ALUResult_mem
数据转发由Forwardingunit单元控制,判断转发条件是否成立。
转发机制硬件实现见图3.4
图3.4转发机制的硬件实现
转发条件ForwardA、ForwardB作为数据选择器的地址信号,转发条件不成立时,ALU操作数从ID/EX流水线寄存器中读取;
转发条件成立时,ALU操作数取自数据旁路。
转发条件:
1MEM级指令是写操作,即RegWrite_mem=1;
2MEM级指令写回的目标寄存器不是$0,即RegWriteAddr_mem≠0;
3MEM级指令写回的目标寄存器与在EX级指令的源寄存器是同一寄存器,即RegWriteAddr_mem=RsAddr_ex或RegWriteAddr_mem=RtAddr_ex。
(2)二阶数据相关与转发(MEM冒险)
接下来讨论sub指令与or指令之间的相关问题。
sub指令在第5时钟周期写回寄存器,而or指令也在第5时钟周期对sub指令的结果提出了请求,很显然or指令读取的数据是未被更新的错误内容。
这类第I条指令的源操作寄存器与第I-2条指令(即之上第二条指令)的目标寄存器相重,导致的数据相关称为二阶数据相关。
见图3.5中实线所示。
图3.5一阶数据相关实例图
如前所述,or指令在第五时钟周期向sub指令结果发出请求时,sub指令的结果已经产生。
所以,我们同样采用“转发”,即通过MEM/WB流水线寄存器,将sub指令结果转发给or指令,而不需要先写回寄存器堆。
如图3.5中虚线所示。
转发数据为RegWriteData_wb
1WB级指令是写操作,即RegWrite_wb=1;
2WB级指令写回的目标寄存器不是$0,即RegWriteAddr_wb≠0;
3WB级指令写回的目标寄存器与在EX级指令的源寄存器是同一寄存器,即RegWriteAddr_wb=RsAddr_ex或RegWriteAddr_wb=RtAddr_ex;
4EX冒险不成立,即RegWriteAddr_mem≠RsAddr_ex或RegWriteAddr_mem=RtAddr_ex。
(3)三阶数据相关与转发
最后讨论sub指令与add指令之间的相关问题。
sub指令与add指令在第五时钟周期内同时读写同一个寄存器。
这类同一周期内同时读写同一个寄存器的数据相关称之为三阶数据相关。
如图3.6中实线所示。
图3.6三阶数据相关实例图
假设寄存器的写操作发生在时钟周期的上升沿,而读操作发生在时钟周期的下降沿,那么读操作将读取到最新写入的内容。
在这种假设条件下将不会发生数据冒险。
这就要求流水线中的寄存器具有“先写后读(ReadAfterWrite)”的特性。
这类“写操作发生在时钟周期的上升沿,读操作发生在时钟周期的下降沿”的寄存器虽然在理论上是可实现的,但是不适合应用于同步系统,因为它不但影响系统的运行速度,而且影响系统的稳定性,是不可取的。
因此,我们采用“转发”机制来解决三阶数据相关冒险。
该部分转发电路我们放在寄存器堆的设计中完成。
如图3.6中虚线所示。
转发数据为RegWriteData_wb。
转发条件为:
3WB级指令写回的目标寄存器与在ID级指令的源寄存器是同一寄存器,即RegWriteAddr_wb=RsAddr_id或RegWriteAddr_wb=RtAddr_id。
2.2)数据冒险与阻塞
当一条指令试图读取一个寄存器,而它前一条指令是lw指令,并且该lw指令写入的是同一个寄存器时,定向转发的方法就无法解决问题。
如图3.7所示
这类冒险不同于数据相关冒险,需要单独一个“冒险检测单元(HazardDetector)”,它在ID级完成。
冒险成立的条件为:
1上一条指令是lw指令,即MemRead_ex=1;
2在EX级的lw指令与在ID级的指令读写的是同一个寄存器,即RegWriteAddr_ex=RsAddr_id或RegWriteAddr_ex=RtAddr_id。
冒险的解决:
为解决数据冒险,我们引入流水线阻塞。
当HazardDetector检测到冒险条件成立时,在lw指令和下一条指令之间插入阻塞,即流水线气泡(bubble),使后一条指令延迟一个时钟周期执行,这样就将该冒险转化为二阶数据相关,可用转发解决。
如图3.8所示。
图3.8流水线气泡的引入
需要注意的是,如果处于ID级的指令被阻塞,那么处于IF级的指令也必须阻塞,否则,处于ID级的指令就会丢失。
防止这两条指令继续执行的方法是:
保持PC寄存器和IF/ID流水线寄存器不变,同时插入一个流水线气泡。
具体实现方法如下:
在ID级检测到冒险条件时,HazardDetector输出两个信号:
Stall与PC_IFWrite。
Stall信号将ID/EX流水线寄存器中的EX、MEM和WB级控制信号全部清零。
这些信号传递到流水线后面的各级,由于控制信号均为零,所以不会对任何寄存器和存储器进行写操作,高电平有效。
PC_IFWrite信号禁止PC寄存器和IF/ID流水线寄存器接收新数据,低电平有效。
2.3)分支冒险
还有一类冒险是包含分支的流水线冒险,下图。
图3.10分支冒险实例
流水线每个时钟周期都得取指令才能维持运行,但分支指令必须等到MEM级才能确定是否执行分支。
这种为了确定预取正确的指令而导致的延迟叫做控制冒险或分支冒险。
一种比较普遍的提高分支阻塞速度的方法是假设分支不发生,并继续执行顺序的指令流。
如果分支发生的话,就丢弃已经预取并译码的指令,指令的执行沿着分支目标继续。
由于分支指令直到MEM级才能确定下一条指令的PC,这就意味着为了丢弃指令必须将流水线中的IF、ID和EX级的指令都清除掉(flush)。
这种优化方法的代价较大,效率较低。
如果我们能在流水线中提前分支指令的执行过程,那么就能减少需要清除的指令数。
这是一种提高分支效率的方法,降低了执行分支的代价。
因此我们采用提前分支指令的方法解决分支冒险。
提前分支指令需要提前完成两个操作:
1计算分支的目的地址:
由于已经有了PC值和IF/ID流水线寄存器中的指令值,所以可以很方便地将EX级的分支地址计算电路移到ID级。
我们针对所有指