1、实际上,结构相关、控制相关、数据相关的检测都可归入译码局部。考虑到“相关检测涉及到的信号分属不同阶段以及整体结构的清晰性,我们将“相关检测独立出来。执行模块Ex:完成算术逻辑运算、计算有效地址和提供数据通道。访存模块Ma:选择地址线的数据来源和数据线的流向。访存和取指在功能上是独立的,但CPU对外只有一条地址线和数据线的事实决定了访存和取指是相互联系的。当执行LOAD/STORE指令时,地址线由ALU送入“访存段的值提供;取指时,那么由PC提供。当写内存时,CPU内部数据送数据线;当需要读内存时,CPU往数据线送高阻。回写模块Wb:选择回写数据源和根据写使能信号wRegEn将数据回写到存放器堆
2、;HazardDetectUnit模块:检测结构相关;ForwardingUnit模块:检测数据相关。内存模块memory,根据访存地址mem_adr和读写信号wr来控制。3 解决各种相关用到的主要信号的分析3.1控制相关 控制相关是指因为程序的执行方向可能改变而引起的相关。当执行跳转指令时,就会发生这种情况。除JR外,JRZ等条件跳转需要根据当前状态位来决定是否跳转,而当前状态位是由前面最近的会影响状态位的指令如算术指令决定。常规的也是比较简单的做法是在碰到JRX之类的跳转指令时,延迟后边流水线的进入。但我们通过分析,认为可以一点都不必延迟,通过旁路处理把控制相关转为数据相关来处理。这样处理
3、,不必延迟,可以提高流水线的性能。按我们的方式解决控制相关需要做两项工作:1)通过旁路,提供状态存放器的值和临时状态位的值,为判断是否跳转作准备;2)选择PC更新的时机1旁路处理在每条指令译码时,会产生一个信号setFlag,它决定了在执行阶段是否根据ALU计算结果改变状态位。从下面的时序图中可以发现,只要我们在JRX指令译码时提供以下3个信号就可作出是否跳转的决定:信号含义tFlagALU计算出的临时状态位,Flag状态存放器输出,e_setFlag状态存放器写使能表17 处理控制相关信号假设e_setFlag要写状态存放器,那么说明前一条指令会影响状态位,这时根据tFlag决定是否跳转;假
4、设e_setFlag要保持状态存放器,那么说明前一条指令不会影响状态位,这时根据Flag决定是否跳转。涉及到控制相关的关键信号是setFlag信号,产生于译码模块,作用于执行模块,即identity.vhdhe exentity.vhd文件中。如以下图所示。从上图可看出,但凡涉及到数值计算和关系运算的指令的低三位均为001,而不涉及的那么为000。该信号传到执行模块中用于判断是否更新状态存放器。3.2 数据相关数据相关是指在执行本条指令的过程中,如果用到的操作数是前面指令的执行结果,那么必须等待前面的指令执行完成,并把结果写回存放器或主存之后,本条指令才能继续执行。此处采用设置专用数据通路来解
5、决数据相关问题。但旁路技术并非一劳永逸。假设前一指令为LOAD,而后一指令和它数据相关,如以下图所示,当下一指令的执行阶段需要数据时,上一指令尚未给出,这种情况是无法用旁路技术来解决的。相关的类型有三种:1.2.3.主要用到的关键信号是m_wRegEn和w_wRegEn,主要使用是在数据相关检测模块forwardingentity.vhd中,在identity.vhd、exentity.vhd、memaccessentity.vhd中均有使用。具体的使用方法如下。相关的检测都置于“执行阶段。信号wRegEn是存放器写使能,SA,SB是存放器组A,B口选择信号。信号前缀表示信号所处的阶段。如e_
6、SA表示处于执行阶段的SA。1相邻指令数据相关的检测 假设m_wRegEn=1,那么表示前一指令要回写存放器。此时,假设e_SA或e_SB等于m_SA,那么必然数据相关,这是因为我们规定,假设回写存放器,那么存放器A口选择信号所指定的即为目的存放器。否那么无关。2中间隔1条指令的两指令数据相关的检测 假设w_wRegEn=1,那么表示第一条指令要回写存放器。此时,假设e_SA或e_SB等于w_SA,那么必然数据相关。当然,上述两种情况可能会一同出现。这时,我们就按情况1处理。因为情况2可以理解为接连出现情况1。以下图为各个指令在译码时产生的wRegEn信号,可以发现但凡会写进存放器的指令,该信
7、号值都为1。3.3 结构相关由于在设计中不包含缓存,因此会有取指和访存的冲突,即结构相关。如以下图:关键信号是wrMem信号,表示是否读写内存。具体出现在结构相关冲突检测与问题解决模块Hazarddetectentity.vhd中,产生于译码模块identity.vhd中。具体使用方法如下:1)冲突检测只有执行访存指令(LOAD/STORE)时,才会出现冲突。因此,我们在译码时产生一个标志是否访存的信号wrMem。含义如下:wrMem意义00写内存STORE01读内存LOAD1不占用内存 表16 wMEM控制信号通过检查“访存阶段的m_wrMem就可确定是否冲突。2取指延后在每次取指时,假设有
8、冲突,那么往IR中写入空指令(NOP),并保持PC不变,使取指延后一个节拍。4 各流水段功能和实现的详细分析4.1取指(IF)4.1.1 实现功能列表取指模块实现的功能是:给定内存地址,读取内存中的指令将指令送入指令存放器,提供给下一级的译码模块实现控制相关冲突检测根据读取到的指令是否为跳转指令来更新PC4.1.2输入、输出信号分析主要输入信号:Z,C状态存放器tempZ,tempCALU计算出的临时状态位,用于相关冲突检测状态存放器写使能端,产生于译码时。决定是否在执行阶段根据ALU计算出来的结果改变状态位PCStall决定是否保持PC不变,由结构相关冲突检测模块产生IFFlush决定是否往
9、指令存放器IR里写入空指令,来自结构相关检测模块OuterDB内存读取过来的数据主要输出信号:PC_addrPC作为内存地址输出,用于下一节拍的取指d_PCInc1PC + 1d_IR指令存放器输出 4.1.3功能实现逻辑通过分析控制信号我们可以大概了解到取指模块的功能实现逻辑是如何的。广义上来说,取指模块包括结构相关冲突检测模块,因为PCStall信号(用来实现IF段对PC的更新)和IFFlush信号(对IR写入空指令)就来自结构相关冲突检测模块。结构相关检测模块叫HazardDetectEntity,其模块图如下:其中输入信号的含义是:m_wrMemwrMem在访存阶段的值w_rwMemw
10、rMem在写回阶段的值指令存放器通过检测访存阶段的wrMem信号即可确定是否发生了结构冲突。每次取指后,假设有冲突,那么往IR中写入空指令NOP,并保持PC不变,使得取指延后一个节拍。除此之外,setFlag信号在此处的作用是,决定用状态存放器输出Flag还是ALU计算出的临时状态位tFlag来判断跳转。4.2译码(ID)4.2.1 实现功能列表译码模块实现的功能是:读取指令存放器中的指令对指令进行译码,发送控制信号4.2.2输入、输出信号分析从取指模块来的指令从取指模块来的pc+1w_wbData写回数据,从写回模块里来w_destReg要写回的目标存放器w_wRegEn存放器写使能端e_R
11、AOut存放器A输出值e_RBOut存放器B输出值e_IMM立即数输出值e_ALUSrcALU输入端选择信号e_ALUOprALU运算选择信号e_SetFlag状态存放器写使能信号e_wrMem访存信号e_wRegEn存放器写使能信号e_destReg目标存放器e_MemToReg内存写入存放器使能信号4.2.3功能实现逻辑译码模块内部写好了根据不同的指令发送不同的控制信号的代码,采取一次译码,逐级传递的方式,译出后几级流水所需的控制信号和数据如立即数。在每次时钟上升沿到来时送入下一级。考虑到“相关检测涉及到的信号分属不同阶段以及整体结构的清晰性,作者将“相关检测独立出来。4.3执行(EX)4
12、.3.1 实现功能列表执行模块实现的功能是:根据控制信号完成算术逻辑运算根据控制信号计算有效地址提供数据通道,将上一级传递过来的控制信号传到下一级4.3.2输入、输出信号分析e_RAOut、e_RBOut、e_ALUSrc、e_ALUOpr、e_SetFlag、e_IMM、e_memToReg、 e_wRegEn、来自译码模块的控制信号forwardA、forwardB来自数据相关冲突检测模块的输出e_ALUOut上一个指令在执行模块产生的输出,作为下一条指令在执行模块执行的输入信号之一 m_SA、m_ALUOut、m_RBdata、i_tempZ、i_tempC、m_flag、m_wRegE
13、n、m_memToReg、m_destReg、m_wrMem主要来自上一级模块传过来的控制信号4.3.3功能实现逻辑执行模块执行的功能很简单,和上个学期做的CPU综合性实验类似,主要是一些ALU逻辑运算和状态存放器的更新操作。在这里还有向下一模块传递控制信号的作用。其中,forwardA和forwardB信号是来自数据相关冲突检测模块的信号。 模块图如下所示:作用是在发生读后写数据相关时,直接将计算好了的结果在写回目标存放器时也发往下一条指令的执行模块作为ALU的输入之一。4.4访存(MEM)4.4.1 实现功能列表访存模块实现的功能是:根据地址线对内存进行读操作或者写操作4.4.2输入、输出
14、信号分析内存读写控制信号m_ALUOut来自ALU的输出结果m_RBdata要写回的数据PC程序计数器的值w_wrMem传送到写回模块的内存读写控制信号wr读写控制信号addr要读取的内存地址既可作为输入又可作为输出,用于传输数据4.4.3功能实现逻辑 访存和取指在功能上是独立的,但是因为CPU对外只有一条地址线和数据线,因此访存和取指在实际上是有联系和冲突的。当执行Load/Store指令时,地址线由ALU送入访存段的值提供;当写内存时,CPU内部数据送往数据线。4.5写回(WB)4.5.1 实现功能列表写回模块实现的功能是:选择写回数据源来自ALU的输出还是来自内存根据写使能信号wRegE
15、n将数据写回到存放器组4.5.2输入、输出信号分析 s_w_ALUOutALU的输出 s_w_MemOut内存读取的输出 s_w_memToReg决定写入存放器的数据来源 s_w_flag要写进状态存放器的值4.5.3功能实现逻辑此局部较为简单,即通过s_w_memToReg信号来决定是将ALU的输出写进存放器还是将从内存读出来的数据写进存放器。模块图如下:5 系统改造5.1新的指令系统汇编语句操作码功能描述指令类型ADD DR,SR0000DR+SRDR算术逻辑指令SUB DR,SR0001DR-SRDRCMP DR,SR0010DR-SR 比较AND DR,SR0011DR and SRD
16、R 逻辑与OR DR,SR0100DR or SRDR 逻辑或XOR DR,SR0101DR xor SR DR 异或SHL DR0110逻辑左移,最低位补0,最高位移入CSHR DR 0111逻辑右移,最高位补0,最低位移入CMOVI DR,IMM1000IMM立即数DR,存立即数进存放器数据传送指令MOV DR,SR1001SR DRLOAD DR,SR1010SR DRSTORE DR,SR1011 SR DRJR ADR1100无条件跳转到ADR , ADR=原PC值+OFFSET控制转移指令JRC ADR1101当C=1时,跳转到ADR, ADR=原PC值+OFFSETJRZ ADR
17、1110当Z=1时,跳转到ADR, ADR=原PC值+OFFSETNOP1111空操作其他5.1.1选择改动说明 包括NOP空操作指令在内指令系统共包括16条指令,在原有的25条指令的根底上删除了10条,新增了1条。具体地,删除了DEC,INC,TEST,SAR,PUSH,POP,JRNC,JRNZ,LOADH,LOADL,新增了一条数据传送指令MOVI。5.2修改的代码及说明1)代码段1,新增内存模块memory.vhd内存模块使用vhdl编写,内存由ram组成,读出数据线和写入数据线为同一条数据总线,因此不能同时进行读写。因为这样所以会产生结构相关,即在取指的时候不可以访存,否那么会产生冲
18、突。内存读写功能由wr信号进行控制,当wr为0时执行写功能,当wr为1时执行读功能。2)代码段2,取指模块ifentity.vhd取指模块主要修改了与pc相关的地址信号的位数和跳转判断,由于修改指令系统时只保存了JR/JRC/JRZ3条跳转指令,因此在跳转判断时只考虑该3条跳转指令,根据跳转判断来选择如何更新pc的值。1)代码段1,执行模块exentity.vhd, 修改了alu选择信号以及alu功能信号的判断逻辑,以及状态存放器的判断逻辑,之所以修改是因为位数的修改。除此以外还增加了aluMOVI的alu功能信号及其对应的逻辑功能实现。1 代码段1,译码模块identity.vhd新增了的
19、译码模块主要修改了控制信号ctrl的位数,并根据“SA, SB, Wrmem, wRegEn, MemToReg, ALUSrc, ALUOpr, SetFlag的顺序增加了MOVI指令的控制信号,如下所示:when MOVI = ctrl:=d_IR(3 downto 0)&10&11011010000; imm = 000000d_IR(1 downto 0);最后还增加了存放器的初始化。6 测试与总结6.1 规那么文件(cpu.txt的内容)6.2测试代码-程序1-指令正确性测试 - R0 R1 R2 R3ram(0) = MOVI & R0 & 11 - 3 0 0 0ram(1) =
20、 ADD &01 - 4 0 0 0ram(2) = MOV & R1 & R0; - 4 4 0 0ram(3) = SUBB & - 4 1 0 0ram(4) R2 & - 4 1 -2 0ram(5) - 4 1 1 0ram(6) = ORIns & - 4 4 1 0ram(7) = ANDIns & R2;ram(8) = XORIns & R1; - 5 1 1 0ram(9) = SHLIns &00 - 5 2 1 0;ram(10) = SHRIns & - 2 2 1 0;ram(11) = LOAD & - R0的值为ADD &, 即0000 00 01ram(12)
21、 = CMP & - CF = 1, ZF = 0ram(13) = JRC &1111 - 跳转到15号地址ram(14) R3 & - 如果跳转那么不执行该指令ram(15) = STORE & - 0号地址的内容变为 0000 0001ram(16) - R0 = 3ram(17) - R1 = 1ram(18) - R0 = R0 R1ram(19) = JRZ & - 此处不跳ram(20) = JR &0000 -此处跳6.3 测试结果测试环境测试程序测试结果五级流水Quartus程序1正确6.4 测试总结试程序的结果都与预期相符,证明测试结果是正确的。7 本课程设计的总结7.1
22、A同学总结由于上一学期在电脑组成原理的综合性实验中担当了主力队员,对cpu的根本组织结构也算是十分了解,因此该学期主动担当了组长。然而事实并没有那么简单,当第一次看到代码时发现,由于上次综合性实验大局部通过画图连线实现,逻辑功能十清楚确,一目了然,然而该学期的cpu顶层实体是通过vhdl代码实现的,因此初期花了不少时间在了解代码的语法以及逻辑功能上,完成此步以后,我们组开展了对3种相关进行详细分析。弄清楚流水CPU的实现原理后,后续的修改工作就十分简单了。一开始我们是采用机箱+DebugController的方式进行调试,后来由于实验室的机箱资源有限,便再次采取了用Quartus的时序功能仿真
23、来调试,并添加了内存模块。7.2B同学总结在此次课程设计中,我主要:参与修订指令系统;负责数据相关模块的修改;负责译码和访存模块的修改;负责MOVI指令的增加,主要是在常量定义文件unitpack里增加MOVI的op 码常量以及aluMOVI的alu功能选择信号,并在译码模块增加MOVI的控制信号及相关代码;负责扩展常量定义文件。在组长的组织下循序渐进,大局部不懂得问题都能够通过讨论解决。7.3 C同学总结在这次的电脑组成原理课程设计里,我负责的是:负责结构相关模块的修改;负责执行模块和写回模块的修改;负责新顶层实体cpum.bdf文件的接线,主要是在创立了cpuentity和memory的bsf文件后,新建cpum.bdf文件并将上述两个原件参加,利用Quartus的接线功能将原件连接起来。
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1