1、IC设计后端流程初学必看 基本后端流程(漂流&雪拧)- 2010/7/3-2010/7/8 本教程将通过一个8*8的乘法器来进行一个从verilog代码到版图的整个流程(当然只是基本流程,因为真正一个大型的设计不是那么简单就完成的),此教程的目的就是为了让大家尽快了解数字IC设计的大概流程,为以后学习建立一个基础。此教程只是本人探索实验的结果,并不代表内容都是正确的,只是为了说明大概的流程,里面一定还有很多未完善并且有错误的地方,我在今后的学习当中会对其逐一完善和修正。 此后端流程大致包括以下内容: 1. 逻辑综合(逻辑综合是干吗的就不用解释了把?) 2. 设计的形式验证(工具formalit
2、y) 形式验证就是功能验证,主要验证流程中的各个阶段的代码功能是否一致,包括综合前RTL代码和综合后网表的验证,因为如今IC设计的规模越来越大,如果对门级网表进行动态仿真的话,会花费较长的时间(规模大的话甚至要数星期),这对于一个对时间要求严格(设计周期短)的asic设计来说是不可容忍的,而形式验证只用几小时即可完成一个大型的验证。另外,因为版图后做了时钟树综合,时钟树的插入意味着进入布图工具的原来的网表已经被修改了,所以有必要验证与原来的网表是逻辑等价的。 3. 静态时序分析(STA),某种程度上来说,STA是ASIC设计中最重要的步骤,使用primetime对整个设计布图前的静态时序分析,
3、没有时序违规,则进入下一步,否则重新进行综合。(PR后也需作signoff的时序分析) 4. 使用cadence公司的SOCencounter对综合后的网表进行自动布局布线(APR) 5. 自动布局以后得到具体的延时信息(sdf文件,由寄生RC和互联RC所组成)反标注到网表,再做静态时序分析,与综合类似,静态时序分析是一个迭代的过程,它与芯片布局布线的联系非常紧密,这个操作通常是需要执行许多次才能满足时序需求,如果没违规,则进入下一步。 6. APR后的门级功能仿真(如果需要) 7. 进行DRC和LVS,如果通过,则进入下一步。 8. 用abstract对此8*8乘法器进行抽取,产生一个lef
4、文件,相当于一个hard macro。 9. 将此macro作为一个模块在另外一个top设计中进行调用。 10. 设计一个新的ASIC,第二次设计,我们需要添加PAD,因为没有PAD,就不是一个完整的芯片,具体操作下面会说。 11. 重复第4到7步 1. 逻辑综合 1) 设计的8*8verilog代码如下 module mux (clk,clr,data1,data2,dataout); input clk,clr; input 7:0 data1,data2; output reg 15:0 dataout; always (posedge clk) begin if(!clr) begin
5、 dataout=0; end else begin dataoutmux.v File-excute script-verti.con 输入约束文件。 之后会产生mux.sv,mux.sdc,mux.sdf,mux.ddc等文件 4) 时序分析 综合以后我们需要分析一下时序,看时序是否符合我们的要求,综合实际上是一个setup时间的满足过程,但是我们综合的时候,连线的负载只是库提供的(即上面的wire_load),并不是实际的延时,所以一般做完综合以后,时间余量(slack)应该为时钟的30%(经验值),以便为后面实际布局布线留下充足的延时空间。因为如果slack太小,甚至接近于0,虽然我们
6、看起来是没有时序违规的,但是实际布局以后,时序肯定无法满足。 使用report_timing命令,可以查看时序分析报告: * Report : timing -path full -delay max -max_paths 1 -sort_by group Design : mux Version: D-2010.03-SP1 Date : Fri Jul 2 12:29:44 2010 * Operating Conditions: typical Library: typical(模型库) Wire Load Model Mode: enclosed Startpoint: data24
7、(input port clocked by clk) Endpoint: dataout_reg_15_ (rising edge-triggered flip-flop clocked by clk) Path Group: clk Path Type: max Des/Clust/Port Wire Load Model Library - mux tsmc18_wl10 typical (线载模型及库) Point Incr Path - clock clk (rise edge) 0.00 0.00 clock network delay (ideal) 0.00 0.00 inpu
8、t external delay 0.50 0.50 f data24 (in) 0.01 0.51 f mult_14/b4 (mux_DW_mult_uns_0) 0.00 0.51 f mult_14/U131/Y (INVX1) 0.54 1.05 r mult_14/U161/Y (NOR2X1) 0.14 1.18 f mult_14/U39/S (CMPR42X1) 0.68 1.87 f mult_14/U12/CO (ADDFX2) 0.32 2.19 f mult_14/U11/CO (ADDFX2) 0.23 2.42 f mult_14/U10/CO (ADDFX2)
9、0.23 2.65 f mult_14/U9/CO (ADDFX2) 0.23 2.88 f mult_14/U8/CO (ADDFX2) 0.23 3.10 f mult_14/U7/CO (ADDFX2) 0.23 3.33 f mult_14/U6/CO (ADDFX2) 0.23 3.56 f mult_14/U5/CO (ADDFX2) 0.23 3.79 f mult_14/U4/CO (ADDFX2) 0.23 4.02 f mult_14/U3/CO (ADDFX2) 0.23 4.25 f mult_14/U2/CO (ADDFX2) 0.22 4.47 f mult_14/
10、product15 (mux_DW_mult_uns_0) 0.00 4.47 f dataout_reg_15_/RN (DFFTRXL) 0.00 4.47 f data arrival time 4.47 clock clk (rise edge) 10.00 10.00 clock network delay (ideal) 0.30 10.30 clock uncertainty -0.10 10.20 dataout_reg_15_/CK (DFFTRXL) 0.00 10.20 r library setup time -0.19 10.01 data required time
11、 10.01 - data required time 10.01 data arrival time -4.47 - slack (MET) 5.55 我们来看以上报告,dc报告的时候会显示出关键路径,即延时最大的路径,时序分析data arrival time 为4.47,下面是计算要包括两段,前面一段是信号的延迟时间,即求时间,也即相对于时钟,设计所能忍受的最大延时,由于到达寄存器clk端延时,即clock network delay,所以设计增加了0.30的余量,同样由于时钟的不确定度(可能提前也可能延后0.1),我们取最坏情况,就是时钟超前0.1,则时间余量减去0.1,最后一个是门的
12、建立时间要求,是0.19,最后得到数据的要求时间。 Slack是要求时间减去到达时间的差值,slack越大越好。越大说明留给布局布线的时序越宽松。从报告中我们看出,时序余量为5.55,说明时序达到了要求,足够满足我们以后布局布线的时序要求。 当然,我们有专门的时序分析工具,primetime,下面会稍微介绍。 2. 形式验证 1) 怎么保证综合前和综合后的网表逻辑功能是一致的呢,对门级网表进行动态仿真,又太浪费时间,于是,一款强大的验证工具formality,给了我们很好的帮助。 2) 形式验证数据准备:综合前RTL代码,综合后的网表,综合所用到的库。 3) 验证过程如下: 1. 首先我们打开
13、formality,命令为fm_shell(命令行界面),formality(图形界面)。初学者一般使用图形界面,使用图形界面的时候,工具会自动产生一个log文件,记录命令,我们可以将这个文件内容做一个fms格式,这样在下次验证的时候可以使用命令界面。 2. 打开formality如下 第一步:首先我们加入原RTL代码,reference-read_design file-verilog-mux.v,选择好以后load file 第二步:然后选择库,没加库之前,FM会自动加载与工艺无关的库,所以我们要自己把自typical.db ,选择reference-read DB libarary-DB
14、己的目标库加上去, 第三步:设置top名 reference-set top design 我们选择mux为top名 同样的方法对网表进行设置(第二个菜单栏implementation) 然后转到第四栏,点击run matching ,如果网表无错,会显示验证通过。verify最后转到第五栏, 3 静态时序分析 静态时序分析主要针对大型ASIC设计, 4 自动布局布线 1)数据准备 第一:需要综合后的网表以及时序约束文件mux.sv,mux.sdc 第二:需要自动布局布线的物理库(lef文件,这里用到tsmc18_6lm_cic.lef, tsmc18_6lm_antenna_cic.lef)
15、 为了能够了解lef文档的作用,这里对lef做简单的介绍,lef一般分为两种: 一种是技术物理库,主要包含工艺信息,设计规则信息,金属通孔信息等。下例是对金属一层的定义,TYPE指明METAL1是可布线层,WIDTH定义的是METAL1的默认布线宽度,SPACING用于设定METAL1布线间距。DIRECTION HORIZONTAL指明METAL1是用于水平走线,当然这并不意味着它不能垂直走线,在一些布线资源较少的区域,还是可以选择垂直布线的。具体介绍,可以参考相关技术文档。 LAYER METAL1 TYPE ROUTING ; WIDTH 0.230 ; MAXWIDTH 9.9 ; A
16、REA 0.202 ; SPACING 0.230 ; SPACING 0.6 RANGE 10.0 100000.0 ; PITCH 0.560 ; DIRECTION HORIZONTAL ; EDGECAPACITANCE 9.1090e-05 ; END METAL1 另外一种就是单元物理库,定义了单元库中各单元的信息,文件又有两部分一种是SITE语句对布局(placement)最小单位的定义,另一部分是采用MACRO语句对单元属性及几何形状的描述,下例是对一个与门为例来看看lef是如何描述它的。MACRO是单元定义的关键字,每一个MACRO代表一个单元。CLASS core说明该单元
17、是用于芯片的核心区,SIZE确定了单元的面积大小,比如5.04是代表该单元的高度,后面我们做单元供电route的时候,可以看到它们的宽度就是这个数值。再后面就是定义引脚A,B,Y,VDD,VSS等。 MACRO AND2X1 CLASS CORE ; FOREIGN AND2X1 0.000 0.000 ; ORIGIN 0.000 0.000 ; LEQ AND2XL ; SIZE 2.640 BY 5.040 ; SYMMETRY x y ; SITE tsm3site ; PIN Y DIRECTION OUTPUT ; PORT LAYER METAL1 ; RECT 2.355 2.
18、380 2.500 2.660 ; END END Y PIN B DIRECTION INPUT ; PORT LAYER METAL1 ; RECT 0.800 2.315 1.215 2.895 ; END END B PIN A DIRECTION INPUT ; PORT LAYER METAL1 ; RECT 0.150 1.820 0.565 2.315 ; END END A PIN VSS DIRECTION INOUT ; USE ground ; SHAPE ABUTMENT ; PORT LAYER METAL1 ; 1.790 -0.400 2.640 0.400 ;
19、 RECT RECT 1.450 -0.400 1.790 0.575 ; RECT 0.000 -0.400 1.450 0.400 ; END END VSS PIN VDD DIRECTION INOUT ; USE power ; SHAPE ABUTMENT ; PORT LAYER METAL1 ; RECT 1.755 4.640 2.640 5.440 END END VDD OBS LAYER METAL1 ; RECT 1.835 1.935 1.885 2.355 ; END END AND2X1 第三:时序库文件,typical.lib,也就是时序文件,定义了门的各种时
20、序信息,某种意义来讲,这个和综合使用的db库是等价的。 2)布局布线过程: 第一步:打开encounter 把数据输入,另外在advanced栏的Power相应位置填上VDD,和 以便于下次使用save。如下图,设置完以后,记得把设置的配置文件做一个VSS 第二步:打开以后,我们可以看到芯片区域,左边粉红色的就是标准单元,中间那个就是我们要设计的区域,64%是指cell面积的占有率,一般来说控制在70%左右,布线的时候不会引起拥塞。 都那些项core to IO,将Floorplan-specify floorplan.另外我们需要对芯片进行稍微的更改, 填上45,留给电源环的放置。 第三步:
21、添加电源环 设置如下图, NET填写VDD和VSS,layer选择顶层的两层金属,宽度设置为20(这个不定,可以根据实际设计来定),offset选择center in channel,则电源环会被设置在IO与core之间。 之后电源环就加进去了,当然这是一个小电路,电源规划比较简单,对于一个复杂的电路,还需要横竖添加stripes,降低IRdrop。 第四步:自动布局以及布置标准单元,因为此设计较小,并没有block,所以可以直接进行标准单元的放置。Place-standard cells and blocaks-OK 然后我们发现标准单元已经被加进去了: 第五步:布置好了以后,我们需要将电源
22、,地,等接口先连接起来,首先我们在floorplan中选择global net connection,分别将VDD,VSS等都连接起来。 然后我们需要specify route将电源和地线先连接起来,选择route-specify route 因为我们这个设计只有标准单元,所以我们只要选择标准单元的布线即可: 完成以后,点击OK,会得到下面的图:每行的row都有线连接到外面的电源环 第六步:时钟树综合(CTS),这是一个APR设计中最重要的一环,为什么要进行时钟树综我们需要让相应路径的时钟路径的也具有同样的延因为信号传输的延时,简单地说,合呢, 时,通过添加时钟缓冲器的方法,来消除各路径的建立
23、时间,具体请参考相关书籍和资料。 添加好时钟树以后的版图如下:加了时钟树以后的版图密集了很多,因为加了很多buf。 时钟树的脚本: AutoCTSRootPin clk Period 10ns MaxDelay 500ps # set_clock_latency MinDelay 0ps # set_clock_latency MaxSkew 100ps SinkMaxTran 400ps BufMaxTran 400ps Obstruction NO DetailReport YES PadBufAfterGate NO RouteClkNet NO PostOpt YES OptAddBu
24、ffer YES OptAddBufferLimit 100 NoGating NO Buffer CLKBUFX1 CLKBUFXL CLKBUFX2 CLKBUFX3 CLKBUFX4 CLKBUFX8 CLKBUFX12 CLKBUFX16 CLKBUFX20 CLKINVXL CLKINVX1 CLKINVX2 CLKINVX3 CLKINVX4 CLKINVX8 CLKINVX12 CLKINVX16 CLKINVX20 END 然后将脚本选中,并进行时钟树综合。 第七步:优化设计,命令optDesign postCTS,然后report_timing查看时序报告,确定无违规,再进行完全布线。 第八步:完全布线,route -nanoroute-route 之后得到的版图如下所示: 第九步:保存设计,提取需要的数据。 这里特别注意提取gds文件的时候,需要指定库文件中的streamOut.map文件,和merge gds(tsmc18_core.gds)文件,如图所示 保存网表,并将此版图提取的网表做一次formality,与原代码匹配成功。 再提取def文件,保存为mux.def 5 第二次静态时序分析 用版图实际提取的延时文件进行 6 APR后仿真 用modelsim对版图提取的网表和sdf文件进行仿真。 7 用
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1