控制流与数据流分析.docx

上传人:b****2 文档编号:1792769 上传时间:2022-10-24 格式:DOCX 页数:22 大小:194.99KB
下载 相关 举报
控制流与数据流分析.docx_第1页
第1页 / 共22页
控制流与数据流分析.docx_第2页
第2页 / 共22页
控制流与数据流分析.docx_第3页
第3页 / 共22页
控制流与数据流分析.docx_第4页
第4页 / 共22页
控制流与数据流分析.docx_第5页
第5页 / 共22页
点击查看更多>>
下载资源
资源描述

控制流与数据流分析.docx

《控制流与数据流分析.docx》由会员分享,可在线阅读,更多相关《控制流与数据流分析.docx(22页珍藏版)》请在冰豆网上搜索。

控制流与数据流分析.docx

控制流与数据流分析

第七章控制流分析

优化需要从程序中获得足够多的信息。

控制流分析就是用来获取程序控制结构信息的形式化分析方法,它是数据流分析,依赖分析的基础。

7.1控制流分析方法概述

7.1.1过程内控制流分析方法主要有下面3种:

1•用dominator图找出循环,把循环标记出来供后面的优化使用。

因为循环是程序中最值得改进的地方,所以这种方法广泛被现在的编译器采用。

2.Interval分析:

这是一类分析方法的统称,用来分析单个过程的结构,并把它分解成为一系列有层次的结构称为interval。

这些结构的层次关系可以用一棵树来

表示,就叫控制树。

接下来许多分析和优化就可以基于控制树来做。

3.结构分析:

结构分析是Interval分析中的特别重要且有代表性的一种,而且它

在许多编译器或优化方法中被用到,所以单独作为一种控制流分析方法。

这三种分析方法各有优劣之处,且三种方法并不是互相隔离的,具体实现时可以根据需求做出折衷选择。

7.1.2控制流图和BB

上面三种分析方法都是基于控制流图(CFG)的基本单元BB来做的。

因为控制流图和BB大家都知道,所以这里省略它们的基本概念。

只是在识别BB的方法

上补充一点:

对call语句的处理。

对call语句的处理:

一般情况下call语句调用目标过程后会返回call语句顺

序的下一条语句。

这时call语句和它顺序的下一条语句都不会被作为入口语句。

但是,如果一个call语句有好几个返回地址(例如:

Fortran中有alternate返回地址),那么call语句的下一条语句就应该作为入口语句,否则BB中将有一条既

不是顺序执行又不在BB末尾的指令。

C库函数中的setjump()和Iongjump()也有类似情况。

Fortran

1call…

2…

3…

>n…

箭头所指都是入口语句

7.13EBB

EBB与控制流分析的关系不大,只是因为刚介绍了BB,所以把EBB也顺带

介绍一下。

EBB跟BB相比可以使指令调度这种局部优化在选择指令时范围更宽。

介召EBB之前先要知道joinnode

1.joinnode的概念:

若一个节点不止一个前驱(随便有几个后继),那么该节点就叫做joinnode。

2.EBB:

除了第一个节点外,其余节点都不是join节点的最大CFG子图。

(这里的第一个节点指的是唯一一个前驱不在该EBB之内的节点,其余节点都不是join节点因而只有唯一前驱,而且前驱属于该EBB之内,所以一个EBB就是以join节点为根的一棵树)图可见《muchnick一书》p177Fig7.8完全对称的,我们可以有branchnode和reverseEBB的概念,这里略。

3.找EBB的算法:

《muchnick一书》p176Fig7.67.7

Build_EBB(r,succ,pred):

作用:

给定某个joinnode,求以它为根的EBB树。

思想:

它调用Add_Bbs()从join节点r出发在CFG上做深度优先搜索,若遇到非join节点就把它加入该EBB,然后沿该节点继续深度优先搜索;若遇到join节点就把它放入一个单独的集合EbbRoots里,然后控制返回它的父节点继续搜索。

Build_All_Ebbs(r,succ,pred):

作用:

找到CFG中所有EBB思想:

把CFG的根放入EbbRoots集合里,并把它作为r调用Build_EBB(r,succ,pred);然后对EbbRoots中的joinnode队列依次调用Build_EBB(r,succ,pred),得到所有EBB。

7.2深度/广度优先搜索,前序/后序遍历

7.3Dominators和PostDominators

7.3.1dom,idom基本概念

dominate(简写为dom)是一个二元关系,adomb表示从CFG的entry节点到b节点的任意一条路径都会经过a节点。

这时把a叫做b的dominator。

idom关系由dom关系得来,aidomb表示adomb,且不存在节点c同时满足adomc、cdomb。

由CFG的节点集N和idom关系构成的边集组成一棵树,叫idom树,这棵树反映了CFG上所有节点间dom和idom关系。

7.3.2求dominator和idominator

求dominator的常规算法用的是迭代计算的方法,收敛结果即所求每个节点的

domintor集合。

该算法大家比较熟悉,略。

求idominator的算法要基于domintor算法的结果,用下图来简单阐述:

《muchnick—书》p184Fig7.15

思想:

任取节点i属于Domin(n)-{n},固定i,依次检查Domin(n)-{n}-{i}中节点s,若s属于Domin(i),则从Domin(n)中删除节点s,因为它不可能成为节点n的

idominator了。

检查完集合Domin(n)-{n}-{i}中剩余节点s之后,再改变节点i,

继续上面做的检查。

直到domin(n)-{n}集合中只剩一个节点,该节点就是节点n

的idominator。

求Postdominator的算法与求dominator的算法对称,只要把算法Fig7.14中

的pred函数改为succ函数就行了。

7.3.3计算dominator的快速算法

该算法的详纟田介绍见LengauerandTarjanAFastAlgorithmforFindingDominatorsinaFlowgraph

常规算法时间复杂度为0(n2.e),快速算法的时间复杂度为0(n.%(e,n)),a

(e,n)是ackermann函数的倒数,增长非常缓慢。

先给一个定义sdom(w):

sdom(w)=min{u|存在路径vO=u,v1,…,vk=w且vj>w(1<=j<=k-1)}

先对CFG作深度优先搜索,搜索树为T,里面的u,w,v1,…,vk都是T中先序遍历

的访问顺序,后面经常就用这个顺序号来指代节点。

Sdom(w)表示:

节点u有路径到达w,且路径上除u之外的其它节点的序号都大于w。

取CFG中满足这个条件且序号最小的u作为sdom(w)。

引入sdom函数的目的是由sdom可以计算idom(w)

因为算法比较复杂,不能几句话说清楚,所以先给个梗概。

即我们首先会给出一些引理和定理,由它们得到sdom(w)的递推计算方法和基于sdom函数的idom(w)

的递推计算方法,然后按照特定的顺序使用递推计算方法计算得到sdom和idom。

引理和定理的意义不直观,可能需要了解证明过程才能清楚,可以查看上面的论文,这里只在附录中给出最重要的定理的证明。

(引理123可以先跳过不看)

引理1:

如果v,w都是G中的点,且v<=w,那么v到w的任何路径都要经过v和w在深度优先树T上的公共祖先。

引理2:

sdom(w)--+w;idom(w)--*sdom(w)

sdom(w)--+w表示在T上sdom(w)是w的祖先,且sdom(w)!

=w

idom(w)--*sdom(w)表示在T上idom(w)是sdom(w)的祖先,且有可能idom(w)=sdom(w)。

引理3:

如果v,w满足v--*w,那么或者有v--*idom(w)或者有

idom(w)--*idom(v)。

定理1:

假如w!

=r

sdom(w)=min({v|(v,w)属于Eandvwand存在边(v,w)并且满足u--*v})

定理1就是sdom(w)的递推计算式。

定理一的证明:

设X等于上面等式的右边部分

一:

证明sdom(w)ex

如果(x,w)•E且xw,那么,由sdom的定义和(x,w)=sdom(w)乞x。

如果x=sdom(u),u满足uw且ur*v且(v,w)•E,则有路径I:

从sdom(u)到u,从u到v,从v到w。

且sdom(u)到u上的节点的序号uw,

从u到v的路径上的节点序号也是.u.w,所以sdom(w)_sdom(u)=x

二:

证明sdom(w)_x

sdom(w)=v°,v1,...,Vk』,Vk=w(vj-w,1-j-k-1)

设k=1,即(sdom(w),w)E,且sdom(w)—:

w=sdom(w):

w,由min式前半部分有x=min(...)三sdom(w)。

若k.1,则取j是满足Vj>*vkJ的那个最小的j,假如有Vj乞Vj..仁i乞j-1,则由引理一,存在V|...i一I一j-1是vi和Vj的公共祖先,即v^■Vj—*vkj,

这与j的取法矛盾。

所以vi_Vj..1_i_j-1

所以存在路径sdom(w),v1一直到vj且路径上的点除了两端点外都大于等于出,

这说明sdom(w)_sdom(vj),又

vjw,Vj“*vk4,(vk4,w)E=sdom(Vj)_x,所以sdom(w)亠x

综合一二,可知sdom(w)二x。

定理2:

如果每一个满足sdom(w)--+u--*w的u都同时满足sdom(u)>=sdom(w),那么idom(w)=sdom(w)

定理3:

假设u是满足sdom(w)--+u--*w并且使sdom值最小的那个u,那么u满足sdom(u)<=sdom(w),且idom(w)=idom(u)

由定理2和定理3得到推论:

推论1:

假设w!

=r,u是满足sdom(w)+u*w并且使sdom值最小的那个u,那么有

idom(w)=sdom(w)ifsdom(w)=sdom(u)

idom(w)=idom(u)ifsdom(w)>sdom(u)

这就得到了基于sdom函数的idom(w)的递推计算式。

上面这些定理比较烦杂,有用的是定理1、2、3和推论,其它都是为了证明这些而

给出的。

算法的步骤:

(1)算法首先对CFG故深度优先搜索,按先序遍历次序给各个节点编号。

(2)按照递减次序,用定理1计算各个节点sdom函数值

(3)按照递减次序,用推论1计算各个节点的idom函数值,这里要说明的是推

论1计算idom函数值分两种情况,第一种情况下计算idom(w)时sdom(w)

已经得到,对应于下面图1的step3;而第二种情况下计算idom(w)时

idom(u)还没得到,这时idom(w)中记录序号u,等递减遍历完成后,再进行一次序号递增遍历,这时idom(u)的值一定会在idom(w)之前被计算出

来,用idom(w)=idom(idom(w))就能得到idom(w)的值,对应于图1中的step4。

第⑵步比较复杂,把它拿出来讨论。

我们打算用semi函数来表示sdom函数,但semi函数在算法各个阶段表示

的含义不完全相同。

Semi(w)值在

(1)之前都为0,在

(1)之后等于w,在⑵之后

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高等教育 > 医学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1