控制流与数据流分析.docx
《控制流与数据流分析.docx》由会员分享,可在线阅读,更多相关《控制流与数据流分析.docx(22页珍藏版)》请在冰豆网上搜索。
控制流与数据流分析
第七章控制流分析
优化需要从程序中获得足够多的信息。
控制流分析就是用来获取程序控制结构信息的形式化分析方法,它是数据流分析,依赖分析的基础。
7.1控制流分析方法概述
7.1.1过程内控制流分析方法主要有下面3种:
1•用dominator图找出循环,把循环标记出来供后面的优化使用。
因为循环是程序中最值得改进的地方,所以这种方法广泛被现在的编译器采用。
2.Interval分析:
这是一类分析方法的统称,用来分析单个过程的结构,并把它分解成为一系列有层次的结构称为interval。
这些结构的层次关系可以用一棵树来
表示,就叫控制树。
接下来许多分析和优化就可以基于控制树来做。
3.结构分析:
结构分析是Interval分析中的特别重要且有代表性的一种,而且它
在许多编译器或优化方法中被用到,所以单独作为一种控制流分析方法。
这三种分析方法各有优劣之处,且三种方法并不是互相隔离的,具体实现时可以根据需求做出折衷选择。
7.1.2控制流图和BB
上面三种分析方法都是基于控制流图(CFG)的基本单元BB来做的。
因为控制流图和BB大家都知道,所以这里省略它们的基本概念。
只是在识别BB的方法
上补充一点:
对call语句的处理。
对call语句的处理:
一般情况下call语句调用目标过程后会返回call语句顺
序的下一条语句。
这时call语句和它顺序的下一条语句都不会被作为入口语句。
但是,如果一个call语句有好几个返回地址(例如:
Fortran中有alternate返回地址),那么call语句的下一条语句就应该作为入口语句,否则BB中将有一条既
不是顺序执行又不在BB末尾的指令。
C库函数中的setjump()和Iongjump()也有类似情况。
Fortran
1call…
2…
3…
>n…
箭头所指都是入口语句
7.13EBB
EBB与控制流分析的关系不大,只是因为刚介绍了BB,所以把EBB也顺带
介绍一下。
EBB跟BB相比可以使指令调度这种局部优化在选择指令时范围更宽。
介召EBB之前先要知道joinnode
1.joinnode的概念:
若一个节点不止一个前驱(随便有几个后继),那么该节点就叫做joinnode。
2.EBB:
除了第一个节点外,其余节点都不是join节点的最大CFG子图。
(这里的第一个节点指的是唯一一个前驱不在该EBB之内的节点,其余节点都不是join节点因而只有唯一前驱,而且前驱属于该EBB之内,所以一个EBB就是以join节点为根的一棵树)图可见《muchnick一书》p177Fig7.8完全对称的,我们可以有branchnode和reverseEBB的概念,这里略。
3.找EBB的算法:
《muchnick一书》p176Fig7.67.7
Build_EBB(r,succ,pred):
作用:
给定某个joinnode,求以它为根的EBB树。
思想:
它调用Add_Bbs()从join节点r出发在CFG上做深度优先搜索,若遇到非join节点就把它加入该EBB,然后沿该节点继续深度优先搜索;若遇到join节点就把它放入一个单独的集合EbbRoots里,然后控制返回它的父节点继续搜索。
Build_All_Ebbs(r,succ,pred):
作用:
找到CFG中所有EBB思想:
把CFG的根放入EbbRoots集合里,并把它作为r调用Build_EBB(r,succ,pred);然后对EbbRoots中的joinnode队列依次调用Build_EBB(r,succ,pred),得到所有EBB。
7.2深度/广度优先搜索,前序/后序遍历
略
7.3Dominators和PostDominators
7.3.1dom,idom基本概念
dominate(简写为dom)是一个二元关系,adomb表示从CFG的entry节点到b节点的任意一条路径都会经过a节点。
这时把a叫做b的dominator。
idom关系由dom关系得来,aidomb表示adomb,且不存在节点c同时满足adomc、cdomb。
由CFG的节点集N和idom关系构成的边集组成一棵树,叫idom树,这棵树反映了CFG上所有节点间dom和idom关系。
7.3.2求dominator和idominator
求dominator的常规算法用的是迭代计算的方法,收敛结果即所求每个节点的
domintor集合。
该算法大家比较熟悉,略。
求idominator的算法要基于domintor算法的结果,用下图来简单阐述:
《muchnick—书》p184Fig7.15
思想:
任取节点i属于Domin(n)-{n},固定i,依次检查Domin(n)-{n}-{i}中节点s,若s属于Domin(i),则从Domin(n)中删除节点s,因为它不可能成为节点n的
idominator了。
检查完集合Domin(n)-{n}-{i}中剩余节点s之后,再改变节点i,
继续上面做的检查。
直到domin(n)-{n}集合中只剩一个节点,该节点就是节点n
的idominator。
求Postdominator的算法与求dominator的算法对称,只要把算法Fig7.14中
的pred函数改为succ函数就行了。
7.3.3计算dominator的快速算法
该算法的详纟田介绍见LengauerandTarjanAFastAlgorithmforFindingDominatorsinaFlowgraph
常规算法时间复杂度为0(n2.e),快速算法的时间复杂度为0(n.%(e,n)),a
(e,n)是ackermann函数的倒数,增长非常缓慢。
先给一个定义sdom(w):
sdom(w)=min{u|存在路径vO=u,v1,…,vk=w且vj>w(1<=j<=k-1)}
先对CFG作深度优先搜索,搜索树为T,里面的u,w,v1,…,vk都是T中先序遍历
的访问顺序,后面经常就用这个顺序号来指代节点。
Sdom(w)表示:
节点u有路径到达w,且路径上除u之外的其它节点的序号都大于w。
取CFG中满足这个条件且序号最小的u作为sdom(w)。
引入sdom函数的目的是由sdom可以计算idom(w)
因为算法比较复杂,不能几句话说清楚,所以先给个梗概。
即我们首先会给出一些引理和定理,由它们得到sdom(w)的递推计算方法和基于sdom函数的idom(w)
的递推计算方法,然后按照特定的顺序使用递推计算方法计算得到sdom和idom。
引理和定理的意义不直观,可能需要了解证明过程才能清楚,可以查看上面的论文,这里只在附录中给出最重要的定理的证明。
(引理123可以先跳过不看)
引理1:
如果v,w都是G中的点,且v<=w,那么v到w的任何路径都要经过v和w在深度优先树T上的公共祖先。
引理2:
sdom(w)--+w;idom(w)--*sdom(w)
sdom(w)--+w表示在T上sdom(w)是w的祖先,且sdom(w)!
=w
idom(w)--*sdom(w)表示在T上idom(w)是sdom(w)的祖先,且有可能idom(w)=sdom(w)。
引理3:
如果v,w满足v--*w,那么或者有v--*idom(w)或者有
idom(w)--*idom(v)。
定理1:
假如w!
=r
sdom(w)=min({v|(v,w)属于Eandvwand存在边(v,w)并且满足u--*v})
定理1就是sdom(w)的递推计算式。
定理一的证明:
设X等于上面等式的右边部分
一:
证明sdom(w)ex
如果(x,w)•E且xw,那么,由sdom的定义和(x,w)=sdom(w)乞x。
如果x=sdom(u),u满足uw且ur*v且(v,w)•E,则有路径I:
从sdom(u)到u,从u到v,从v到w。
且sdom(u)到u上的节点的序号uw,
从u到v的路径上的节点序号也是.u.w,所以sdom(w)_sdom(u)=x
二:
证明sdom(w)_x
sdom(w)=v°,v1,...,Vk』,Vk=w(vj-w,1-j-k-1)
设k=1,即(sdom(w),w)E,且sdom(w)—:
w=sdom(w):
:
:
w,由min式前半部分有x=min(...)三sdom(w)。
若k.1,则取j是满足Vj>*vkJ的那个最小的j,假如有Vj乞Vj..仁i乞j-1,则由引理一,存在V|...i一I一j-1是vi和Vj的公共祖先,即v^■Vj—*vkj,
这与j的取法矛盾。
所以vi_Vj..1_i_j-1
所以存在路径sdom(w),v1一直到vj且路径上的点除了两端点外都大于等于出,
这说明sdom(w)_sdom(vj),又
vjw,Vj“*vk4,(vk4,w)E=sdom(Vj)_x,所以sdom(w)亠x
综合一二,可知sdom(w)二x。
定理2:
如果每一个满足sdom(w)--+u--*w的u都同时满足sdom(u)>=sdom(w),那么idom(w)=sdom(w)
定理3:
假设u是满足sdom(w)--+u--*w并且使sdom值最小的那个u,那么u满足sdom(u)<=sdom(w),且idom(w)=idom(u)
由定理2和定理3得到推论:
推论1:
假设w!
=r,u是满足sdom(w)+u*w并且使sdom值最小的那个u,那么有
idom(w)=sdom(w)ifsdom(w)=sdom(u)
idom(w)=idom(u)ifsdom(w)>sdom(u)
这就得到了基于sdom函数的idom(w)的递推计算式。
上面这些定理比较烦杂,有用的是定理1、2、3和推论,其它都是为了证明这些而
给出的。
算法的步骤:
(1)算法首先对CFG故深度优先搜索,按先序遍历次序给各个节点编号。
(2)按照递减次序,用定理1计算各个节点sdom函数值
(3)按照递减次序,用推论1计算各个节点的idom函数值,这里要说明的是推
论1计算idom函数值分两种情况,第一种情况下计算idom(w)时sdom(w)
已经得到,对应于下面图1的step3;而第二种情况下计算idom(w)时
idom(u)还没得到,这时idom(w)中记录序号u,等递减遍历完成后,再进行一次序号递增遍历,这时idom(u)的值一定会在idom(w)之前被计算出
来,用idom(w)=idom(idom(w))就能得到idom(w)的值,对应于图1中的step4。
第⑵步比较复杂,把它拿出来讨论。
我们打算用semi函数来表示sdom函数,但semi函数在算法各个阶段表示
的含义不完全相同。
Semi(w)值在
(1)之前都为0,在
(1)之后等于w,在⑵之后
等