控制流与数据流分析.docx

资源描述

控制流与数据流分析.docx

《控制流与数据流分析.docx》由会员分享，可在线阅读，更多相关《控制流与数据流分析.docx（22页珍藏版）》请在冰豆网上搜索。

控制流与数据流分析.docx

控制流与数据流分析

第七章控制流分析

优化需要从程序中获得足够多的信息。

控制流分析就是用来获取程序控制结构信息的形式化分析方法，它是数据流分析，依赖分析的基础。

7.1控制流分析方法概述

7.1.1过程内控制流分析方法主要有下面3种：

1•用dominator图找出循环，把循环标记出来供后面的优化使用。

因为循环是程序中最值得改进的地方，所以这种方法广泛被现在的编译器采用。

2.Interval分析：

这是一类分析方法的统称，用来分析单个过程的结构，并把它分解成为一系列有层次的结构称为interval。

这些结构的层次关系可以用一棵树来

表示，就叫控制树。

接下来许多分析和优化就可以基于控制树来做。

3.结构分析：

结构分析是Interval分析中的特别重要且有代表性的一种，而且它

在许多编译器或优化方法中被用到，所以单独作为一种控制流分析方法。

这三种分析方法各有优劣之处，且三种方法并不是互相隔离的，具体实现时可以根据需求做出折衷选择。

7.1.2控制流图和BB

上面三种分析方法都是基于控制流图（CFG）的基本单元BB来做的。

因为控制流图和BB大家都知道，所以这里省略它们的基本概念。

只是在识别BB的方法

上补充一点：

对call语句的处理。

对call语句的处理：

一般情况下call语句调用目标过程后会返回call语句顺

序的下一条语句。

这时call语句和它顺序的下一条语句都不会被作为入口语句。

但是，如果一个call语句有好几个返回地址（例如：

Fortran中有alternate返回地址），那么call语句的下一条语句就应该作为入口语句，否则BB中将有一条既

不是顺序执行又不在BB末尾的指令。

C库函数中的setjump（）和Iongjump（）也有类似情况。

Fortran

1call…

2…

3…

>n…

箭头所指都是入口语句

7.13EBB

EBB与控制流分析的关系不大，只是因为刚介绍了BB，所以把EBB也顺带

介绍一下。

EBB跟BB相比可以使指令调度这种局部优化在选择指令时范围更宽。

介召EBB之前先要知道joinnode

1.joinnode的概念：

若一个节点不止一个前驱（随便有几个后继），那么该节点就叫做joinnode。

2.EBB：

除了第一个节点外，其余节点都不是join节点的最大CFG子图。

（这里的第一个节点指的是唯一一个前驱不在该EBB之内的节点，其余节点都不是join节点因而只有唯一前驱，而且前驱属于该EBB之内，所以一个EBB就是以join节点为根的一棵树）图可见《muchnick一书》p177Fig7.8完全对称的，我们可以有branchnode和reverseEBB的概念，这里略。

3.找EBB的算法：

《muchnick一书》p176Fig7.67.7

Build_EBB（r,succ,pred）：

作用：

给定某个joinnode，求以它为根的EBB树。

思想：

它调用Add_Bbs（）从join节点r出发在CFG上做深度优先搜索，若遇到非join节点就把它加入该EBB，然后沿该节点继续深度优先搜索；若遇到join节点就把它放入一个单独的集合EbbRoots里，然后控制返回它的父节点继续搜索。

Build_All_Ebbs（r,succ,pred）：

作用：

找到CFG中所有EBB思想：

把CFG的根放入EbbRoots集合里，并把它作为r调用Build_EBB（r,succ,pred）;然后对EbbRoots中的joinnode队列依次调用Build_EBB（r,succ,pred），得到所有EBB。

7.2深度/广度优先搜索，前序/后序遍历

略

7.3Dominators和PostDominators

7.3.1dom，idom基本概念

dominate（简写为dom）是一个二元关系，adomb表示从CFG的entry节点到b节点的任意一条路径都会经过a节点。

这时把a叫做b的dominator。

idom关系由dom关系得来，aidomb表示adomb，且不存在节点c同时满足adomc、cdomb。

由CFG的节点集N和idom关系构成的边集组成一棵树，叫idom树，这棵树反映了CFG上所有节点间dom和idom关系。

7.3.2求dominator和idominator

求dominator的常规算法用的是迭代计算的方法，收敛结果即所求每个节点的

domintor集合。

该算法大家比较熟悉，略。

求idominator的算法要基于domintor算法的结果，用下图来简单阐述：

《muchnick—书》p184Fig7.15

思想：

任取节点i属于Domin（n）-{n}，固定i，依次检查Domin（n）-{n}-{i}中节点s,若s属于Domin（i），则从Domin（n）中删除节点s,因为它不可能成为节点n的

idominator了。

检查完集合Domin（n）-{n}-{i}中剩余节点s之后，再改变节点i，

继续上面做的检查。

直到domin（n）-{n}集合中只剩一个节点，该节点就是节点n

的idominator。

求Postdominator的算法与求dominator的算法对称，只要把算法Fig7.14中

的pred函数改为succ函数就行了。

7.3.3计算dominator的快速算法

该算法的详纟田介绍见LengauerandTarjanAFastAlgorithmforFindingDominatorsinaFlowgraph

常规算法时间复杂度为0（n2.e）,快速算法的时间复杂度为0（n.%（e,n））,a

（e,n）是ackermann函数的倒数，增长非常缓慢。

先给一个定义sdom（w）:

sdom（w）=min{u|存在路径vO=u,v1,…,vk=w且vj>w（1<=j<=k-1）}

先对CFG作深度优先搜索，搜索树为T,里面的u,w,v1,…,vk都是T中先序遍历

的访问顺序，后面经常就用这个顺序号来指代节点。

Sdom（w）表示：

节点u有路径到达w,且路径上除u之外的其它节点的序号都大于w。

取CFG中满足这个条件且序号最小的u作为sdom（w）。

引入sdom函数的目的是由sdom可以计算idom（w）

因为算法比较复杂，不能几句话说清楚，所以先给个梗概。

即我们首先会给出一些引理和定理，由它们得到sdom（w）的递推计算方法和基于sdom函数的idom（w）

的递推计算方法，然后按照特定的顺序使用递推计算方法计算得到sdom和idom。

引理和定理的意义不直观，可能需要了解证明过程才能清楚，可以查看上面的论文，这里只在附录中给出最重要的定理的证明。

（引理123可以先跳过不看）

引理1:

如果v,w都是G中的点，且v<=w,那么v到w的任何路径都要经过v和w在深度优先树T上的公共祖先。

引理2：

sdom（w）--+w;idom（w）--*sdom（w）

sdom（w）--+w表示在T上sdom（w）是w的祖先，且sdom（w）!

idom（w）--*sdom（w）表示在T上idom（w）是sdom（w）的祖先，且有可能idom（w）=sdom（w）。

引理3:

如果v,w满足v--*w,那么或者有v--*idom（w）或者有

idom（w）--*idom（v）。

定理1:

假如w!

sdom（w）=min（{v|（v,w）属于Eandvwand存在边（v,w）并且满足u--*v}）

定理1就是sdom（w）的递推计算式。

定理一的证明：

设X等于上面等式的右边部分

一：

证明sdom（w）ex

如果（x,w）•E且xw，那么，由sdom的定义和（x,w）=sdom（w）乞x。

如果x=sdom（u）,u满足uw且ur*v且（v,w）•E，则有路径I:

从sdom（u）到u,从u到v,从v到w。

且sdom（u）到u上的节点的序号uw,

从u到v的路径上的节点序号也是.u.w,所以sdom（w）_sdom（u）=x

二：

证明sdom（w）_x

sdom（w）=v°,v1,...,Vk』,Vk=w（vj-w,1-j-k-1）

设k=1，即（sdom（w）,w）E，且sdom（w）—：

w=sdom（w）：

：

w，由min式前半部分有x=min（...）三sdom（w）。

若k.1,则取j是满足Vj>*vkJ的那个最小的j，假如有Vj乞Vj..仁i乞j-1,则由引理一，存在V|...i一I一j-1是vi和Vj的公共祖先，即v^■Vj—*vkj,

这与j的取法矛盾。

所以vi_Vj..1_i_j-1

所以存在路径sdom（w）,v1一直到vj且路径上的点除了两端点外都大于等于出，

这说明sdom（w）_sdom（vj），又

vjw,Vj“*vk4,（vk4,w）E=sdom（Vj）_x，所以sdom（w）亠x

综合一二，可知sdom（w）二x。

定理2:

如果每一个满足sdom（w）--+u--*w的u都同时满足sdom（u）>=sdom（w）,那么idom（w）=sdom（w）

定理3:

假设u是满足sdom（w）--+u--*w并且使sdom值最小的那个u,那么u满足sdom（u）<=sdom（w），且idom（w）=idom（u）

由定理2和定理3得到推论：

推论1:

假设w!

=r，u是满足sdom（w）+u*w并且使sdom值最小的那个u，那么有

idom（w）=sdom（w）ifsdom（w）=sdom（u）

idom（w）=idom（u）ifsdom（w）>sdom（u）

这就得到了基于sdom函数的idom（w）的递推计算式。

上面这些定理比较烦杂，有用的是定理1、2、3和推论，其它都是为了证明这些而

给出的。

算法的步骤：

（1）算法首先对CFG故深度优先搜索，按先序遍历次序给各个节点编号。

（2）按照递减次序，用定理1计算各个节点sdom函数值

（3）按照递减次序，用推论1计算各个节点的idom函数值，这里要说明的是推

论1计算idom函数值分两种情况，第一种情况下计算idom（w）时sdom（w）

已经得到，对应于下面图1的step3;而第二种情况下计算idom（w）时

idom（u）还没得到，这时idom（w）中记录序号u，等递减遍历完成后，再进行一次序号递增遍历，这时idom（u）的值一定会在idom（w）之前被计算出

来，用idom（w）=idom（idom（w））就能得到idom（w）的值，对应于图1中的step4。

第⑵步比较复杂，把它拿出来讨论。

我们打算用semi函数来表示sdom函数，但semi函数在算法各个阶段表示

的含义不完全相同。

Semi（w）值在

（1）之前都为0，在

（1）之后等于w,在⑵之后

等

展开阅读全文