最新编译原理复习提纲整理.docx-资源下载

最新编译原理复习提纲整理.docx

1、最新编译原理复习提纲整理说明1.这份资料的最初来源是王金伟老师给大家发的复习提纲，我在下面会给大家附一份原版，后面的21面资料是在那个的基础上整理和细化得到的。最初做这份资料的目的是我本人作为班长为了帮助我们班的同学顺利通过考试而整理的。听王老师说有想法留给学弟学妹们用，我放假后又对一些内容进行了修正和改进，得到了大家看到的这个版本2.这份资料加入了很多我个人的理解。与原提纲相比，我增删了一些内容，并对某些内容进行了调序与合并。3.这份资料融入了老师平时上课的PPT以及最后复习课给的PPT，更重要的是我个人的理解和猜测。大家或许都有感受，觉得编译原理书上或者PPT上说的句子根本看不懂。针对这个

2、问题，我把很多晦涩难懂的形式化的算法通过我的理解后用比较形象易懂的话表述了出来，表述得可能并不科学严谨，但我的目的是为了能帮助大家做题和考试4.里面的每一个考点我都在最后用括号加了注释，方便不同起点不同准备时间的同学进行选择，这里简单说明“了解”：代表这一部分的内容被老师列在提纲内，但其实并不太影响大家对大题的计算；并且据我的分析也并不太可能出小题所以时间很紧的同学可以略看就好，当然看看还是有好处的。“小题”一类的字样代表这一块的知识点值得出填空选择，大家有时间应该理解性的记忆下来（在2012年的期末考试上，选择为1分*10题；填空为1分*10题，判断改错为2分*5题，小题总计30分）“简答”

3、：老师在最后复习课上说过编译原理是有简答题的，简答不同于计算，很可能是让你默写一些步骤。所以这一块内容大家需要背诵，即使不理解也要背下来（在2012年的期末考试上，简答题的分值为5分*4题=20分“铺垫”“大题步骤”等代表这一块的内容对于综合大题的做题是必须了解的，或者其实就是做大题的分解步骤，这些块的内容是所有人必须看懂并且记下来的“实际大题”：总共列出的有4道，应该每年考察的都会是这4中题型，每一道的分值都在1215分左右，是所有人想通过考试所必须攻克的。这里通常我会标出他需要用到之前的哪些哪些知识点（2012年期末考试4道题的总分值为50分）5.如果大家想去打印，最好在装有office2

4、007及以上的机器上打印，否则有些符号可能会显示不出来。建议大家去生活广场找机器打，不要去景元鸿6.由于时间仓促，这份资料做的并不完善和严谨，难免有错漏之处，希望大家谅解。大家可以一边看我的这份资料，一边看老师最后给的两套PPT，课本来不及就别看了。真心希望这份资料能对大家有用，祝大家都考得好。PS最后说一句，我们去年编译原理考得好的人挺多的，其实也不是很难，没有人挂！本人惭愧，只有89，考得比我好的多太多了。总结原因是把时间花在了研究大题上面，小题的很多知识点都没有背熟，随便错了几个小题就基本和90无缘了。 10计1 王成正 2012/7/9（老师给的提纲原版）一、概述1. 编译方式与解释

5、方式区别：是否生成目标代码2. 编译程序总框架二、词法分析1. 状态转换图的功能：识别（接受）一定的符号串（单词）2. 状态转换图的程序实现的思路：为每个状态结点都编写一个子程序3. 字母表的概念：一般用表示4. 闭包的概念：闭包V*中的每个字都是由V中的字经过若干次连接而成的5. 正则闭包V+的概念：是V上所有符号串的集合6. *定义：表示上所有字的全体，空字也包括在其中7. +空字不包含，非8. ，，之间的区别9. 所对应的正规集为10. 正规式与正规集的定义：知道如何用正规式表示一个正规集11. 简述NFA和DFA的定义与区别12. 若M的某些结点既是初态结点又是终态结点，或者存在一

6、条从某初态结点到某个终态结点的通路，那么空字可为M所识别13. 正规式与优先自动机的等价性14. 定理2.对于上的每一个正规式V，存在一个上的DFA M，使得L(M)=L(V)15. DFA M的化简的概念和方法：终态和非终态是可区别的，因为终态可以读出空字，而非终态不能读出空字16. 课后作业一个例题17. 构造一个DFA，它接受=x，y上所有倒数第二个字符为y的字符串三、语法分析（1）基本定义1. 上下文无关文法的定义2. 句型、句子的概念3. 文法和语言的对应关系，给出文法构造语言，文法G产生的句子的全体是该文法的语言4. 语法分析树与二义性：判断文法的二义性方法：如果一个文法含有二义

7、性的句子（对应两棵不同的语法树），则称该文法是二义性文法5. 3型文法是正规文法、正则文法、线性文法6. 2型文法也称为称为上下文无关文法7. 若一个文法是递归的，则由它产生的语言的句子个数是无限的（2）自上而下8. 文法左递归的定义9. 消除文法的左递归的方法：直接左递归10. 消除回溯的方法：提取公共左因子11. 递归下降分析法的概念，应满足什么条件？12. 递归下降法对文法的每个非终结符构造一个相应的子程序13. 预测分析法：给文法构造预测分析表：消除左递归、消除回溯、First集、Follow集。举例子时，便成Sa|aS|（T）（3）自下而上14. 短语、直接短语的概念15. 句柄的概

8、念（一个句型的最左直接短语）16. 规范归约（最左）、规范推导（最右）、规范句型17. 规范归约的关键问题是寻找句柄18. 在规范归约中，可归约串必出现在栈顶19. 算符文法、算符优先文法的概念，如何判断20. 构造算符优先关系表、Fisrtvt、lastvt集合，可不考虑#号21. 素短语：算符优先归约的关键问题是寻找最左素短语22. 算符优先法尤其适用于表达式的分析23. 给出文法G（P） X jYjY kZ|iZ Yid 24. 该文法是否为算符优先文法？请根据FIRSTVT、LASTVT集合构造算符优先关系表说明之（12分）25. 优先函数的优点：便于比较，节省空间26. 优先函数的构

9、造方法27. 欲构造行之有效的自上而下分析器，则必须消除文法中含有的左递归28. LR分析法属于自底向上分析方法29. 从文法出发构造LR（0）分析表的步骤四、语义分析1. 综合属性和继承属性概念五、中间代码生成1. 中间代码是一种面向语法，易于翻译成目标代码的代码2. 后缀式（逆波兰式）的概念3. 逆波兰式中各运算法出现的顺序与实际运算顺序一致4. 后缀式与抽象语法树（表达式树）的关系5. DAG的含义6. 四元式表示方法，联系时通过临时变量，可以翻译各种语句7. 将赋值语句表示成后缀式和四元式六、代码优化1. 简述代码优化的原则与优化的级别，并列举三种常用的优化技术2. 基本块、流图的概念

10、，如何画、节点对应基本块3. 局部优化的方法，DAG是对基本块进行优化的有效工具4. P285中间注意5. 不变运算的代码外提的条件6. 循环优化中的强度削弱的含义七、目标代码生成1. 编译程序生成的目标程序种类一：概述1. 编译方式与解释方式区别（小题）在于是否生成目标代码，编译方式生成了目标代码。2. 编译程序总框架（简答题，背！）二：词法分析1.状态转换图的功能：（较重要铺垫）识别（接受）一定的符号串（单词）上图是一个很简单的状态转换图。上图代表：状态0通过X弧可以转换到状态1，通过Y弧可以转换到状态22.字母表的概念：（较重要铺垫）一个由有限元素组成的集合，每个元素称为一个符号或一个字

11、，一般用表示一个字母表例： = a , b , c 元素：a，b，c 字母表中的字可拼接在一起构成一个序列，如aa,ab,bc,bbc等，符号的顺序不同所代表的序列也不同。不包含任何字符的序列称为空字，用来表示另外有几个概念必须先了解：字(符号串)的连接设x和y是两个字(符号串)，则定义xy为他们的连接例：ab和ba连接是abba 注: (1)（空字）是连结运算的恒等元素x = x= x (2)字(符号串)的n次连接 xn = xxxx 规定x0 = x1= x，x2=xx，x3= xxx集合的(连接)积设U和V是两个“字(符号串)的集合”，则定义UV为他们的(连接)积 UV=xy|xU且

12、yV例：设U=a, ab, V=b, ba, 则UV=ab, aba, abb, abba集合V的n次(连接)积记为： Vn = V V VV n个规定 V0= 例：设V=a, b，那么 V0= V1= a,b V2=VV=aa,ab,ba,bb V3=VVV=V2V=aaa,aba,baa,bba, aab,abb,bab,bbb3.闭包的概念：（较重要铺垫）设V是一个字（符号串）的集合，则V的闭包定义为V*， V* = V0V1V2 注：闭包V* 中的每个字都是由V中的字经过有限次连接而成的正则闭包V+的定义为 V+ = VV* 闭包与正则闭包的差别在于，闭包里是含有的，因为闭包里有集

13、合V0 ，而正则闭包由于在闭包的基础上又连接了一个V，所以正则闭包里是没有空字的。*定义：表示上所有字的全体，空字也包括在其中+表示上所有字的全体，但不包括4.，，之间的区别（小题）空字：表不包含任示何字符的序列称：表示一个空集：表示含有空字的集合5.正规式与正规集的定义：（较重要铺垫）我们可以把具有相同特征的字放在一起组成一个集合，即所谓的正规集然后使用一种形式化的方法来表示正规集，即所谓的正规式正规式是描述单词结构的一种形式；正规集是该类单词的全集。举例对于下面的例子，大家应该好好思考一下后面4个的含义，对做大题是很有帮助的。做大题时，题目通常会给你一个实际问题，你需要先把他要

14、实现的功能抽象成一个正规集，再用正规式表达出来，才能继续做后面的步骤。所对应的正规集为6.简述有限自动机NFA和DFA的定义与区别（重要铺垫）NFA代表非确定的有限自动机；DFA代表确定的有限自动机所谓的有限自动机，大家一定觉得这个概念坑爹死了。其实他并不代表任何实体的机器，只是一种数学模型而已。就像函数、数列是一种数学模型一样。函数通过函数表达式实现他的功能：你给他一个自变量，他能根据表达式求出因变量的值。而有限自动机是通过状态转换图来实现功能，你给他一个初始状态和一个输入符号，他能根据你输入的这个符号将原状态转换到另一个状态，用他来模拟计算机的识别功能。下面简单介绍一下DFA（确定的有限自

15、动机）的五元式表示法：(重要)定义：一个确定有限自动机（DFA）M是一个五元式：M = (S, , f, s0, F)，其中1) S是一个有限的状态集合，它的每个元素我们称为一个状态2) 是一个有穷的输入符号的字母表，它的每个元素我们称为一个输入字符3) f是从 S S的单值部分映射4) s0是S的一个元素，为初始状态，它是唯一的5) 状态集合F是终止状态的集合，它是S的子集(可空)一个非确定有限自动机（NFA）M是一个五元式M = (S, , f, S0, F)，其中S是一个有限的状态集合，它的每个元素我们称为一个状态是一个有限的输入符号的字母表，它的每个元素我们称为一个输入字符f是从S*2

16、S 的部分映射，其中，2S表示S的幂集合（所有S的子集组成的集合）（f是非单值的M是非确定）状态集合S0是初始状态集合，它是S的子集状态集合F是终止状态的集合，它是S的子集注：DFA和NFA的区别在于（3）和（4），其他几点都差不多，这是有可能出简答题的，大家要记住他们的区别和联系7.DFA的识别功能（小题）对于*中任何字，如果存在一条从初态结点到某个终态结点的道路，这条路上所有的标识符连成的字等于，则可被DFA M所识别(接受，读出)若M的某些结点既是初态结点又是终态结点，或者存在一条从某初态结点到某个终态结点的通路，那么空字可为M所识别8.状态转换图的分裂规则（大题步骤）例子：(这里Y有

17、两个圈圈代表他是最终状态的点)划到最后要求每条弧上都只有一个字母或者数字9._CLOSURE(I) 和Ia =_CLOSURE(J)的构造方法（大题步骤）这里先需要了解几个定义我们假设有某个状态集I，这个集合中含有不同的状态。定义1 状态集I的a弧转换：move( I, a ) 是一个状态集，是从I中的状态出发经过一条a弧到达的状态的全体。定义2 状态集I的(空字)闭包：_CLOSURE( I ) 是一个状态集，由两部分组成: 状态集I中的所有原状态。从I中的状态出发经过任意条弧，所能到达的状态的全体。定义3 Ia =_CLOSURE( move( I, a ) ) 是一个状态集。下面给出一

18、个实例：例：有如下一个状态转换图假定 I=1, 2，求Ia = ？J=move(I,a)=5,4,3Ia=_CLOSURE(J) = 5,4,3,6,2,7,8（即先做a弧转换，将求得的状态再求空字闭包）本知识点旨在让大家掌握在知道了I这个状态集合后，怎样求Ia10.如何用子集法将非确定的有限自动机确定化（大题步骤）方法：先画一张表IIaIb_CLOSURE(S0)ABCBDECFG1.这张表的首行上首列上固定是大写字母I2.表格后面有几列，取决于这个有限自动机的输入符号数量，有几个输入符号就有几列，这里假设Ia Ib 的下标a b代表这个有限自动机的输入符号3.第二行的第一列也是固定的，S0

19、代表的是这个有限自动机的初始状态,即求S0的空字闭包，我们假设求出来的状态集合是A4.将A所对应的Ia Ib 分别求出来，我们假设是B和C5.如果B和C都分别于A不同，需要将B，C作为新的状态集合加入到第一列中6.继续求出B和C所对应的Ia Ib ，再检验：对于DEFG这四个状态集合，有没有与ABC是不同的，如果有，加入到第一列的下面，再继续计算，如果与前面的ABC相同就不再需要加入了。7.按照这样的方法一直进行下去，知道第一列不再有新的状态集合加入了，这个表就构造好了。8.再画一张表，与上面的表相对应Sab01234134224319.对于上面这种表的构造方法很简单，大家也可以不另外画表，而

20、直接标在原来的表中这种表来源是，在原来表的第一列上分别表上s01234，a和b不变，然后按照第一列中数字所对应的状态集，依次对应在后面的列上标上相应数字。例如第一列中B对应1，C对应2，那么将第二列第二行中的B也标上1，第三列第二行中的C标上2，等等。10.画出下面的这个表或在原表中标好后，就可以按照这个表画出状态转换图了，例如，0状态通过a弧转换成1状态，通过b弧转换成2状态；1状态通过a弧转换成3状态，通过b弧转换成4状态，等等。画出这个状态转换图后，就完成了一个非确定有限自动机的确定化。11.有限自动机DFA的化简（大题步骤）分析：这是一块用文字很难表述清楚的内容，并且在实际的化简中如果

21、题目难度大是很容易出错的，但是期末考试通常不会太复杂，整体的思路如下： 1.将第10步中得到的已经确定的DFA中的所有状态分为两组，一组为终态节点，一组为非终态节点。需要补充的是，在上一步构造的表格中，s那一列的节点哪些是终态哪些是非终态呢？这需要看你最初构造的正规式中的哪个是终态节点了。例如在下面的12中，Y为终态节点，那么在以上的表格中只要是含有Y元素的状态集合都将成为终态集。2.将每个分组检验，看他们是否还能分割，检验的方法实在难以用文字描述清楚，请大家看下面的实际例题，自己领会。3.每个分组都不能再分割后，若还含有大于2个元素的分组，则这个分组中的所有状态都是等价的，可以用其中的一个代

22、替他们，代替的方法是：假设用状态1代替状态2，则把状态2及其引出去的弧全部删去，并把原来指向状态2的弧指向状态1下面是老师复习PPT上的一个例子，这是一个较为复杂的例子，可能会看不懂，大家多问一问周围会的同学，期末考试时，肯定不会出这么复杂，通常在将终态节点和非终态节点区分开后，剩下的就已经快分好了，所以大家不用太担心，化简也是有可能不考察的，大家看清题目要求。例：12.实际大题例题：构造一个DFA，它接受=x，y上所有倒数第二个字符为y的字符串在这里还是想先说明一下这道题的解题思路和步骤，希望大家能真正明白整个解题的过程，让大家真正明白这样的一道大题是应该怎么做的（具体的完整解答过程这里不贴

23、出来了，这是2012年考试之前老师复习课上给的一道题目，本以为会考原题，但是最后考的是一个（0|10）* 的题，大家也可以看老师复习PPT上给出的例题，都是非常经典的例题！也是有可能出原题的）上面这道题的分析思路是1.根据他所描述的功能，构造出一个正规式，正规式先给大家：（x|y）*y (x|y)（其实对于这样的大题最关键就是构造对正规式，大家一定把老师最后的PPT上所有的例题是如何构造正规式的都记下来！这一步做不出来后面的都没分了！）2.构造一个初始状态X和和最终状态Y，将正规式写在他们的转换弧上。3.按照第8点中的分裂规则对他进行分裂，分裂直到每一条转换弧上都只含有一个字符4.分裂结束得到

24、的一个状态转换图实际上就是一个NFA（非确定的有限自动机）5.在掌握了第9点知识的前提下，就可以按照第10点说的步骤，将求得的NFA确定化6.得到确定化之后的状态转换图，剩下的事情就是化简了。也就是第11点当中的只是看到这里强烈建议大家先动笔试一试上面这道例题，相信只要你认真学习了前面的知识，做出来是没有问题的，祝大家成功！三：语法分析（1）基本定义1.上下文无关文法的定义(重要铺垫)文法：是描述语言的语法结构的形式规则（或称语法规则）上下文无关文法概念:它所定义的语法范畴（或语法单位）是完全独立于这种范畴可能出现的环境的（与它所在的上下文无关）（重要！以下的概念一定要理解熟知！）上下文无关文

25、法G可定义为一个四元式(VT，VN，S，P) VT是终结符号集合，它的每个元素称为终结符号，用小写字母表示。VN是非终结符号集合，它的每个元素称为非终结符号，用大写字母表示。S是一个开始符号，是一个非终结符，至少在一个产生式作为左部出现P是一个产生式的集合，它的每个元素称为一条产生式，可以表示为：P| b，其中P 是非终结符，叫做产生式的左部，和b分别叫做这个产生式的一个侯选式，他们既可以是终结符，也可以是非终结符，也可以是他们的组合。2.句型、句子的概念（小题）设G是一个文法，S是它的开始符号，如果S，且(VNVT) * 则称是G的一个句型；如果S ，且 VT* ，则称是G的一个句子；句子实

26、际上是仅含有终结符号的句型3.文法和语言的对应关系：（了解）一个文法G所产生的句子的全体就是一个语言。给定一个文法，就能从结构上唯一确定其语言；给定一种语言，能找到其文法，但该文法不是唯一的4.语法分析树与二义性：（了解）用一棵树来表示句型的推导，简称语法树。若一个文法的一个句子对应两棵不同的语法树，则称该句子是二义性句子如果一个文法含有二义性的句子，则称该文法是二义性文法。（5,6,7均可能出填空判断选择等小题）5. 3型文法是正规文法、正则文法、线性文法（用于词法分析）6. 2型文法也称为上下文无关文法（用于语法分析）7. 1型文法也称为上下文有关文法若一个文法是递归的，则由它产生的语言的

27、句子个数是无限的。（2）自上而下（以下812均为13的大题铺垫）8. 文法左递归的定义一个文法中如果存在某个产生式 PP（即有某个侯选式的最左边的符号是这个产生式左部非终结符本身），则此文法是有左递归的。9. 消除文法的左递归的方法：只要求消除直接左递归，方法见下面的例子。设有产生式 PP| 其中不以P开头，不为，那么，我们可以把P的规则改为如下的非直接左递归形式： PP PP| 这样就消除了PP|这个式子的左递归。（提示：在做题时，要把整个文法的每个产生式都逐一检验，有时含有左递归的产生式是不只一个的，需要逐个消除。）10.First集合Follow集的构造方法（较抽象）First集的构造方

28、法：对于任意一个符号X，构造他的frist集的方法是： (1)若XVT （终结符），则FIRST(X)=X. (2)若XVN（非终结符），且有产生式Xa（小写a代表任意一个终结符号，他是侯选式左边的第一个字符），则把a加入到FIRST(X)中；若X也是一条产生式，则把也加到FIRST(X)中。若有产生式XY（大写Y代表任意一个非终结符号，他是侯选式左边的第一个字符），则把FIRST(Y)中所有非元素都加到FIRST(X)中；FOLLOW集的构造方法：（书上的表述很难懂，这里我用自己的水话表述）(1)对于文法中给定的开始符号S，置#与FOLLOW(S)中；(2)将所有产生式侯选式中的非终结符都

29、标出来，并从前往后挨个检查为方便讨论，我们假设ABC是一个产生式，（这里B和C代表非终结符，代表终结符）1.先检验这个非终结符的右边还有没有别的符号（不管这个符号是终结符还是非终结符），在这,B是我们检查的第一个非终结符，它右边是有符号C的，如果检验到的某个非终结符右边有别的符号，例如这里的B，那么检验他右边符号的FIRST集合，这里是FIRST（C）。先将FIRST（C）中非空字的元素加入到FOLLOW(B)中；注意，如果FIRST（C）中含有空字，还要把FOLLOW（A）中的元素也加入到FOLLOW（B）中（如果不含空字就不这么做）2.如果检验到的终结符右边没有别的符号了，例如这里的C，那

30、么，直接将FOLLOW（A）中的元素加入到FOLLOW（C）中。在这里，的存在是无关痛痒的。也就是说，我们在检验某个非终结符时只要看他的右边就好了，左边有没有有什么都是无所谓的。大家按照上面的方法，将每一个侯选式中的非终结符都这样检查一遍，最后就能求得所有非终结符的FOLLOW集了11. 递归下降分析法的概念，应满足什么条件？大家不必知道概念，只须知道能够用递归下降分析法分析的文法是LL（1）文法，要成为这种文法，必须满足以下条件： (1)文法不含左递归（在这里提一句：欲构造行之有效的自上而下分析器，则必须消除文法中含有的左递归，请大家记住这句话，有可能考小题）(2)对于文法中每一个非终结符A的各个产生式的候选式的FIRST集两两不相交。即，若 A1|2|n 则 FIRST(i)FIRST(j)= (ij)(3

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
特别说明：	请自助下载，系统不会自动发送文件的哦；如果您已付费，想二次下载，请登录后访问：我的下载记录
支付方式：
验证码：	换一换

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？