LR1语法分析副本.docx-资源下载

LR1语法分析副本.docx

1、LR1语法分析副本编译原理课程设计实验名称：构造LR(0)分析法语法分析器* *班级：四班学号：* 指导老师：*2016年 12 月 16 日一课题综述11 课题来源编译器设计的编译程序涉及到编译五个阶段中的三个，即词法分析器、语法分析器和中间代码生成器。编译程序的输出结果包括词法分析后的二元式序列、变量名表、状态栈分析过程显示及四元式序列程序。整个编译程序分为三部分：词法分析部分、语法分析处理及四元式生成部分、输出显示部分。一个程序设计语言就是一个记号系统，如同自然语言一样，它的完整的定义应包括语法和语义两个方面。所谓一个语言的语法是指一组规则，用它可以形成和产生一个合适的程序

2、。目前广泛使用的手段是上下文无关文法，即用上下文无关文法作为程序设计语言语法的描述工具。自底向上分析方法是一种移进-规约过程，当分析的栈顶符号串形成句柄时就采取归约动作，因而自底向上分析法的关键问题是在分析过程中如何确定句柄。LR分析法正是给出一种能根据当前分析栈中的符号串（通常以状态表示）和向右顺序查看输人串的k个(k=0)符号就可惟一地确定分析器的动作是移进还是归约和用哪个产生式归约，因而也就能惟一地确定句柄。LR分析法的归约过程是规范推导的逆过程，所以LR分析过程是一种规范归约过程。12 意义 LR（0）分析方法虽然对文法的限制比较大，对绝大多数高级语言的语法分析器不能适用，然而他是构造

3、其他LR类分析器的基础，学习和掌握LR（0）分析的原理和方法是我们掌握更高级语言语法分析的基础。归纳起来，大体上可分为两大类，即自顶向下分析方法和自底向上分析方法。自底向上分析方法是一种移进-规约过程，当分析的栈顶符号串形成句柄时就采取归约动作，因而自底向上分析法的关键问题是在分析过程中如何确定句柄。LR分析法正是给出一种能根据当前分析栈中的符号串(通常以状态表示)和向右顺序查看输人串的k个(k=0)符号就可惟一地确定分析器的动作是移进还是归约和用哪个产生式归约，因而也就能惟一地确定句柄。LR分析法的归约过程是规范推导的逆过程，所以LR分析过程是一种规范归约过程。13 预期目标本次课程设计的目

4、标即是利用所学过的编译原理的知识，利用LR(0)分析法，用C语言写出一个简单的LR(0)语法分析器。该语法分析器所要完成的功能是，对录入的文法判断它是否为LR(0)文法，如果是输出LR(0)分析表；在给定文法的情况下，能够利用LR(0)分析表，对用户输入的一串字符串用LR(0)分析法进行分析，判断该字符串是否为符合给定文法的一个句子，建立文法及其LR分析表表示的数据结构，设计并实现一个LR(0)的分析器。14 面对的问题(1)分析表的构造。(2)归约还是移进的判断。(3)接受acc的判断。(4)编程结果的输出。在本次课程设计中，主要的是面对的文法的确定，以及分析其工作过程如何进行。对于文法确定

5、的问题，必须找到一个符合LR(0)规范的文法，并且该文法不易太复杂，否则对于初次编写语法分析器的我们来说会比较复杂，否则容易出错。第二个就是分析过程的问题，目前，我们只是了解了理论上LR(0)的分析过程，但如何将该过程用程序去实现，并且能够对一个输入串进行实时的分析是比较复杂的。这涉及到对一个字符串进行一个字符一个字符的读取和操作，并且还要对几个连在一起的字符进行合并等操作，要求比较的高，对我们而言比较困难。在规范规约的过程中，一方面记住已移进和规约出的整个符号串，另一方面根据所用的产生式推测未来可能碰到的输入符号。当一串句柄的符号串呈现于分析栈的顶端时，希望能够根据上面过程中的数据来确定栈顶

6、的符号串是否构成相对某一产生式的句柄。能正确初始化状态栈，对栈内元素的进栈和出栈，取栈顶元素以及遍历栈元素，LR分析方法是一种自底向上的分析方法，是一种个移进-归约的过程。当分析的栈顶符号串形成句柄时就采取归约动作，因而自底向上分析法的关键问题是在分析过程忠如何确定句柄。LR（0）分析器是在分析过程中不需要察看输入符号，因而它对文法的限制较大，对绝大多数高级语言的语法分析器是不能使用的，然而，他是构造其他LR类分析器的基础。1. 5 需解决的关键技术（1）词法编译器。（2）交互式面向对象的词法编译器基本功能是。（3）根据规约规则对字符进行归约。（4）符合条件时采取移进动作。二系统分析21 涉

7、及的基础知识2.1.1 词法编译器功能（1）导入任意文法，也可以自己输入。（2）输出文法的分析过程，以及判断是否为LR(0)文法，输出分析表。（3）输入句子，进行语法分析。（4）输出结构树。2.1.2 词法分析器的设计方法有如下四个步骤：(1)写出该语言的词法规则。(2)把词法规则转换为相应的状态转换图。(3)把各转换图的初态连在一起，构成识别该语言的自动机。(4)设计扫描器；把扫描器作为语法分析的一个过程，当语法分析需要一个单词时，就调用扫描器。扫描器从初态出发，当识别一个单词后便进入终态，送出二元式。2.1.3 动态模拟算法的基本功能（1）输入LR分析表和一个句子。（2）输出LR总控程序。

8、（3）输出依据句子构对应的语法树的过程。（4）设计一个给定LR分析表，输入一个句子，能由依据LR分析表输出与句子对应的语法树，能对语法树生成过程进行模拟。表 2-1 LR分析表STATEACTIONGOTOabcd#ETF0S2S311acc2S4S1063S5S474S4S1085S5S1196r1r1r1r1r17r2r2r2r2r28r3r3r3r3r39r5r5r5r5r510r4r4r4r4r411r6r6r6r6r6（5）输入句子：bccd#。（6）根据文法产生的LR分析表。（7）输出结果2.1.4 LR分析器的构成一个LR分析器由个部分组成（1）总控程序，也可以称为驱动程序。对

9、所有的LR分析器，总控程序都是相同的。（2）分析表或分析函数。不同的文法分析表将不同，同一个文法采用的LR分析器不同时，分析表也不同，分析表又可以分为动作（ACTION）表和状态转换（GOTO）表两个部分，它们都可用二维数组表示。（3）分析栈，包括文法符号和相应的状态栈。它们均是先进后出栈。分析器的动作由栈顶状态和当前输入符号所决定（LR(0)分析器不需向前查看输入符号）。2. 2解决问题的基本思路1、用构造一个状态转换函数实现状态转换。2、再通过函数构造一个移进归约函数实现移进规约动作。3、采用构造一个打印LR分析器的工作过程函数实现输出。在规范规约的过程中，一方面记住已移进和规约出的整个符

10、号串，另一方面根据所用的产生式推测可能碰到的输入符号。每一项ACTION(s，a)所规定的动作不外是下述四种可能之一：（1）移进：把（s，a）的下一个转态s = GOTO(s，X)和输入符号a推进栈，下一输入符号变成现行输入符号。（2）规约：指用某一产生式A 进行规约。假若的长度为r，规约的动作是A，去除栈顶的r个项，使状态Sm-r 变成栈顶状态，然后把（Sm-r，A）的下一状态s = GOTO(Sm-r,A)和文法符号A推进栈。规约动作不改变现行输入符号。执行规约动作意味着（= Xm-r+1Xm）已呈现于栈顶而且是一个相对于A的句柄。（3）接受：宣布分析成功，停止分析器的工作。（4）报错：

11、发现源程序含有错误，调用出错处理程序。23 总体方案本课题是由一个四人的团队去完成的，所以，每个小组成员分配了不同的工作共同完成这个项目。24 功能模块框图图2.2功能模块框图三系统设计 31 算法描述1、已知文法G(1) EE+T(2) ET(3) TT*F(4) TF(5) F(E)(6) Fi2、LR(0)分析表的构造算法如下：假设已构造出LR(0)项目集规范族为：C=I0,I1, , In其中Ik为项目集的名字，k为状态名，令包含SS项目的集合Ik的下标k为分析器的初始状态。那么分析表的ACTION表和GOTO表构造步骤为：(1) 若项目Aa属于Ik且转换函数GO(Ik,a)= Ij

12、，当a为终结符时则置ACTIONk,a为Sj，其动作含意为将终结符a移进符号栈，状态j进入状态栈，(相当状态k时遇a转向状态j)。(2) 若项目A 属于Ik，则对任何终结符a 和#号置ACTIONk,a和ACTIONk,#为rj，j为在文法G中某产生式A的序号。rj动作的含义是把当前文法符号栈顶的符号串归约为A，并状态栈指针从栈顶向下移动|的长度 , 文法符号栈从栈顶弹出|个符号，非终结符A变为当前面临的符号。(3) 若GO(Ik,A)Ij，则置GOTOk,A为j，其中A为非终结符，表示当前状态为k时，遇文法符号A时状态应转向j，因此A移入文法符号栈，j移入状态栈。(4) 若项目SS属于Ik，

13、则置ACTIONk,#为acc，表示接受。(5) 凡不能用上述方法填入的分析表的元素，均应填上报错标志。为了表的清晰我们仅用空白表示错误标志。根据这种方法构造的LR(0)分析表不含多重定义时，称这样的分析表为LR(0)分析表，能用LR(0)分析表的分析器称为LR(0)分析器，能构造LR(0)分析表的文法称为LR(0)文法。3、产生如图2-1所示的LR分析表这张分析表包括两个部分，一是“动作”（ACTION）表，另一是“状态转换”（GOTO）表。ACTION(S,a)规定了当状态S面临输入符号a时应采取什么动作。GOTO（S，X）规定了状态S面对文法符号X（终结符或非终结符）时下一状态是什么。显

14、然，GOTO(S，X)定义了一个以文法符号为字母表的DFA。每一项ACTION(S，a)所规定的动作不外是下述四种可能之一：（1）移进把（S，a）的下一个转态S=GOTO(S，X)和输入符号a推进栈，下一输入符号变成现行输入符号。（2）规约指用某一产生式A进行规约。假若的长度为r，规约的动作是A，去除栈顶的r个项，使状态Sm-r变成栈顶状态，然后把（Sm-r，A）的下一状态S=GOTO(Sm-r,A)和文法符号A推进栈。规约动作不改变现行输入符号。执行规约动作意味着（=Xm-r+1Xm）已呈现于栈顶而且是一个相对于A的句柄。（3）接受宣布分析成功，停止分析器的工作。（4）报错发现源程序含有错误

15、，调用出错处理程序。一个LR分析器的工作过程可看成是栈里的状态序列，已规约串和输入串所构成的三元式的变化过程。分析开始时的初始三元式为：(S0, #, a1a2an#)。其中，S0为分析器的初态；为句子的左括号；a1a2an为输入串；其后的为结束符（句子右括号）。分析过程每步的结果可表示为：（S0S1Sm，#X1X2Xm ai, ai+1an#）。3. 2 实现方法3.2.1 构造分析表LR分析器实质上是一个带先进后出存储器（栈）的确定有限状态自动机。LR分析器的每一步工作是由栈顶状态和现行输入符号所唯一决定的。构造一个int型二维数组table139,用于存放LR分析表。并初始化。作者这样

16、规定：011 表示状态Sj，其中0对应S0，1对应S12126 表示规约Rj，其中21对应R1，22对应R212 表示 “接受”。-1 表示规约出错，报错。3.2.2程序设计关键（1）在输入串(句子)输入的过程中，涉及到一个压栈的问题。但是输入串压入的字符顺序刚好与原理中的字符串模型刚好相反，这样需要先弹出的反而在栈底。为了既要保证字符串输入，又要让输入的字符串存储顺序与输入的字符串相反。采取以下措施：先将输入的字符串压入符号栈symbol中，然后符号栈弹出的字符再压入输入串栈instr中，这样实现了输入串的倒序存储。（2）状态栈和符号栈输出（遍历）过程均采取自栈底到栈顶的顺序，而输入串

17、栈则是采取自栈顶到栈底的顺序输出。3.2.3 LR(0)项目集规范族的构造识别活前辍的NFA我们可以利用子集法将其确定化。对确定化后的DFA如果把每个子集中所含状态集对应的项目写在新的状态中。对于构成识别一个文法活前缀的DFA项目集(状态)的全体称为这个文法的LR(0)项目集规范族，我们可以分析每个状态中项目集的构成，不难发现如下规律：若状态中包含形如AB的项目，则形如B的项目也在此状态内。例如：0状态中项目集为SE，EaA, EbB。回顾由NFA确定化到DFA时，EaA和EbB正是属于SE的闭包中。因而，可引入闭包函数(CLOSURE)来求DFA一个状态的项目集。若文法G已拓广为G，而S为文

18、法G的开始符号，拓广后增加产生式SS。如果I是文法G的一个项目集，定义和构造I的闭包CLOSURE(I)如下：(1) I的项目均在CLOSURE(I)中。(2) 若AB属于CLOSURE(I)，则每一形如B的项目也属于CLOSURE(I)。(3) 重复(2)直到不出现新的项目为止。即CLOSURE(I)不再扩大。由此，我们可以很容易构造出初态的闭包，即SS属于I，再按上述三点求其闭包。回顾在构造识别活前缀的NFA时，其两个相邻状态对应的项目是出自同一个产生式，只是圆点的位置相差1，箭弧上的标记为前一个状态和后一个状态对应项目圆点间的符号，(除了箭弧上标记为的外)。由于识别活前缀的DFA的每个状

19、态是一个项目集，项目集中的每个项目都不相同，每个项目圆点后的符号不一定相同，因而对每个项目圆点移动一个位置后，箭弧上的标记也不会完全相同，这样，对于不同的标记将转向不同的状态。例如初态SE，EaA,EbB对第一个项目圆点右移一个位置后变为SE箭弧标记应为E，对第二个项目EaA，圆点右移一个位置后，项目变为EaA，箭弧标记为a,同样第三个项目为圆点右移一个位置后变为EbB，箭弧标记为b，显然，初态可发出三个不同标记的箭弧，因而转向三个不同的状态，也就由初态派生出三个新的状态，对于每个新的状态我们又可以利用前面的方法，若圆点后为非终结符则可对其求闭包，得到该状态的项目集。圆点后面为终结符或在一个产

20、生式的最后，则不会再增加新的项目。33 详细流程图图3.2 LR分析器设计流程图四代码编写41 主要模块的代码分析4.1.1 生成分析表代码 void CLR0ForWinDlg:OnGtable() CTableDlg dlg; dlg.SetControlInfo(IDC_EXPLORER1, RESIZE_BOTH); dlg.SetControlInfo(IDOK, ANCHORE_BOTTOM | ANCHORE_RIGHT); dlg.SetControlInfo(IDC_EXPORT, ANCHORE_BOTTOM | ANCHORE_RIGHT); dlg.SetContr

21、olInfo(IDC_ANALYZE, ANCHORE_BOTTOM | ANCHORE_RIGHT); string temp = ; CString t; for(int i = 0; i m_vtlist.GetCount(); i+) m_vtlist.GetText(i,t); /temp.push_back(t.GetAt(0); temp += t.GetAt(0); dlg.g.SetVt(temp); temp = ; for(i = 0; i m_vnlist.GetCount(); i+) m_vnlist.GetText(i,t); /temp.push_back(t.

22、GetAt(0); temp += t.GetAt(0); dlg.g.SetVn(temp); m_startedit.GetWindowText(t); if (t = ) MessageBox(输入的文法有误，请检查！, 错误,MB_OK | MB_ICONSTOP); return; dlg.g.SetStart(t.GetAt(0); temp = ; for(i = 0; i m_plist.GetCount(); i+) temp = ; m_plist.GetText(i,t); for(int j = 0; j m_tree.DeleteAllItems(); for(int

23、 i = 0; i m_input.GetLength(); i +) if (!m_g.IsInVt(m_input.GetAt(i) MessageBox(输入的句子不全部由终结符组成, 错误, MB_OK | MB_ICONSTOP); return; assert(TreeStack.empty(); m_input += #; char szTempPathMAX_PATH; char szTempNameMAX_PATH; if (m_strTempFilename != ) :DeleteFile(m_strTempFilename.c_str(); :GetTempPath(1

24、00,szTempPath); :GetTempFileName(szTempPath,LR0,0,szTempName); m_strTempFilename = szTempName; CStdioFile out; out.Open(szTempName, CFile:modeCreate | CFile:modeWrite); out.WriteString(n); out.WriteString(n); out.WriteString(Untitled Documentn); out.WriteString(n); out.WriteString(n); out.WriteStrin

25、g(n); out.WriteString(n); out.WriteString(n 步骤 n 状态栈n 符号栈 n 输入串 n ACTION n GOTO n n); vector Status; vector Symbol; int iStep = 1; int iPos = 0; Status.push_back(0); Symbol.push_back(#); Pair ToDo; bool bErrorFlag = false; bool bGoOn = true; whi

26、le (bGoOn) & (!bErrorFlag) assert(iPos m_input.GetLength(); assert(Status.size() = Symbol.size(); ToDo = m_g.GetAction(Status.back(), m_input.GetAt(iPos); int i, j; switch (ToDo.one) case S: out.WriteString(GetStepInfo(iStep, Status, Symbol, m_input.Right(m_input.GetLength() - iPos), ToDo, -1); Symb

27、ol.push_back(m_input.GetAt(iPos); Status.push_back(ToDo.two); iPos+; break; case R: j = m_g.GetGoTo(StatusStatus.size()-m_g.GetPrecept(ToDo.two).GetRight().length()-1, m_g.GetPrecept(ToDo.two).GetLeft()0); assert(j != -1); out.WriteString(GetStepInfo(iStep, Status, Symbol, m_input.Right(m_input.GetLength() - iPos), ToDo, j);

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
特别说明：	请自助下载，系统不会自动发送文件的哦；如果您已付费，想二次下载，请登录后访问：我的下载记录
支付方式：
验证码：	换一换

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？