LR0语法分析.docx

资源描述

LR0语法分析.docx

《LR0语法分析.docx》由会员分享，可在线阅读，更多相关《LR0语法分析.docx（25页珍藏版）》请在冰豆网上搜索。

LR0语法分析.docx

LR0语法分析

淮阴工学院

编译原理课程设计报告

选题名称：

LR（O）语法分析

系（院）：

计算机工程学院

专业：

计算机科学与技术

班级：

计算机1075（单招）

姓名：

赵俊丽学号:

1071308114

扌旨导老师：

于长辉王文豪高丽夏森

学年学期：

2009〜2010学年第2学期

设计任务书

课题名称

LR（O）语法分析

设计目的

LR（O）分析法是一种移进-规约过程，能根据当前分析栈中的符号串，同时也不用向右查看输入串的符号就可唯一确定分析器的动作。

通过对给定的文法构造LR（O）分析表和实现某个符号串的分析掌握LR（O）分析法的基本思想。

实验环境

WindowsXP操作系统，VisualC++6.0以上编译环境

任务要求

1.录入合法的LR（0）文法

2.构造并输出LR（0）分析表

3.对输入的符号串进行语法分析

工作进度计划

序号

起止日期

工作内容

09.12.14-09.12.14

选定题目，明确题目要求

09.12.15-09.12.15

课题深入调研、细化工作，系统方案设计

09.12.16-09.12.17

程序录入、调试、整合

09.12.18-09.12.20

上机演示，课程设计分组答辩，完成课程设计报告

指导教师（签章）

年月日

摘要：

编译程序是现代计算机系统的基本组成部分之一，语法分析是编译程序的核

心部分，识别由语法分析给出的单词符号序列是否是给定文法的正确句子，把词

法记号流按语言的语法结构层次地分组，以形成语法短语。

一个编译程序的工作

过程一般可以划分为五个阶段：

词法分析、语法分析、语义分析与中间代码生成、优化、目标代码生成。

LR（0）是一种自底向上的语法分析方法，是已知的最一般的无回溯的移近一归约方法，这一方法能够识别所有能用上下文无关文法描述的程序语言的结构。

本文主要讨论LR（0）语法分析的构造。

着重分析LR（0）分析器的一般原理、实现思想、基本设计方法以及主要实现技术和工具。

操作员录入合法的LR（0）文法，则自动生成LR（0）分析表，并对任一输入串进行分析。

判断其是否是给定文法的句子。

还可以对输入的句子进行语法分析。

关键词：

自底向上分析；移进；规约

1课题综述1

1．1课题来源1

1．2意义1

1．3预期目标1

1．4面对的问题2

2系统分析3

2．1涉及的基础知识3

2．2总体方案5

3系统设计5

3．1算法描述6

3．3详细流程图9

4代码编写10

5程序调试15

总结19

致谢20

参考文献21

1课题综述

1.1课题来源

编译器设计的编译程序涉及到编译五个阶段中的三个，即词法分析器、语法

分析器和中间代码生成器。

编译程序的输出结果包括词法分析后的二元式序列、变量名表、状态栈分析过程显示及四元式序列程序。

整个编译程序分为三部分：

词法分析部分、语法分析处理及四元式生成部分、输出显示部分。

一个程序设计语言就是一个记号系统，如同自然语言一样，它的完整的定义应包括语法和语义两个方面。

所谓一个语言的语法是指一组规则，用它可以形成和产生一个合适的程序。

目前广泛使用的手段是上下文无关文法，即用上下文无关文法作为程序设计语言语法的描述工具。

自底向上分析方法是一种移进-规约过程，当分析的栈顶符号串形成句柄时就采取归约动作，因而自底向上分析法的关键问题是在分析过程中如何确定句柄。

LR分析法正是给出一种能根据当前分析栈中的符号串（通常以状态表示）和向右顺序查看输人串的k个（k>=0）符号就可惟一地确定分析器的动作是移进还是归约和用哪个产生式归约，因而也就能惟一地确定句柄。

LR分析法的归约过

程是规范推导的逆过程，所以LR分析过程是一种规范归约过程。

1.2意义

LR（0）分析方法虽然对文法的限制比较大，对绝大多数高级语言的语法分析器不能适用，然而他是构造其他LR类分析器的基础，学习和掌握LR（0）分析的原理和方法是我们掌握更高级语言语法分析的基础。

归纳起来，大体上可

分为两大类，即自顶向下分析方法和自底向上分析方法。

LR分析法的归约过程

是规范推导的逆过程，所以LR分析过程是一种规范归约过程。

本次课程设计的目标即是利用所学过的编译原理的知识，利用LR（O）分析法，

用C语言写出一个简单的LR（O）语法分析器。

该语法分析器所要完成的功能是，对录入的文法判断它是否为LR（O）文法，如果是输出LR（0）分析表；在给定文法的情况下，能够利用LR（0）分析表，对用户输入的一串字符串用LR（0）分析法进

行分析，判断该字符串是否为符合给定文法的一个句子，建立文法及其LR分析

表表示的数据结构，设计并实现一个LR（0）的分析器。

1.4面对的问题

（1）分析表的构造。

（2）归约还是移进的判断。

（3）接受acc的判断。

（4）编程结果的输出。

在本次课程设计中，主要的是面对的文法的确定，以及分析其工作过程如何进行。

对于文法确定的问题，必须找到一个符合LR（0）规范的文法，并且该文法不易太复杂，否则对于初次编写语法分析器的我们来说会比较复杂，否则容易出

错。

第二个就是分析过程的问题，目前，我们只是了解了理论上LR（0）的分析过

程，但如何将该过程用程序去实现，并且能够对一个输入串进行实时的分析是比较复杂的。

这涉及到对一个字符串进行一个字符一个字符的读取和操作，并且还

要对几个连在一起的字符进行合并等操作，要求比较的高，对我们而言比较困难。

在规范规约的过程中，一方面记住已移进和规约出的整个符号串，另一方面

根据所用的产生式推测未来可能碰到的输入符号。

当一串句柄的符号串呈现于分析栈的顶端时，希望能够根据上面过程中的数据来确定栈顶的符号串是否构成相对某一产生式的句柄。

能正确初始化状态栈，对栈内元素的进栈和出栈，取栈顶元素以及遍历栈元素，LR分析方法是一种自底向上的分析方法，是一种个移进-归约的过程。

当分析的栈顶符号串形成句柄时就采取归约动作，因而自底向上分析法的关键问题是

在分析过程忠如何确定句柄。

LR（0）分析器是在分析过程中不需要察看输入符号，因而它对文法的限制较大，对绝大多数高级语言的语法分析器是不能使用的，然而，他是构造其他LR类分析器的基础。

（1）词法编译器。

（2）交互式面向对象的词法编译器基本功能是。

（3）根据规约规则对字符进行归约。

（4）符合条件时采取移进动作。

2系统分析

2.1涉及的基础知识

2.1.1词法编译器功能

（1）导入任意文法，也可以自己输入。

（2）输出文法的分析过程，以及判断是否为LR（0文法，输出分析表。

（3）输入句子，进行语法分析。

（4）输出结构树。

2.1.2词法分析器的设计

方法有如下四个步骤：

（1）写出该语言的词法规则。

（2）把词法规则转换为相应的状态转换图。

（3）把各转换图的初态连在一起，构成识别该语言的自动机。

（4）设计扫描器；把扫描器作为语法分析的一个过程，当语法分析需要一个单词时，就调用扫描器。

扫描器从初态出发，当识别一个单词后便进入终态，送出二元式。

2.1.3动态模拟算法的基本功能

（1）输入LR分析表和一个句子。

（2）输出LR总控程序。

（3）输出依据句子构对应的语法树的过程。

（4）设计一个给定LR分析表，输入一个句子，能由依据LR分析表输出与句子对应的语法树，能对语法树生成过程进行模拟。

表2-1LR分析表

STA

ACTION

GOTO

acc

（5）输入句子：

bccd#。

（6）根据文法产生的LR分析表

（7）输出结果

2.1.4LR分析器的构成

一个LR分析器由3个部分组成

（1）总控程序，也可以称为驱动程序。

对所有的LR分析器，总控程序都是相同的。

（2）分析表或分析函数。

不同的文法分析表将不同，同一个文法采用的LR

分析器不同时，分析表也不同，分析表又可以分为动作（ACTION表和状

态转换（GOTO表两个部分，它们都可用二维数组表示。

（3）分析栈，包括文法符号和相应的状态栈。

它们均是先进后出栈。

分析器的动作由栈顶状态和当前输入符号所决定（LR（0分析器不需向前查看输入符号）。

1、用构造一个状态转换函数实现状态转换。

2、再通过函数构造一个移进-归约函数实现移进规约动作。

3、采用构造一个打印LR分析器的工作过程函数实现输出。

在规范规约的过程中，一方面记住已移进和规约出的整个符号串，另一方面根据所用的产生式推测可能碰到的输入符号。

每一项ACTION（§a）所规定的动作不外是下述四种可能之一：

（1）移进：

把（s,a）的下一个转态s'=GOTO（X）和输入符号a推进栈，下一输入符号变成现行输入符号。

（2）规约：

指用某一产生式进行规约。

假若B的长度为r,规约的动作是A,去除栈顶的r个项，使状态Sm-r变成栈顶状态，然后把（Sm-r,A）的下一状态s'=GOTO（S|A）和文法符号A推进栈。

规约动作不改变现行输入符号。

执行规约动作意味着B（=Xm-r+1…Xm已呈现于栈顶而且是一个相对于A的句柄。

（3）接受：

宣布分析成功，停止分析器的工作。

（4）报错：

发现源程序含有错误，调用出错处理程序。

2.3总体方案

本课题是由一个四人的团队去完成的，所以，每个小组成员分配了不同的工作共同完成这个项目。

2.4功能模块框图

图2.2功能模块框图

3系统设计

3.1算法描述

1、已知文法G

（1）E—E+T

⑵E—T

（3）T—T*F

⑷T—F

⑸F—（E）

⑹F—i

2、LR（O分析表的构造算法如下：

假设已构造出LR（O项目集规范族为：

C={IO,I1,…，In}

其中Ik为项目集的名字，k为状态名，令包含S'—・项目的集合Ik的下标k为分析器的初始状态。

那么分析表的ACTION表和GOTO表构造步骤为：

（1）若项目A—a・属于Ik且转换函数GO（lk,a）=lj,当a为终结符时则置ACTION[k,a为Sj，其动作含意为将终结符a移进符号栈，状态j进入状态栈，（相当状态k时遇a转向状态j）。

⑵若项目A—a•属于Ik，则对任何终结符a和#号置ACTION[k,a和

ACTION[k,#为"rj"，j为在文法G'中某产生式A—a的序号。

rj动作的含义是把当前文法符号栈顶的符号串a归约为A,并状态栈指针从栈顶向下移动|a的长度，文法符号栈从栈顶弹出|a个符号，非终结符A变为当前面临的符号。

（3）若GO（Ik,A>j则置GOTO[k,A为"j"，其中A为非终结符，表示当前状态为"k"时，遇文法符号A时状态应转向j，因此A移入文法符号栈，j移入状态栈。

⑷若项目S'—S属于Ik,则置ACTION[k,#为"acc",表示接受。

（5）凡不能用上述方法填入的分析表的元素，均应填上"报错标志"。

为了表

的清晰我们仅用空白表示错误标志。

根据这种方法构造的LR（0分析表不含多重定义时，称这样的分析表为LR（0）

分析表，能用LR（0分析表的分析器称为LR（0分析器，能构造LR（0分析表的文法

称为LR（0）文法。

3、产生如图2-1所示的LR分析表

这张分析表包括两个部分，一是动作”（ACTION表，另一是状态转换”

（GOTO表。

ACTION（S,a规定了当状态S面临输入符号a时应采取什么动作。

GOTO（S,X）规定了状态S面对文法符号X（终结符或非终结符）时下一状态是什么。

显然，GOTO（SX）定义了一个以文法符号为字母表的DFA

每一项ACTION（Sa）所规定的动作不外是下述四种可能之一：

（1）移进把（S，a）的下一个转态S'=GOTQ（S<）和输入符号a推进栈，下一输入符号变成现行输入符号。

（2）规约指用某一产生式进行规约。

假若B的长度为r，规约的动作是A，去除栈顶的r个项，使状态Sm-r变成栈顶状态，然后把（Sm-r，A）的下一状态S'=GOTO（S?

A）和文法符号A推进栈。

规约动作不改变现行输入符号。

执行规约动作意味着B（=Xm-r+1…Xm已呈现于栈顶而且是一个相对于A的句柄。

（3）接受宣布分析成功，停止分析器的工作。

（4）报错发现源程序含有错误，调用出错处理程序。

一个LR分析器的工作过程可看成是栈里的状态序列，已规约串和输入串所

构成的三元式的变化过程。

分析开始时的初始三元式为：

（S0,#,

a1a2an#）

其中，S0为分析器的初态；#为句子的左括号；a1a2……ar为输入串；其后的#为结束符（句子右括号）。

分析过程每步的结果可表示为：

（S0S1Sm#X1X2••…Xmai,ai+1……•an#

3.2实现方法

3.2.1构造分析表

LR分析器实质上是一个带先进后出存储器（栈）的确定有限状态自动机。

LR分析器的每一步工作是由栈顶状态和现行输入符号所唯一决定的。

构造一个int型二维数组table[13][9],用于存放LR分析表。

并初始化。

作者这样规定：

0〜11

表示

状态Sj,其中0对应S0,1对应S1•…

21〜26

表示

规约Rj,其中21对应R1，22对应R2

表示

接受”。

-1

表示

规约出错，报错。

322程序设计关键

（1）在输入串（句子）输入的过程中，涉及到一个压栈的问题。

但是输入串

压入的字符顺序刚好与原理中的字符串模型刚好相反，这样需要先弹出的反而在

栈底。

为了既要保证字符串输入，又要让输入的字符串存储顺序与输入的字符串相反。

采取以下措施：

先将输入的字符串压入符号栈symbol中，然后符号栈弹出的字符再压入输入串栈instr中，这样实现了输入串的倒序存储。

（2）状态栈和符号栈输出（遍历）过程均采取自栈底到栈顶的顺序，而输入串栈则是采取自栈顶到栈底的顺序输出。

3.2.3LR（0项目集规范族的构造

识别活前辍的NFA我们可以利用子集法将其确定化。

对确定化后的DFA如

果把每个子集中所含状态集对应的项目写在新的状态中。

对于构成识别一个文法活前缀的DFA项目集（状态）的全体称为这个文法的LR（0项目集规范族，我们可以分析每个状态中项目集的构成，不难发现如下规律：

若状态中包含形如A-a・B0项目，则形如的项目也在此状态内。

例如：

0状态中项目集为{S'-•aA,E-bbB}

回顾由NFA确定化到DFA时，a和E-・b正是属于的闭包中。

因而，可引入闭包函数（CLOSUR来求DFA一个状态的项目集。

若文法G已拓广为G',而S为文法G的开始符号，拓广后增加产生式S'-S。

如果I是文法G'的一个项目集，定义和构造I的闭包CLOSURE如下：

（1）I的项目均在CLOSURE中。

（2）若A-a・属于CLOSURE，）则每一形如B-・Y项目也属于

CLOSURE。

）©）重复

（2）直到不出现新的项目为止。

即CLOSURE不再扩大。

由此，我们可以很容易构造出初态的闭包，即S'-・属于I，再按上述三点求其闭包。

回顾在构造识别活前缀的NFA时，其两个相邻状态对应的项目是出自同一个产生式，只是圆点的位置相差1，箭弧上的标记为前一个状态和后一个状态对应项目圆点间的符号，（除了箭弧上标记为&的外）。

由于识别活前缀的DFA的每个状态是一个项目集，项目集中的每个项目都不

相同，每个项目圆点后的符号不一定相同，因而对每个项目圆点移动一个位置后，箭弧上的标记也不会完全相同，这样，对于不同的标记将转向不同的状态。

例如初态aA,Ef•对第一个项目圆点右移一个位置后变为S'fE箭弧标记应为E,对第二个项目a，圆点右移一个位置后，项目变为Efa•，箭弧

标记为a,同样第三个项目为圆点右移一个位置后变为Efb•，箭弧标记为b，显然，初态可发出三个不同标记的箭弧，因而转向三个不同的状态，也就由初态派生出三个新的状态，对于每个新的状态我们又可以利用前面的方法，若圆点后为

非终结符则可对其求闭包，得到该状态的项目集。

圆点后面为终结符或在一个产生式的最后，贝U不会再增加新的项目。

3.3详细流程图

图3.2LR分析器设计流程图

4代码编写

4.1主要模块的代码分析

4.1.1生成分析表代码

voidCLROForWinDlg:

OnGtable（）

{

CTableDlgdlg;

dlg.SetControlInfo（IDC_EXPLORER1,RESIZE_BOTH）;

dlg.SetControllnfo（IDOK,ANCHORE_BOTTOM|ANCHORE_RIGHT）;

dlg.SetControllnfo（IDC_EXPORT,ANCHORE_BOTTOM|ANCHORE_RIGHT）;

dlg.SetControllnfo（IDC_ANALYZE,ANCHORE_BOTTOM|ANCHORE_RIGHT）;

stringtemp="";

CStringt;

for（inti=0;i

{

m_vtlist.GetText（i,t）;

〃temp.push_back（t.GetAt（O））;

temp+=t.GetAt（0）;

}

dlg.g.SetVt（temp）;

temp="";

for（i=0;i

{

m_vnlist.GetText（i,t）;

〃temp.push_back（t.GetAt（O））;

temp+=t.GetAt（0）;

}

dlg.g.SetVn（temp）;

m_startedit.GetWindowText（t）;

if（t==""）

{

MessageBox（"输入的文法有误，请检查！

","错误”,MB_OK|MB_ICONSTOP）;

return;

}

dlg.g.SetStart（t.GetAt（O））;

temp="";

for（i=0;i

{

temp="";

m_plist.GetText（i,t）;

for（intj=0;j

〃temp.push_back（t.GetAt（j））;

temp+=t.GetAt（j）;

dlg.g.AddPrecept（temp）;

}

if（dlg.g.IsGrammarLegal（））

{

dlg.g.GenerateLR0Table（）;

dlg.DoModal（）;

}

else

{

MessageBox（"输入的文法有误，请检查！

","错误",MB_OK|MB_ICONSTOP）;

}

4.1.2分析句子代码

voidCAnalyzeDlg:

OnButton1（）

{

//TODO:

Addyourcontrolnotificationhandlercodehere

UpdateData（TRUE）;

m_pTree->m_tree.DeleteAllltems（）;

for（inti=0;i

{

if（!

m_g.IsInVt（m」nput.GetAt（i）））

{

MessageBox（"输入的句子不全部由终结符组成",

MB_ICONSTOP）;

return;

}

assert（TreeStack.empty（））;

m」nput+="#";

charszTempPath[MAX_PATH];

charszTempName[MAX_PATH];

if（m_strTempFilename!

=""）

DeleteFile（m_strTempFilename.c_str（））;

GetTempPath（1OO,szTempPath）;

GetTempFileName（szTempPath,"LRO",O,szTempName）;

m_strTempFilename=szTempName;

CStdioFileout;

out.Open（szTempName,CFile:

modeCreate|CFile:

modeWrite）;

out.WriteString（"\n"）;

out.WriteString（"UntitledDocument\n"）;

out.WriteString（"

charset=gb2312\">\n"）;

out.WriteString（"\n"）;

"错误",MB_OK|

content=\"text/html;

out.WriteString（"\n”）;style=\"border-collapse:

collapse'"bordercolor=\"#111111\">\n"）;

out.WriteString（"\n 步骤 \n 状态栈\n 符号栈 \n

展开阅读全文