《编译原理》实验指导书Word文档格式.docx

资源描述

《编译原理》实验指导书Word文档格式.docx

《《编译原理》实验指导书Word文档格式.docx》由会员分享，可在线阅读，更多相关《《编译原理》实验指导书Word文档格式.docx（25页珍藏版）》请在冰豆网上搜索。

《编译原理》实验指导书Word文档格式.docx

表I语言中的各类单词符号及其分类码表

单词符号

类别编码

类别码的助记符

单词值

begin

BEGIN

end

END

then

THEN

else

ELSE

标识符

字母打头的字母数字串

整常数

INT

数字串

处理过程：

在一个程序设计语言中，一般都含有若干类单词符号，为此可首先为每类单词建立一张状态转换图，然后将这些状态转换图合并成一张统一的状态图，即得到了一个有限自动机，再进行必要的确定化和状态数最小化处理，最后据此构造词法分析程序。

在此为了使词法分析程序结构比较清晰，且尽量避免某些枝节问题的纠缠，假定要编译的语言中，全部关键字都是保留字，程序员不得将它们作为源程序中的标识符；

在源程序的输入文本中，关键字、标识符、整常数之间，若未出现关系和算术运算符以及赋值符，则至少须用一个空白字符加以分隔。

作了这些限制以后，就可以把关键字和标识符的识别统一进行处理。

即每当开始识别一个单词时，若扫视到的第一个字符为字母，则把后续输入的字母或数字字符依次进行拼接，直至扫视到非字母、数字字符为止，以期获得一个尽可能长的字母数字字符串，然后以此字符串查所谓保留字表（此保留字表已事先造好），若查到此字符串，则取出相应的类别码；

反之，则表明该字符串应为一标识符。

采用上述策略后，针对表I中部分单词可以构造一个如图1所示的有限自动机（以状态转换图表示）。

在图1中添加了当进行状态转移时，词法分析程序应执行的语义动作。

根据图1，可用C语言编写出符合以上几项要求的一个相应的扫描器程序，如程序一所示。

图1识别表I所列语言中的部分单词的DFA及相关的语义过程

图1及程序一中所出现的语义变量及语义函数的含义和功能说明如下：

函数GETCHAR：

每调用一次，就把扫描指示器当前所指示的源程序字符送入字符变量ch，然后把扫描指示器前推一个字符位置。

字符数组TOKEN：

用来依次存放一个单词词文中的各个字符。

函数CAT：

每调用一次，就把当前ch中的字符拼接于TOKEN中所存字符串的右边。

函数LOOKUP：

每调用一次，就以TOKEN中的字符串查保留字表，若查到，就将相应关键字的类别码赋给整型变量c；

否则将c置为零。

函数RETRACT：

每调用一次，就把扫描指示器回退一个字符位置（即退回多读的那个字符）。

函数OUT：

一般仅在进入终态时调用此函数，调用的形式为OUT（c，VAL）。

其中，实参c为相应单词的类别码或其助记符；

当所识别的单词为标识符和整数时，实参VAL为TOKEN（即词文分别为字母数字串和数字串），对于其余种类的单词，VAL均为空串。

函数OUT的功能是，在送出一个单词的内部表示之后，返回到调用该词法分析程序的那个程序。

程序一根据图1编写的扫描器

#include<

stdio.h>

ctype.h>

string.h>

#defineID6

#defineINT7

#defineLT8

#defineLE9

#defineEQ10

#defineNE11

#defineGT12

#defineGE13

charTOKEN[20]；

externintlookup（char*）;

externvoidout（int,char*）;

externreport_error（void）;

voidscanner_example（FILE*fp）

{

charch;

inti,c;

ch=fgetc（fp）;

if（isalpha（ch））/*itmustbeaidentifer!

TOKEN[0]=ch;

ch=fgetc（fp）;

i=1;

while（isalnum（ch））

TOKEN[i]=ch;

i++；

}

TOKEN[i]=′＼0′

fseek（fp,-1,1）;

/*retract*/

c=lookup（TOKEN）;

if（c==0）out（ID,TOKEN）;

elseout（c,"

）；

if（isdigit（ch））

ch=fgetc（fp）;

while（isdigit（ch））

i++;

ch=fgetc（fp）;

TOKEN[i]=′＼0′；

out（INT,TOKEN）;

switch（ch）

case′＜′:

if（ch==′=′）out（LE,"

）;

elseif（ch==′＞′）out（NE,"

fseek（fp,-1,1）;

out（LT,"

break;

case′=′:

out（EQ,"

break;

case′＞′:

if（ch==′=′）out（GE,"

out（GT,"

default:

report_error（）;

return;

提示：

扫描器所用的若干函数以及主程序有待于具体编写，并需事先建立好保留字表，以备查询。

例如：

/*建立保留字表*/

#defineMAX_KEY_NUMBER20/*关键字的数量*/

#defineKEY_WORD_END“waitingforyourexpanding”/*关键字结束标记*/

char*KeyWordTable[MAX_KEY_NUMBER]={“begin”,“end”,“if”,“then”,“else”,KEY_WORD_END};

/*查保留字表，判断是否为关键字*/

intlookup（char*token）

inti=0;

while（strcmp（KeyWordTable[n],KEY_WORD_END））/*strcmp比较两串是否相同，若相同返回0*/

if（!

strcmp（KeyWordTable[n],token））/*比较token所指向的关键字和保留字表中哪个关键字相符*/

returnn+1;

/*设置正确的关键字类别码，并返回此类别码的值*/

n++;

return0;

/*单词不是关键字，而是标识符*/

另外，在扫描源程序字符串时，一旦识别出关键字、标识符、整常数以及运算符中之一，即以二元式形式（类别编码，值）输出单词到指定文件中。

每次调用词法分析程序，它均能自动继续扫描下去，形成下一个单词，直至整个源程序全部扫描完毕，并形成相应的单词串形式的源程序。

题目2：

将表I单词集中的整常数改为无符号常数，修改题目1中已开发的扫描器。

无符号常数的单词分类码助记符：

UCON；

其值为无符号常数的机内二进制表示。

描述无符号数的正规文法和状态转换图：

无符号数的右线性文法G[<

无符号数>

]如下：

〈无符号数〉→d〈余留无符号数〉

〈无符号数〉→·

〈小数部分〉

〈无符号数〉→d

〈余留无符号数〉→d〈余留无符号数〉

〈余留无符号数〉→·

〈十进小数〉

〈余留无符号数〉→E〈指数部分〉

〈余留无符号数〉→d

〈十进小数〉→E〈指数部分〉

〈十进小数〉→d〈十进小数〉

〈十进小数〉→d

〈小数部分〉→d〈十进小数〉

〈小数部分〉→d

〈指数部分〉→d〈余留整指数〉

〈指数部分〉→+〈整指数〉

〈指数部分〉→-〈整指数〉

〈指数部分〉→d

〈整指数〉→d〈余留整指数〉

〈整指数〉→d

〈余留整指数〉→d〈余留整指数〉

〈余留整指数〉→d

图2所示为上述文法的状态转换图，其中编号0、1、2、…、6分别代表非终结符号<

、<

余留无符号数>

十进小数>

小数部分>

指数部分>

整指数>

及<

余留整指数>

。

图2文法G[<

]的状态转换图

实现无符号数识别的参考方法：

在计算机内实现状态转换图的方法之一，是以状态图中的各个状态为行，以可能输入的各个输入符号为列，组成一个状态矩阵。

其中，矩阵的元素用来指明下一个状态和扫描器应完成的语义动作（如拼接字符、数制转换、查填符号表以及输出单词的内部表示等）。

由于在一个状态矩阵中，通常有许多状态都是出错状态，为了节省存放状态矩阵的存储空间，在具体实现时，常常采用更为紧凑和有效的数据结构。

例如，对于文法G[<

]的状态转换图，可按表II的形式来存放其状态矩阵。

表II中的第一列为各状态Si的编号，第二列分别列出了在每一状态下可能扫视到的输入符号aj（其中“other”是一个符号集合，用来表示在相应状态所属的那一栏中，除其前所列字符之外的全部其它字符），第三列指出当（Si,aj）出现时应执行的语义动作（通常用若干个语句来实现，若其后空，则表示不进行任何处理），最后一栏用来指明下一状态的编号（若其后NULL或“结束”则表示无后继状态）。

状态矩阵中所嵌入的语义动作，其功能是在扫描源程序字符串的过程中，把识别出的字符串形式的无符号数的值，逐步转换为相应的二进制整数（ICON）或二进制浮点数（FCON）的内部形式，方法详见教材第56页。

（注：

考虑能否采用C语言的库函数实现此语义处理工作。

）

表II包含语义处理过程的识别无符号数的状态矩阵

根据加入语义过程说明的状态转换图直接编写词法分析程序，部分实现代码如下：

程序二单词分类码为UCON的无符号数的识别程序

1#include<

2#include<

3#include<

math.h>

4#defineLETTER0

5#defineDIGIT1

6#definePOINT2

7#defineOTHER3

8#definePOWER4

9#definePLUS5

10#defineMINUS6

11#defineUCON7//Supposetheclassnumberofunsignedconstantis7

12#defineClassOther200

13#defineEndState-1

14intw,n,p,e,d;

15intClass;

//Usedtoindicateclassoftheword

16intICON;

17floatFCON;

18staticintCurrentState;

//Usedtopresentcurrentstate,theinitialvalue:

20intGetChar（void）;

21intEXCUTE（int,int）；

22intLEX（void）；

23intHandleOtherWord（void）

24{returnClassOther;

25}

26intHandleError（void）

27{printf（"

Error!

＼n"

return0;

29intGetChar（void）

30{

31intc;

32c=getchar（）;

33if（isdigit（c））{d=c-′0′;

returnDIGIT;

34if（c==′.′）returnPOINT;

35if（c==′E′||c==′e′）returnPOWER;

36if（c==′+′）returnPLUS;

37if（c==′-′）returnMINUS;

38returnOTHER;

39}

40intEXCUTE（intstate,intsymbol）

41{

42switch（state）

43{

44case0:

switch（symbol）

45{

46caseDIGIT:

n=0;

p=0;

e=1;

w=d;

CurrentState=1;

Class=UCON;

47casePOINT:

w=0;

n=0;

CurrentState=3;

48default:

HandleOtherWord（）;

Class=ClassOther;

49CurrentState=EndState;

50}

51break;

52case1:

53{

54caseDIGIT:

w=w*10+d;

//CurrentState=1

55casePOINT:

CurrentState=2;

56casePOWER:

CurrentState=4;

57default:

ICON=w;

CurrentState=EndState;

58}

59break；

60case2:

61{

62caseDIGIT:

n++;

w=w*10+d;

63casePOWER:

64default:

FCON=w*pow（10,e*p-n）;

65}

66break;

67case3:

68{

69caseDIGIT:

CurrentState=2;

70default:

HandleError（）；

71}

72break；

73case4:

74{

75caseDIGIT:

p=p*10+d;

CurrentState=6;

76caseMINUS:

e=-1;

CurrentState=5;

77casePLUS:

CurrentState=5;

78default:

HandleError（）;

79}

80break；

81case5:

82{

83caseDIGIT:

84default:

85}

86break;

87case6:

88{

89case:

DIGIT:

p=p*10+d;

90default:

91}

92break;

93}

94returnCurrentState;

95}

96intLEX（void）

97{

98intch;

99CurrentState=0;

100while（CurrentState!

=EndState）

101{

102ch=GetChar（）;

103EXCUTE（CurrentState,ch）;

104}

105returnClass;

106}

五、扩展要求

有余力的同学，可选作以下内容（上机实验成绩有加分）：

1、在词法分析过程中建立变量名表和常数表，以备以后的编译过程（如语法分析）查询；

扩充关键字的数目、增加单词类别（如逻辑运算符等）、将常数分成字符串常量、整型常量和实型常量等；

添加词法分析中单词出错的位置、加细错误类型的检查，以及删除注释部分等。

2、识别一个程序设计语言（如C语言或其大小适宜的一个子集）所有单词的词法分析程序设计。

建议利用LEX系统。

六、注意

1、上机前的准备：

完成词法分析程序的程序流图，并选择好相应的数据结构。

2、编程：

用C语言或你熟悉的其它高级程序设计语言编写一个规模适当的扫描器。

3、调试：

将各个模块连接成一个完整程序，并整体调试成功。

4、测试：

用于测试扫描器的实例源文件中应有词法正确的，也应有错误的字符串，并至少应包含两行以上的源代码。

5、输出结果：

对于输入的测试用例的源程序文件，以对照的形式将扫描器的分析结果在输出文件中表示出来，必要时给出正误信息。

实验二语法分析程序实现

通过设计、编制、调试一个典型的语法分析程序（任选有代表性的语法分析方法，如算符优先法、递归下降法、LL

（1）、SLR

（1）、LR

（1）等，作为编制语法分析程序的依据），对扫描器所提供的单词序列进行语法检查和结构分析，实现并进一步掌握常用的语法分析方法。

选择对各种常见高级程序设计语言都较为通用的语法结构作为分析对象，给出其文法描述（注意应与所采用的语法分析方法比较贴近），设计并实现一个完整的语法分析程序。

源程序以文件的形式输入。

对于所输入的源程序，如果输入符号串是给定文法定义的合法句子，则输出“RIGHT”，并且给出每一步归约的过程；

如果不是句子，即输入串有错误，则输出“ERROR”，并且显示已经归约出的各个文法符号，以及必要的出错说明信息。

三、基本实验题目

以如下文法G1所定义的算术表达式的赋值语句作为分析对象，编写并调试一个语法分析程序。

G1[<

复合语句>

]：

→begin<

语句表>

→<

语句>

;

赋值语句>

变量>

算术表达式>

项>

因式>

常数>

|（<

标识符>

字母>

数字>

整数>

浮点数>

→•<

•<

→A|B|C|…|X|Y|Z|a|b|c|…|x|y|z

→0|1|2|…|9

说明：

1）可将以上文法G1[<

]中的语法范畴<

替换为实验一中的文法G[<

]，并将单词类型——无符号常数进一步细分成整数和浮点数两类单词。

2）注意修改实验一中的词法分析程序，并将它编写为子程序的形式，以便供语法分析程序调用，从而在对源程序的一遍扫描过程中，同时完成词法和语法分析任务。

3）要求加强错误检查，对输入符号串中有词法、语法错误的语句，给出必要的错误说明信息，尽可能多地、确切地指出错误的位置、原因和性质。

例如，在词法分析阶段，对当前正在处理的字符ch，可进一步定义一些与该字符相关的信息row和col

展开阅读全文