1、 = = ; ( ) #(3)其他单词是标识符(ID)和整型常数(SUM),通过以下正规式定义:ID = letter (letter | digit)*NUM = digit digit*(4)空格有空白、制表符和换行符组成。空格一般用来分隔ID、SUM、运算符、界符和关键字,词法分析阶段通常被忽略。 1.2.2 各种单词符号对应的种别码:表1.1 各种单词符号对应的种别码单词符号种别码 种别码int1+17If2-18Then3:=19else423write824lettet(letter|digit)*10=25dight dight*11;2612(27+13)28-1430*153
2、1/1632 ,3335 36 1.2.3 词法分析程序的功能:输入:所给文法的源程序字符串。输出:二元组(syn,token或sum)构成的序列。其中:syn为单词种别码; token为存放的单词自身字符串; sum为整型常数。例如:对源程序输入如下: Int x,y; X:=2*y; If(x5) Then x:=2*x+2/3;#后经词法分析输出如下序列:( 35 (int 1)(x 10)(, 33)(y 10) (;26)(x 10)1.3 词法分析程序的算法思想:算法的基本任务是从字符串表示的源程序中识别出具有独立意义的单词符号,其基本思想是根据扫描到单词符号的第一个字符的种类,拼
3、出相应的单词符号。1.3.1 主程序示意图:主程序示意图如图1.1所示。其中初始包括以下两个方面: 关键字表的初值。关键字作为特殊标识符处理,把它们预先安排在一张表格中(称为关键字表),当扫描程序识别出标识符时,查关键字表。如能查到匹配的单词,则该单词为关键字,否则为一般标识符。关键字表为一个字符串数组,其描述如下:Char *rwtab6 = “int”, “if”, “then”, “else”,“while”, “do”, “read”,”write”; 图1.1(2)程序中需要用到的主要变量为syn,token和sum 1.3.2 扫描子程序的算法思想:首先设置3个变量:token用来
4、存放构成单词符号的字符串;sum用来整型单词;syn用来存放单词符号的种别码。扫描子程序主要部分流程如图1.2所示。 图 1.21.3.3 词法分析程序的C语言程序源代码:1.3.4 结果分析:输入如下:26)(x 10) 如图1.3所示: 图1.31.3.5 总结:词法分析的基本任务是从字符串表示的源程序中识别出具有独立意义的单词符号,其基本思想是根据扫描到单词符号的第一个字符的种类,拼出相应的单词符号。通过本试验的完成,更加加深了对词法分析原理的理解。2 语法分析2.1 实验目的编制一个递归下降分析程序,实现对词法分析程序所提供的单词序列的语法检查和结构分析。2.2实验要求利用C语言编制递归下降分析程序,并对简单语言进行语法分析。2.2.1 待分析的简单语言的语法用扩充的BNF表示如下:=语句串;+ | -* | /=ID | NUM | (“置初值” 调用scaner函数读下一个单词符号 调用IrParse 四元式输出-结束。“先判断是否有声明” 不是则“出错处理”,若是则“调用scaner函数” 调用语句串分析函数 “判断是否为” 不是则“出错处理”,若是则调用scaner函数 “判断syn=0&