《系统软件开发实践》 实验报告 第3页
件中的字符串相匹配,则yylex()执行能匹配最长字符串的模式,称为“最长匹配原则”;若还有多个模式匹配长度相同的字符串, 则yylex()选择在LEX源文件中排列最前面的模式进行匹配,称为“最先匹配原则”。yylex()常通过超前搜索一个字符来实现这样的原则,如果使 用超前搜索匹配了某一模式,则yylex()在进行下一次分析前,将回退一个字符。
另外,LEX提供控制模式在一定状态下使用的功能,称为条件模式。LEX首先在定义部份通过%start来定义条件句。在规则部份可通过宏BEGIN 条件名 来激活条件。BEGIN INITIAL或BEGIN 0将休眠所有的条件模式,使分析器回到开始状态。
四、实验步骤和过程分析
1、lex源代码编写
通过前期对flex的了解自主编写了 以下简单的的词法分析器,该词法分析器能够实现基本的词法分析功能如行数、关键字个数、单词个数以及简单注释等的判别。由于功能简单,所以本次代码完全是自己一一在记事本里面编写而成;
digit [0-9]
NUM [digit][digit]* /*此正则表达式用于对数字进行匹配*/ letter [A-Za-z]
ID [letter][letter]* /*此正则表达式是用于对标示符进行模式匹配*/ \
\ /*这是实现代对关键字进行匹配*/
\/*这些代码可以用于匹配其它符号*/
[^ \\t\\n]+ { nword++;} /*识别单词个数*/
\\n {hangshu++;} /*对行数进行识别并统计*/ /*下面再编写一个comment函数用于判断注释*/ comment(){ char c,c1; loop:
while((c=input())!='*'&&(c!=0)) putchar('\\n');
if((c1=input())!='/'&&c!=0) {
unput(c1); goto loop; }
if(c!=0)
putchar('\\n');} int yywrap() {return 1;}
最后将这些代码按照flex语法进行整合得到完整flex源码。
-
《系统软件开发实践》 实验报告 第4页
2、通过命令行调试运行得到lex.yy.exe文件;
3、编写测试文件(命名为123.cpp)并与lex.yy.exe放于同一文件夹内;
123.cpp:
#include
int a=33,b=1123; c=12; c=a+b;
cout<<\return 0; }
4、运用命令行的lex.yy.exe <123.cpp运行得到结果:
五、实验小结
本次实验通过对flex基本知识的阅读基本掌握了简单的lex语法和规则,也可以自行设计编制调试一个具体的词法分析程序,不仅加深对了词法分析原理的理解,也初步掌握了在对程序设计语言源程序进行扫描过程中将其分解为各类单词的词法分析方法。
实验二(第二周) 语法分析器(bison简单实验)
一、实验目的
1、了解语法分析工具bison的用法和自动生成语法分析器的过程和原理;
-
《系统软件开发实践》 实验报告 第5页
2、学习和掌握flex与bison联合编译的思想和方法,能够通过这种方法编译实现基本编译器的构造和设计。
二、实验说明
bison 是属于 GNU 项目的一个语法分析器生成器。Bison 把一个关于“向前查看 从左到右 最右”(LALR) 上下文无关文法的描述转化成可以分析该文法的 C 或 C++ 程序。它也可以为二义文法生成 “通用的 从左到右 最右” (GLR)语法分析器。
本次试验主要是学习并利用语法分析器生成工具Bison编写一个语法分析程序,与词法分析器结合,能够根据语言的上下文无关文法,识别输入的单词序列是否文法的句子,实验中可以编写一个测试程序,以给定的测试文件作为输入,输出运行结果到输出文件中。
三、实验原理与分析
Bison是一种通用目的的分析器生成器。它将LALR(1)上下文无关文法的描述转化成分析该文法的C程序。
使用bison的前提是使用flex事先生成相关词法分析器。Flex可以识别正则表达式,而bison可以识别语法。Flex把输入流分解为若干个片段(记号),而bison则可以将这些记号基于逻辑进行合并。
Bison基于我们所给定的语法来生成一个可以识别这个语法中有效语句的语法分析器。而且bison只处理语法,你需要保证其他部分的完整性。语法由一系列规则组成,语法分析器就是基于这些规则来识别语法上正确的输入。Bison的.y文件也是分成三个部分: 1、声明部分:所有词法单元的定义可以放在此处 2、规则部分:具体的语法和相应的动作
3、用户自定义部分。第三部分会被bison原封不动的拷贝进生成的.C文件
当bison读入一个终结符(token),它会将该终结符及其语意值一起压入堆栈。这个堆栈叫做分析器堆栈(parser stack)。把一个token压入堆栈通常叫做移进(shifting)。但堆栈并不是每读入一个终结符就分配一个栈元素给它。当已经移进的后n个终结符和组(groupings)与一个文法规则相匹配时,它们会被根据那个规则结合起来。这叫做归约(reduction)。栈中的那些终结符和组会被单个的组(grouping)替换。那个组的符号就是那个规则的结果。执行该规则的相应的动作(Action)也是归约处理的一部分,这个动作会计算这个组的语意值。
分析器通过移进和归约尝试着缩减整个输入到单个的组。这个组的符号就是文法中的起始符号(start-symbol)。Bison分析器并不总是在后n个终结符与组匹配某一规则时立
-
《系统软件开发实践》 实验报告 第6页
即就进行归约。这种策略对于大部分语言来说并不合适。相反,当可以进行归约时,分析器有时会“预读”(looks ahead)下一个终结符来决定做什么。当一个终结符被读进来后,并不会立即移进堆栈,而是首先作为一个预读终结符(look-ahead token)。此后,分析器开始对栈上的终结符和组执行一个或多个归约,而预读终结符仍然放在一边。当没有归约可做时,这个预读终结符才会被移进堆栈。这并不表示所有可能的归约都已经做了,这要取决于预读终结符的类型,一些规则可能选择推迟它们的使用。
四、实验过程详细分析和步骤
(1)简单bison与flex联合编译实验
1、window下首先将bison安装在与flex安装的相同目录下,编写编写bison文件即.y文件并保存在bison目录下,然后通过调用命令行生成.tab.c和.tab.h文件;
2、编写词法分析文件并将上述的.Tab.h包含在头文件中,然后后调用命令行生成.yy.c
文件,利用命令行将.yy.c和.tab.c文件生成为可执行文件exe文件; 3、在命令行里利用生成的exe文件调用测试文件得到结果。
(2)利用语法分析器生成工具Bison编写一个语法分析程序,与词法分析器结合,能够根据语言的上下文无关文法,识别输入的单词序列是否文法的句子。
1、编写代码并分别编译flex和bison产生相应文件;
2、comment函数调用yyinput,编译的时候出现了链接错误,将lex.yy.c中的yyinput
函数定义拷贝一份到input.lex, 重命名为my_yyinput即可解决,另外还要修改生成
-
相关推荐: