编译原理词法分析器语法分析课程设计.docx
《编译原理词法分析器语法分析课程设计.docx》由会员分享,可在线阅读,更多相关《编译原理词法分析器语法分析课程设计.docx(39页珍藏版)》请在冰点文库上搜索。
![编译原理词法分析器语法分析课程设计.docx](https://file1.bingdoc.com/fileroot1/2023-5/11/1e2585b3-dc05-47fb-b4ed-b85a2716855b/1e2585b3-dc05-47fb-b4ed-b85a2716855b1.gif)
编译原理词法分析器语法分析课程设计
《编译原理》
课程设计
院系信息科学与技术学院
专业软件工程
年级2011级
学号20112723
姓名林苾湲
西南交通大学信息科学与技术学院
2013年12月
目录
课程设计1词法分析器2
1.1设计题目2
1.2设计内容2
1.3设计目的2
1.4设计环境2
1.5需求分析2
1.6概要设计2
1.7详细设计4
1.8编程调试5
1.9测试11
1.10结束语13
课程设计2赋值语句的解释程序设计14
2.1设计题目14
2.2设计内容14
2.3设计目的14
2.4设计环境14
2.5需求分析15
2.6概要设计16
2.7详细设计16
2.8编程调试24
2.9测试24
2.10结束语25
课程设计一词法分析器设计
一、设计题目
手工设计c语言的词法分析器(可以是c语言的子集)。
二、设计内容
处理c语言源程序,过滤掉无用符号,判断源程序中单词的合法性,并分解出正确的单词,以二元组形式存放在文件中。
三、设计目的
了解高级语言单词的分类,了解状态图以及如何表示并识别单词规则,掌握状态图到识别程序的编程。
四、设计环境
该课程设计包括的硬件和软件条件如下:
4.1.硬件
(1)IntelCoreDuoCPUP8700
(2)内存4G
4.2.软件
(1)Window732位操作系统
(2)MicrosoftVisualStudioc#开发平台
4.3.编程语言
C#语言
五、需求分析
5.1.源程序的预处理:
源程序中,存在许多编辑用的符号,他们对程序逻辑功能无任何影响。
例如:
回车,换行,多余空白符,注释行等。
在词法分析之前,首先要先剔除掉这些符号,使得词法分析更为简单。
5.2.单词符号的识别并判断单词的合法性:
将每个单词符号进行不同类别的划分。
单词符号可以划分成5中。
(1)标识符:
用户自己定义的名字,常量名,变量名和过程名。
(2)常数:
各种类型的常数。
(3)保留字(关键字):
如if、else、while、int、float等。
(4)运算符:
如+、-、*、<、>、=等。
(5)界符:
如逗号、分号、括号等。
5.3.将所有合法的单词符号转化为便于计算机处理的二元组形式:
(单词分类号,单词自身值);以图形化界面显示出来。
5.4.可选择性地将结果保存到文件中。
六、概要设计
6.1.数据类型
6.1.1.单词的分类:
本词法分析器演示的是C语言的一个子集,故字符集如下:
(1)标识符:
以字母开头的字母数字串。
(2)整数或浮点型
(3)保留字:
auto,break,case,char,const,continue,default,do,double,else,enum,extern,float,for,goto,if,int,long,register,return,short,signed,sizeof,static,struct,switch,typedef,union,unsigned,void,volatile,while
(4)运算符:
+、-、*、/、%、>、<、=、!
=、==、<=、>=、++、--、!
、&、&&、||;
(5)界符:
[]{}():
;‘“#,
6.1.2.单词二元组:
(单词分类号,单词自身值)
表6.1单词分类表
单词
分类号
标识符
1
常数
2
保留字
3
界符
4
运算符
5
6.2.词法分析器的结构
图6.1词法分析器的结构
6.3.部分单词的正规式与状态转换图
图6.2部分单词的状态转换图
6.4.功能模块
表6.2词法分析器的C#程序过程或函数功能表
过程或函数名
简要功能说明
GetTokens()
分析源程序得到单个单词并大致区分其类型,并生成二元组
GetInput(stringget)
输入源程序
NoWs(stringaCopy,intcp)
去除源程序中的空格符
GetTokenType
最终确定标识符和保留字
OutPut
输出二元组到指定的.txt文件中
GetResult
输出二元组
七、详细设计
7.1.总体流程图
图7.1程序总体流程图
7.2.主要分支选择算法介绍
7.2.1case0情况算法
图7.2部分分支流程图
八、编程调试
8.1主要源代码
//逻辑操作类与函数
usingSystem;
usingSystem.Collections.Generic;
usingSystem.Text;
usingSystem.IO;
namespaceTokenAnalysis{
structTokenNode{
publicstringtype;
publicstringtoken;
}
classTokenAnalysis{
intcPosition=0;
intlPosition=0;
intignorWs=0;
intrecordWs=1;
FileInfooutput;
stringsource;
string[]kwList={"auto","break","case","char","const","continue","default","do","double","else","enum","extern","float","for","goto","if","int","long","register","return","short","signed","sizeof","static","struct","switch","typedef","union","unsigned","void","volatile","while","printf","scanf","end","main"};
intError=-2;
intNormal=-1;
intstatue=-1;
boolisComment=false;
ListresultTokenNodes=newList();
publicListGetTokens(){
TokenNodenode2Add=newTokenNode();
intcp=0;//currentposition
intlp=0;//lastposition
stringaCopy=source;
intlength=aCopy.Length;
aCopy=aCopy.Trim();
while(cp//IDorKeyWords
node2Add=this.GetToken(ignorWs,aCopy,refcp,reflp);
if(node2Add.type=="cmtLeft"){
isComment=true;
}
if(node2Add.type=="cmtRight"){
isComment=false;
}
if(!
isComment&&node2Add.type!
="cmtRight"){
resultTokenNodes.Add(node2Add);
}
}
returnresultTokenNodes;
}
publicTokenNodeGetToken(){
if(cPositionTokenNodetoken=this.GetToken(ignorWs,source,refcPosition,reflPosition);
returntoken;
}
else{
TokenNodetoken=newTokenNode();
token.token="Error";
returntoken;
}
}
privateTokenNodeGetToken(inttype,stringaCopy,refintcp,refintlp){
TokenNodetoken=newTokenNode();
stringtempToken;
stringtempType;
if(type==ignorWs){
if(Char.IsLetter(aCopy[cp])){
cp++;
while(cp(Char.IsLetterOrDigit(aCopy[cp])||
aCopy[cp]=='_')){
cp++;
}
tempToken=aCopy.Substring(lp,cp-lp);
tempType="1or3";
tempType=GetTokenType(tempToken,tempType);
token.token=tempToken;
token.type=tempType;
lp=cp=NoWs(aCopy,cp);
}
//Num
elseif(Char.IsDigit(aCopy[cp])){
cp++;
while(cpcp++;
}
tempToken=aCopy.Substring(lp,cp-lp);
tempType="2";
token.token=tempToken;
token.type=tempType;
lp=cp=NoWs(aCopy,cp);
}
//Border
elseif(aCopy[cp]=='('||aCopy[cp]==')'||aCopy[cp]=='{'||
aCopy[cp]=='}'||aCopy[cp]=='['||aCopy[cp]==']'||
aCopy[cp]==','||aCopy[cp]==';'||aCopy[cp]=='"'||
aCopy[cp]=='\''||aCopy[cp]=='\\'){
cp++;
tempToken=aCopy.Substring(lp,cp-lp);
tempType="4";
token.token=tempToken;
token.type=tempType;
lp=cp=NoWs(aCopy,cp);
}
//Operationandother
else{
if(cpcp++;
}
switch(aCopy[cp-1]){
case'+':
cp=NoWs(aCopy,cp);
if(aCopy[cp]=='='||aCopy[cp]=='+'){
cp++;
}
break;
case'-':
cp=NoWs(aCopy,cp);
if(aCopy[cp]=='='||aCopy[cp]=='-'||aCopy[cp]=='>'){
cp++;
}
break;
case'*':
cp=NoWs(aCopy,cp);
if(aCopy[cp]=='='||aCopy[cp]=='/'){
cp++;
}
break;
case'/':
cp=NoWs(aCopy,cp);
if(aCopy[cp]=='='||aCopy[cp]=='*'){
cp++;
}
break;
case'=':
cp=NoWs(aCopy,cp);
if(aCopy[cp]=='='){
cp++;
}
break;
case'>':
cp=NoWs(aCopy,cp);
if(aCopy[cp]=='='){
cp++;
}
break;
case'<':
cp=NoWs(aCopy,cp);
if(aCopy[cp]=='='){
cp++;
}
break;
case'!
':
cp=NoWs(aCopy,cp);
if(aCopy[cp]=='='){
cp++;
}
else{
statue=Error;
}
break;
case'|':
cp=NoWs(aCopy,cp);
if(aCopy[cp]=='|'){
cp++;
}
else{
statue=Error;
}
break;
case'&':
cp=NoWs(aCopy,cp);
if(aCopy[cp]=='&'){
cp++;
}
else{
statue=Error;
}
break;
default:
statue=Error;
break;
}
tempToken=aCopy.Substring(lp,cp-lp);
tempToken=tempToken.Replace("","");
tempType="5";
tempType=GetTokenType(tempToken,tempType);
token.token=tempToken;
token.type=tempType;
lp=cp=NoWs(aCopy,cp);
}
}
returntoken;
}
publicvoidGetInput(stringget){
//source="for(inti=0;ilength;i++)/*cmt*/";
source=get;
}
privateintNoWs(stringaCopy,intcp){
if(cpwhile(Char.IsWhiteSpace(aCopy[cp])){
cp++;
}
}
returncp;
}
privatestringGetTokenType(stringtk2anls,stringiniType){
if(iniType=="1or3"){
foreach(stringkwinkwList){
if(tk2anls==kw){
return"3";
}
}
return"1";
}
if(iniType=="5"){
if(tk2anls=="/*"){
return"cmtLeft";
}
if(tk2anls=="*/"){
return"cmtRight";
}
returniniType;
}
return"UnknownTpye";
}
publicvoidOutPut(stringfileName){
FileInfooutFile=newFileInfo(fileName);
StreamWriterfw=outFile.AppendText();
foreach(TokenNodetkNodeinresultTokenNodes){
stringshow=string.Format("{0,-25}{1,-40}",tkNode.token,tkNode.type);
System.Console.WriteLine(show);
fw.WriteLine(show);
}
fw.Close();
}
publicvoidOutPut(){
FileInfooutFile=newFileInfo("result.txt");
StreamWriterfw=outFile.AppendText();
foreach(TokenNodetkNodeinresultTokenNodes){
stringshow=string.Format("{0,-25}{1,-40}",tkNode.token,tkNode.type);
System.Console.WriteLine(show);
fw.WriteLine(show);
}
fw.Close();
}
publicListGetResult(){
Listres=newList();
foreach(TokenNodetkNodeinresultTokenNodes){
stringshow=string.Format("{0,-25}{1,-40}",tkNode.token,tkNode.type);
res.Add(show);
}
returnres;
}
}
}
//前台控制类与函数
namespaceTokenAnalysis_FormApp
{
publicpartialclassForm1:
Form
{
publicForm1()
{
InitializeComponent();
}
privatevoidbtnAnalysis_Click(objectsender,EventArgse)
{
TokenAnalysis.TokenAnalysista=newTokenAnalysis.TokenAnalysis();
ta.GetInput(rtxtInput.Text);
ta.GetTokens();
Listres=ta.GetResult();
lstResult.Items.Clear();
lstResult.Items.AddRange(res.ToArray());
}
privatevoidbtnExit_Click(objectsender,EventArgse)
{
Application.Exit();
}
privatevoid保存SToolStripButton_Click(objectsender,EventArgse)
{
saveFileDialog1.Title="保存分析结果";
saveFileDialog1.Filter="文本文件|*.txt";
if((saveFileDialog1.ShowDialog())==DialogResult.OK){
if(saveFileDialog1.FileName!
=null){
FileInfooutFile=newFileInfo(saveFileDialog1.FileName);
StreamWriterfw=outFile.AppendText();
foreach(stringtkStringinlstResult.Items){
fw.WriteLine(tkString);
}
fw.Close();
}
}
}
privatevoidbtnsave_Click(objectsender,EventArgse)
{
saveFileDialog1.Title="保存分析结果";
saveFileDialog1.Filter="文本文件|*.txt";
if((saveFileDialog1.ShowDialog())==DialogResult.OK)
{
if(saveFileDialog1.FileName!
=null)
{
FileInfooutFile=newFileInfo(saveFileDialog1.FileName);
StreamWriterfw=outFile.AppendText();
foreach(stringtkStringinlstResult.Items)
{
fw.WriteLine(tkString);
}
fw.Close();
}
}
}
}
}
8.2调试
调试过程中存在保存不了输出结果的问题。
最后调试发现是由于绝对路径与相对路径的区分。
最后上网搜索解决方法,通过调用C#中提供的文件保存接口来解决保存的问题
九、测试
1.运行的主界面
图9.1运行的主界面
2.输入想要分析的c语言源程序
图9.2输入源程序
3.点击分析的按钮,显示分析后的结果,以二元组形式展示。
图9.3分析结果
4.点击保存按钮,弹出选择保存文件的路径和名称
图9.4保存过程
5.保存后的.txt文档
图9.5保存后的文档
十、结束语
通过这次的课程设计,我学会了很多。
让我学会了如何设计、编制并调试词法分析程序,加深对词法分析原理的理解;熟悉了构造词法分析器的手工方式的相关原理,也对状态图以及如何表示并识别单词规则有了更进一步的了解。
并且在掌握状态图对识别程序的编程上有了更深层次的进步。
除