小C语言--词法分析程序(编译原理实验一)

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/Neo233/article/details/82810115

小C语言文法

  1. <程序>→(){<声明序列><语句序列>}

  2. <声明序列>→<声明序列><声明语句>|<声明语句>|<空>

  3. <声明语句>→<标识符表>;

  4. <标识符表>→<标识符>,<标识符表>|<标识符>

  5. <语句序列>→<语句序列><语句>|<语句>

  6. <语句>→< if语句>|< while语句>|< for语句>|<复合语句>|<赋值语句>

  7. < if语句>→< if关键字>(<表达式>)<复合语句>|(<表达式>)<复合语句>< else关键字><复合语句>

  8. < while语句>→< while关键字>(<表达式>)<复合语句>

  9. < for语句>→< for关键字>(<表达式>;<表达式>;<表达式>)<复合语句>

  10. <复合语句>→{<语句序列>}

  11. <赋值语句>→<表达式>;

  12. <表达式>→<标识符>=<算数表达式>|<布尔表达式>

  13. <布尔表达式>→<算数表达式> |<算数表达式><关系运算符><算数表达式>

  14. <关系运算符>→>|<|>=|<=|==|!=

  15. <算数表达式>→<算数表达式>+<项>|<算数表达式>-<项>|<项>

  16. <项>→<项>*<因子>|<项>/<因子>|<因子>

  17. <因子>→<标识符>|<无符号整数>|(<算数表达式>)

  18. <标识符>→<字母>|<标识符><字母>|<标识符><数字>

  19. <无符号整数>→<数字>|<无符号整数><数字>

  20. <字母>→a|b|…|z|A|B|…|Z

  21. <数字>→0|1|2|3|4|5|6|7|8|9

  22. < main关键字>→main

  23. < if关键字>→if

  24. < else关键字>→else

  25. < for关键字>→for

  26. < while关键字>→while

  27. < int关键字>→int

每行单词数不超过10个
小C语言文法如上,现在我们对小C语言写的一个源程序进行词法分析,分析出关键字、自定义标识符、整数、界符
和运算符。
关键字:main if else for while int
自定义标识符:除关键字外的标识符
整数:无符号整数
界符:{ } ( ) , ;
运算符:= + - * / < <= > >= == !=

Input
输入一个小C语言源程序,源程序长度不超过2000个字符,保证输入合法。

Output
按照源程序中单词出现顺序输出,输出二元组形式的单词串。

(单词种类,单词值)

单词一共5个种类:

关键字:用keyword表示
自定义标识符:用identifier表示
整数:用integer表示
界符:用boundary表示
运算符:用operator表示

每种单词值用该单词的符号串表示。

Sample Input

main() 
{
	int a, b;
	if(a == 10)
	{
    	a = b;
	}
}

Sample Output

(keyword,main)
(boundary,()
(boundary,))
(boundary,{)
(keyword,int)
(identifier,a)
(boundary,,)
(identifier,b)
(boundary,;)
(keyword,if)
(boundary,()
(identifier,a)
(operator,==)
(integer,10)
(boundary,))
(boundary,{)
(identifier,a)
(operator,=)
(identifier,b)
(boundary,;)
(boundary,})
(boundary,})

由于Java卡空间,样例过了但是没有ac,代码呈上:

import java.util.Scanner;
public class one {
private static String a[] = {"keyword","identifier","integer","boundary","operator"};
private static String b[] = {"main","if","else","for","while","int"};
public static void main(String[] args) {
	// TODO Auto-generated method stub
	Scanner sc = new Scanner(System.in);
	StringBuilder ss = new StringBuilder();
	while(sc.hasNextLine()) {
		ss = new StringBuilder();
		ss.append(sc.next());
		char[] abc = ss.toString().toCharArray();
		StringBuilder aa = new StringBuilder();
		for(int i = 0 ; i < ss.length();i++) {
			if(abc[i] != ' ') {
				if(abc[i] == '=' || abc[i] == '+' || abc[i] == '-'||abc[i] == '*'|| abc[i] == '/' || abc[i] == '<' || abc[i] == '>' || abc[i] == '!') {
	            	if(aa.length() != 0) {
	            		decide(aa.toString());
	            	}
	            	aa = new StringBuilder();
	            	if(i + 1 < ss.length() && abc[i+1] == '=') {
	            		System.out.println("(" + a[4] + "," + abc[i] + abc[i+1]+")");
	            		i++;
	            	}else {
	            		System.out.println("(" + a[4] + "," + abc[i] + ")");
	            	}
	            }else if(abc[i] == '(' || abc[i] == ')' || abc[i] == '{'||abc[i] == '}'|| abc[i] == ',' || abc[i] ==';') {
	            	if(aa.length() != 0) {
	            		decide(aa.toString());
	            	}
	            	aa = new StringBuilder();
	            	System.out.println("(" + a[3] + "," + abc[i] + ")");
	            }else {
	            	aa.append(abc[i]);
	            }
			}
		}
    	if(aa.length() != 0) {
    		decide(aa.toString());
    	}
	}
	//System.out.println(ss);
	sc.close();
}
public static void decide(String ss) {
	char[] s = ss.toCharArray();
	if(s[0]>='0'&&s[0]<='9') 
    {
		System.out.println("(" + a[2] + "," + ss + ")");
    }
    else
    {
        int f=1;
        for(int i=0; i<6; i++)
        {
            if(ss == b[i])
            {
                f=0;
                System.out.println("(" + a[0] + "," + ss + ")");
                break;
            }
        }
        if(f==1)
        {
        	System.out.println("(" + a[1] + "," + ss + ")");
        }
    }
}
}

转化为C++;

#include <iostream>
#include <string>
using namespace std;
string S[5]= {"keyword","identifier","integer","boundary","operator"};
string T[6]= {"main","if","else","for","while","int"};
void decide(string s)
{
 	if(s[0]>='0'&&s[0]<='9') //开头是数字肯定就为数字
{
    cout<<"("<<S[2]<<","<<s<<")"<<endl;
}
else
{
    int f=1;
    for(int i=0; i<6; i++)
    {
        if(s==T[i])
        {
            f=0;
            cout<<"("<<S[0]<<","<<s<<")"<<endl;
            break;
        }
    }
    if(f==1)
    {
        cout<<"("<<S[1]<<","<<s<<")"<<endl;
    }
}
}
int main()
{
	string s;
	while(cin>>s)
	{
    	int len=s.length();
    	string temp="";
    	for(int i=0; i<len; i++)
   	 {
        //操作符
        if(s[i] == '=' || s[i] == '+' || s[i] == '-'||s[i] == '*'|| s[i] == '/' || s[i] == '<' || s[i] == '>' || s[i] == '!')
        {
            if(temp.length())
            {
                decide(temp);
            }
            temp="";
            if(i+1<len&&s[i+1]=='=')
            {
                cout<<"("<<S[4]<<","<<s[i]<<s[i+1]<<")"<<endl;
                i++;
            }
            else
            {
                cout<<"("<<S[4]<<","<<s[i]<<")"<<endl;
            }
        }
        //界符
        else if(s[i] == '(' || s[i] == ')' || s[i] == '{'||s[i] == '}'|| s[i] == ',' || s[i] ==';')
        {
            if(temp.length())
            {
                decide(temp);
            }
            temp="";
            cout<<"("<<S[3]<<","<<s[i]<<")"<<endl;
        }
        //不是界符也不是操作符,就存到临时字符串里面,等待判断
        else
        {
            temp=temp+s[i];

        }
    }
    if(temp.length())
    {
        decide(temp);
    }

}
return 0;
}

猜你喜欢

转载自blog.csdn.net/Neo233/article/details/82810115