1. 실험적인 내용
어휘 분석 프로그램을 통해 어휘 분석 과정을 학습합니다. 단어 읽기 프로그램을 컴파일하고, PL/0 언어에 대한 어휘 분석을 수행하고, 입력 문자열 형태의 소스 프로그램을 단어 기호, 즉 기본 예약어, 식별자, 상수, 연산자 및 구분 기호의 다섯 가지 범주 로 나눕니다 .
PL/0 언어에 대한 어휘 분석을 수행하고 입력 문자열 형태의 소스 프로그램을 개별 단어 기호로 구분합니다. 어휘 설명은 다음과 같습니다.
(1) 키워드:
시작, 호출, const, 수행, 종료, if, 홀수, 절차, 읽기, 다음, var, while, 쓰기
(2) 식별자: 다양한 이름을 나타내는 데 사용되며 문자로 시작해야 하며 10자 미만으로 구성되어야 합니다.
(3) 숫자: 0~9로 구성되는 14자리 미만의 숫자
(4) 연산자: +, -, *, /, :=, <, <=, >, >=, #
(5) 구분자: , ,. , ; , ( ,)
2. 실험 코드
#include<iostream>
#include<stdio.h>
#include<string.h>
#include<iomanip>
using namespace std;
//创建四个表,储存符号
const char *k[13]={"begin","call","const","do","end","if","odd","procedure","read","then","var","while","write"};//关键字表
const char *s1[5]={",",".",";","(",")"};//界符表
const char *s2[6]={"+","-","*","/","++","--",};//运算符号表
const char *s3[9]={"<=",">",">=","=",">",">=","<>",":=","#"}; //关系运算符号表
//定义全局变量
int row=1,line=1;
int t,p=0;//单词类别码以及记录移动指针
char instring[100];//保存输入的程序代码缓存数组
char outtoken[10];//输出
char ci[8],id[10];//暂时保存数字和字符
//函数的声明
void analysis();//分析函数,决定调用哪个函数进行分析
void symbol();//分析以非字母数字开头的字符
void constant();//分析常数
void alphabet();//分析标识符和关键字
void show();//打印输出函数
bool isnumber(char x);//判断是否是数字
bool isalpha(char x);//判断是否是字母
int main(){
cout<<"请输入一段程序代码并以@结束:"<<endl;
//输出程序代码
do{
instring[p++]=getchar();
} while(instring[p-1]!='@');
getchar();//吸收回车键
instring[p-1]='\0';//抵消掉@
p=0;//移动指针归零
cout<<left;
cout<<"------------------------------------------------------------------------------"<<endl;
cout<<setw(6)<<"单词"<<" "<<setw(6)<<"二元序列"<<" "<<setw(6)<<"类型"<<" "<<endl;
//扫描输入的字符
while(p<strlen(instring)){
analysis();
show();
}
cout<<"------------------------------------------------------------------------------"<<endl;
cout<<"[注]:"<<endl;
cout<<"t=1:关键字,"<<"t=2:分界符,"<<"t=3:算术运算符,"<<"t=4:关系运算符,"<<"t=5:常数,"<<"t=6:标识符,"<<"t==7:词法出错"<<endl;
cout<<"@为结束符,不参与到词法分析中"<<endl;
cout<<endl;
return 0;
}
//判断是否是数字
bool isnumber(char x){
return x>='0'&&x<='9';
}
//判断是否是字母
bool isalpha(char x){
return (x>='a'&&x<='z'||x>='A'&&x<='Z');
}
//分析函数,决定调用哪个函数进行分析
void analysis(){
strcpy(outtoken,"");//清空outtoken数组
while(instring[p]==' '||instring[p]=='\n'){
if(instring[p]=='\n'){
row++;
line=1;
}
p++;
}
//执行完之后指向第一个不为空格的字符
char ch=instring[p];
//按照字符的类别调用不同的分析处理函数
if(isalpha(ch))
alphabet();
else if(isnumber(ch))
constant();
else
symbol();
}
//常数处理函数
void constant(){
strcpy(ci,"");//清空ci
t=5;//类别码
int i=0;
while(isnumber(instring[p])){
ci[i++]=instring[p++];
}
while(isalpha(instring[p])||isnumber(instring[p])){
ci[i++]=instring[p++];
t=7;//出错
}
ci[i]='\0';//结束符
//strcpy_s(outtoken,strlen(ci)+1,ci);
strcpy(outtoken,ci);
line++;
return;
}
//标识符和关键字的分析函数
void alphabet(){
strcpy(id,"");//清空id
int i=0;
//读取连续的字母数字序列
while(isalpha(instring[p])||isnumber(instring[p])){
id[i++]=instring[p++];//p指向连续序列之后的第一个字符
}
id[i]='\0';
//查关键字表
for(i=0;i<8;i++){
if(strcmp(id,k[i])==0){
t=1;//表示关键字
line++;
strcpy(outtoken,id);
return; //是关键字的话,直接退出
}
}
//查看是否是标识符
for(i=0;i<strlen(id);i++){
if(!(isalpha(id[i])||isnumber(id[i]))){
t=7;
strcpy(outtoken,id);
line++;
return;
}
}
line++;
t=6;//不是关键字且没有出错即为标识符
strcpy(outtoken,id);
}
//其它运算符的分析函数
void symbol(){
char ch=instring[p++];
char ch2=instring[p];
t=7;
switch(ch){
case '+':
if(ch2=='+')
t=3;
break;
case '-':
if(ch2=='-')
t=3;
break;
case '>':
if(ch2=='=')
t=4;
break;
case '<':
if(ch2=='='||ch2=='>')
t=4;
break;
case ':':
if(ch2=='=')
t=3;
break;
}
//判断是否具有两个符号的运算符
if(ch=='>'&&ch2=='='||ch=='<'&&ch2=='='||ch=='<'&&ch2=='>'||ch=='+'&&ch2=='+'||ch=='-'&&ch2=='-'||ch==':'&&ch2=='='){
p++;
outtoken[0]=ch;
outtoken[1]=ch2;
outtoken[2]='\0';
line++;
return;
} else{
char chq[2];
chq[0]=ch;
chq[1]='\0';
//分界符比较
for(int i=0;i<6;i++){
if(strcmp(chq,s1[i])==0){
t=2;
break;
}
}
//算术运算符比较
for(int i=0;i<6;i++){
if(strcmp(chq,s2[i])==0){
t=3;
break;
}
}
//关系运算符比较
for(int i=0;i<9;i++){
if(strcmp(chq,s3[i])==0){
t=4;
break;
}
}
}
line++;
outtoken[0]=ch;
outtoken[1]='\0';
return;
}
//输出函数,根据以上分析函数进行打印输出分析的结果
void show(){
cout<<left;
//setw(6)表示占位宽度为6个字符
if(t==7){
cout<<setw(6)<<outtoken<<" "<<setw(6)<<"ERROR!"<<setw(11)<<" "<<setw(10)<<"ERROR!";
}else{
cout<<left;
cout<<setw(6)<<outtoken<<" "<<"<"<<t<<","<<outtoken;
cout<<setw(6-strlen(outtoken))<<">"<<" ";
switch(t){
case 1:cout<<left<<setw(10)<<"关键字";break;
case 2:cout<<left<<setw(10)<<"分界符";break;
case 3:cout<<left<<setw(10)<<"算术运算符";break;
case 4:cout<<left<<setw(10)<<"关系运算符";break;
case 5:cout<<left<<setw(10)<<"常数";break;
case 6:cout<<left<<setw(10)<<"标识符";break;
}
}
cout<<endl;
}
/*变量说明:
k数组:关键字表; s数组:分界符表,其中分界符,算术运算符,关系运算符分别存放在s1,s2,s3数组中
id:标识符; ci:常数 ;row:行 line:列,单词的位置
instring数组:为输入源程序代码的单词缓存; outtoken数组:记录为输出内部表示缓存
symbol:分析//后的注释;constant:常数分析;alphabet:标识符和关键字分析
analysis:分析函数,根据输入字符判断调用哪一个函数 ;show:输出打印函数
t:单词的种类 t=1:关键字 t=2:分界符 t=3:算术运算符 t=4:关系运算符 t=5:常数 t=6:标识符 t=7:出错*/
3. 실험결과
하나를 테스트
테스트 2
4. 실험 요약
전체적인 코드 아이디어는 키워드 테이블, 구분 기호 테이블, 연산 기호 테이블, 관계 연산 기호 테이블을 각각 저장 하는 4개의 배열을 만드는 것입니다. 하드 코딩 대신 동적 변경을 달성합니다 .
다음 모듈러 설계는 analysis(), symbol(), constant(), alphabet(), show(), isnumber(), isalpha()의 7가지 함수로 구분되며, 분석 함수는 전체 분석 함수로 사용됩니다 . 분석을 통해 현재 문자가 문자, 숫자 또는 기타 기호인지 여부에 따라 특정 분석을 위해 다른 함수를 호출한 다음 결과를 전역 변수 outtoken 및 t에 저장합니다. 전자는 출력 이진 그룹을 나타내고 후자는 유형을 나타냅니다. 단어의 어려움 두 기호 운영자의 판단에.
이 질문에는 또 다른 세부 사항이 있습니다 . 코드 입력 후 Enter 키는 중복 되며 getchar() 함수에 의해 흡수되어야 하며 종결자 @는 자체 정의되며 어휘 분석에 참여하지 않으므로 입력 후 프로그램 코드에서 instring[p-1]='\0'; //오프셋 @을 사용하여 instring 배열이 종결자 없이 완전하고 효과적인 프로그램 코드를 저장하도록 합니다.
끝.