为更好理解面向对象的过程,举一例,如输入表达式3+2*5,解析与求值过程如下:
一个字符一个字符的读,根据字符的种类去决定组合成哪种单词(token),这个过程叫词法分析,由词法分析器完成。词法分析器在这里就是函数Token_value get_token();该函数返回单词。这里调用5次,就依次返回5个单词,分别是NUMBER, PLUS, NUMBER, MUL, NUMBER,当返回NUMBER时,get_token()函数还会将读到的数存入全局变量number_value中。
其它几个是语法分析函数,有prim(),term(),expr()三个,其中每个语法分析函数处理的实体大小不一样的。此例中,expr()函数把整个表达式(3 + 2 * 5)看成一个实体,返回整个表达式的值,term()函数把(2 * 5)看成一个实体,它处理乘和除,返回这个实体的值。prim()函数把(3 + 10)看成一个实体,它处理的是加和减,以及更小的单个变量或常量。
代码如下:
#include<iostream>
#include<string>
#include<map>
#include<cctype>
using namespace std;
// 将token用他们的字符所对应的整数表示,这样做既方便有效,
// 又能帮助使用排错系统的人。
enum Token_value {
NAME, NUMBER, END, PLUS='+',
MINUS='-', MUL='*', DIV='/',
PRINT=';', ASSIGN='=', LP='(', RP=')',
};
Token_value curr_tok = PRINT;
double expr(bool);
double term(bool);
double prim(bool);
Token_value get_token();
double error(const string&);
map<string, double> table;
int no_of_errors;
int main()
{
table["pi"] = 3.1415924535;
table["e"] = 2.178;
while(cin) {
get_token();
if(curr_tok == END) break;
if(curr_tok == PRINT) continue;
cout<<expr(false)<<'\n';
}
return no_of_errors;
}
// 每个分析器都有一个bool参数,
// 指明该函数是否需要调用get_token()去取得下一个参数
// expr处理加减,一直到不是加减返回left
double expr(bool get) {
double left = term(get);
for(;;) {
switch (curr_tok){
case PLUS:
left += term(true);
break;
case MINUS:
left += term(true);
break;
default:
return left;
}
}
}
// 函数term处理乘除,采用的方式与expr()处理方法一样
double term(bool get) {
double left = prim(get);
for(;;) {
switch (curr_tok){
case MUL:
left *= prim(true);
break;
case DIV:
if (double d = prim(true)) {
left /= d;
break;
}
return error("divide by 0");
default:
return left;
}
}
}
double number_value;
string string_value;
// prim处理初等项的方式很像expr和term
double prim(bool get) {
if (get) get_token();
switch(curr_tok) {
case NUMBER: {
double v = number_value;
get_token();
return v;
}
case NAME: {
double& v = table[string_value];
if (get_token() == ASSIGN) v = expr(true);
return v;
}
case MINUS:
return -prim(true);
case LP: {
double e = expr(true);
if (curr_tok != RP) return error(" ) expected");
get_token();
return e;
}
default:
return error("primary expected");
}
}
Token_value get_token() {
char ch;
do { // 低级输入,改进输入
if(!cin.get(ch)) return curr_tok = END;
} while(ch != '\n' && isspace(ch));
switch(ch) {
case 0:
return curr_tok=END;
case '\n':
return curr_tok=PRINT;
case '+':
case '-':
case '*':
case '/':
case ';':
case '(':
case ')':
case '=':
return curr_tok = Token_value(ch);
case '0': case '1': case '2': case '3': case '4':
case '5': case '6': case '7': case '8': case '9':
case '.':
cin.putback(ch);
cin>>number_value;
return curr_tok = NUMBER;
default:
if (isalpha(ch)) {
string_value = ch;
while(cin.get(ch) && isalnum(ch)) string_value.push_back(ch);
cin.putback(ch);
return curr_tok = NAME;
}
error("bad token");
return curr_tok = PRINT;
}
}
double error(const string& s) {
no_of_errors ++;
cerr<<"error: "<<s<<'\n';
return 1;
}