引言
最近刚刚用python写完了一个解析protobuf文件的简单编译器,深感ply实现词法分析和语法分析的简洁方便。乘着余热未过,头脑清醒,记下一点总结和心得,方便各位pythoner参考使用。
ply使用
简介
如果你不是从事编译器或者解析器的开发工作,你可能从未听说过ply。ply是基于python的lex和yacc,而它的作者就是大名鼎鼎Python Cookbook, 3rd Edition的作者。可能有些朋友就纳闷了,我一个业务开发怎么需要自己写编译器呢,各位编程大牛说过,中央决定了,要多尝试新的东西。而且了解一些语法解析的姿势,以后自己解析格式复杂的日志或者数学公式,也是非常有帮助的。
针对没有编译基础的童鞋,强烈建议了解一些文法相关的基本概念。轮子哥强烈推荐的parsing techniques以及编译龙虎鲸书,个人感觉都不适合入门学习,在此推荐胡伦俊的编译原理(电子工业出版社),针对概念的例子讲解很多,很适合入门学习。当然也不需要特别深入研究,知道词法分析和语法分析的相关概念和方法就可以愉快的使用ply了。文档链接: http://www.pchou.info/open-source/2014/01/18/52da47204d4cb.html
为了方便大家上手,以求解多元一次方程组为例,讲解一下ply的使用。
例子说明
输入是多个格式为x + 4y - 3.2z = 7
的一次方程,为了让例子尽可能简单,做如下限制:
- 每个方程含有变量的部分在等号左边,常数在等号右边
- 每个方程不限制变量的个数以及变量的顺序,但每个方程每个变量只允许出现一次
- 变量的命令规则为小写字母串(x y xx yy abc 均为合法变量名)
- 变量的系数限制为整数和浮点数,浮点数不允许
1.4e8
的格式,系数和变量紧邻,且系数不能为0 - 方程组和方程组之间用
, ;
隔开
学过线性代数的童鞋肯定知道,只需要将方程组抽象为矩阵,按照线性代数的方法就可以解决。因此只需要将输入方程组解析成右边的矩阵和变量列表即可,剩下的求解过程就可以交给线性代数相关的工具解决。