对Python3 解析html的几种操作方式小结

解析html是爬虫后的重要的一个处理数据的环节。一下记录解析html的几种方式。

先介绍基础的辅助函数,主要用于获取html并输入解析后的结束

1,lxml.html的方式进行解析,

2,使用BeautifulSoup,不多说了,大家网上找资料看看

3,使用SGMLParser,主要是通过start、end tag的方式进行了,解析工程比较明朗,但是有点麻烦,而且该案例的场景不太适合该方法,(哈哈)

4,HTMLParaer,与3原理相识,就是调用的方法不太一样,基本上可以公用,

3,4对于该案例来说确实是不太适合,趁现在有空记录下来,功学习使用!

猜你喜欢

转载自blog.csdn.net/fei347795790/article/details/90114435