pandas读取html页面中的表格数据

说明:直接调用pands中的pd.read_html(url)函数,如果页面中有表格,那么表格数据会以DataFrame格式存储下来。

比如我要获取下面的数据:

调用代码:

import pandas as pd
pd.set_option('display.width',1000)
pd.set_option('display.max_row',1000)
pd.set_option('display.max_column',1000)

html=pd.read_html('http://www.hbzwfw.gov.cn/art/2019/11/28/art_21290_7313.html')
print(html[1])

取出表格的数据是这样的:

这样就省去了用爬虫爬去再去筛选td/tr标签了,还是比较方便的。

猜你喜欢

转载自blog.csdn.net/weixin_38664232/article/details/105251732
今日推荐