Bs4 BeautifulSoup取值

原文网址:https://blog.csdn.net/u010244522/article/details/79627073

从网页获取HTML数据后,获取对应标签、属性的值

取值方法主要有以下几种:

1.通过标签名(tag)获取: tag.name        tag对应的type是<class 'bs4.element.Tag'>

2.通过属性(attrs)获取:tag.attrs

通过标签属性获取:    tag["class"]  或     tag.get("class")

获取对应的内容

1.    tag.string    获取当前标签的内容

2.    tag.get_text()    获取标签内所有的字符串

查找相应的内容

1.find_all(class_="class")    返回的是多个标签,格式为<class 'bs4.element.ResultSet'>

2.find(class_="class")    返回一个标签,格式是<class 'bs4.element.Tag'>

3.select_one()    返回一个标签,格式是<class 'bs4.element.Tag'>

4.select()    返回的是多个标签,格式为<class 'bs4.element.ResultSet'>

1和4是返回组标签(就算只有一个标签也是一组)

取值时需要先定位,定位是list(ResultSet)中的那个标签在取值

tag[0].string

使用    find_all()    不带条件查找,tag[0]["class"].string

--------------------- 作者:bluelikk 来源:CSDN 原文:https://blog.csdn.net/u010244522/article/details/79627073?utm_source=copy 版权声明:本文为博主原创文章,转载请附上博文链接!

猜你喜欢

转载自blog.csdn.net/lingyunxianhe/article/details/82999676
今日推荐