Python_爬虫_数据解析回顾

--数据解析原理

  --定位标签

  --提取标签中存储的数据

--xpath解析原理

  --实例化一个etree的对象且将解析的页面源码数据加载到该对象中

  --通过xpath方法(返回值:列表)结合者xpath表达式进行数据解析

      -- //tagName

      -- //tagName[@attr = 'value']

      -- //tagName[index]

      -- /text() //text()

      -- /@attrName

--bs4解析原理

  --实例化一个bs4的对象且将解析的页面源码数据加载到该对象中

  --通过相关的方法和属性进行数据解析

      -- soup.tagName

      -- soup.find('tagName', attrName = 'value')  <==> find_all()

      -- select('css选择器') //标签, 类, id, 层级

      -- string,text,get_text()

      -- tag['attrName']

  

猜你喜欢

转载自www.cnblogs.com/helloboke/p/11504150.html
今日推荐