两个简单的xpath案例(爬取糗事百科 & 扇贝单词)

1. 糗事百科 - etree

分析


  • 需要用到requests爬取页面,用xpath、re来提取数字
  • 可提取信息 用户头像链接,段子内容,点赞,好评次数
  • 保存到json文件中

流程


  • down下页面
  • 利用xpath提取信息
  • 保存文件落地

源代码

import requests
from lxml import etree

url = "https://www.

猜你喜欢

转载自blog.csdn.net/qq_29339467/article/details/105341490
今日推荐