Nota pequeña: el tipo de respuesta de solicitud de solicitudes de Python se convierte en tipo de respuesta de solicitud scrapy

from scrapy.http import HtmlResponse
#url 与requests 请求时URL一致
#body 是requests 响应源码
response = HtmlResponse(url=url, body=body, encoding='utf-8')
# 按照scrapy 框架方式进行获取源码,解析页面等
res_body = response.body.decode(response.encoding)
urls = response.xpath('//a/@href').getall()
url = response.url

De esta manera, el contenido de la respuesta de las solicitudes se puede incrustar en el marco scrapy

Supongo que te gusta

Origin blog.csdn.net/weixin_43124425/article/details/129556864
Recomendado
Clasificación