erro Python Reptile: "HTTP Error 403: proibido"

razão de erro: principalmente porque o site é proibida causa réptil, você pode adicionar informações de cabeçalho no pedido, disfarçado como um navegador para acessar o User-Agent.

Novas informações user-agent:

cabeçalhos = { ' User-Agent ' : ' Mozilla / 5.0 (Windows NT 10.0; Win64; x64) AppleWebKit / 537,36 (KHTML, como gecko) Cromo / 71.0.3578.80 Safari / 537,36 ' }
 req = request.Request (Spider.url, cabeçalhos = Spider.headers)
 Html # informações adquiridas no
 htmls = request.urlopen (req) .read ()

vista user-agent do Google: Pressione F12 para abrir a ferramenta de depuração, escrito no console: JavaScript: (Alert . Navigator userAgent), a informação user-agent irá aparecer

 

 

 

Acho que você gosta

Origin www.cnblogs.com/syq816/p/12636721.html
Recomendado
Clasificación