Introducción al rastreador de Python 5: simule el navegador para visitar el sitio web

Ir al blog de LaoYuanPython https://blog.csdn.net/LaoYuanPython

I. Introducción

En las dos secciones anteriores, presentamos cómo usar el navegador de Google y el navegador IE para obtener información de mensajes relacionados con http para las visitas al sitio web. Esta sección presenta cómo usar la información obtenida para construir encabezados de mensajes de acceso HTTP en aplicaciones Python y simular el navegador Visitar el sitio web. La información obtenida en este apartado se basa en la información http obtenida por el navegador de Google, que equivale a la aplicación que accede al sitio web simulando el acceso del navegador de Google. El principio de IE es el mismo, y usted mismo puede manejarlo. .

2. Obtenga la información del encabezado del mensaje de solicitud http desde el navegador

Utilice el método introducido en " https://blog.csdn.net/LaoYuanPython/article/details/113055084 Rastreador de Python 3: utilice el navegador de Google para obtener información http para las visitas al sitio web " para copiar la información del encabezado de la solicitud http del sitio web visitado, y use la visita https://blog.csdn.net/LaoYuanPythoncomo El contenido del encabezado de solicitud obtenido por el ejemplo es el siguiente (solo se toma parte de la información de las cookies, reemplazada por una elipsis):

:authority: blog.csdn.net
:method: GET
:path: /LaoYuanPython
:scheme: https
accept: text/html,application/xht

Supongo que te gusta

Origin blog.csdn.net/LaoYuanPython/article/details/113063101
Recomendado
Clasificación