rastreador de configuración, iniciar y detener

rastreador de configuración, iniciar y detener


Araña

Araña es una entrada de inicio de reptiles. Antes de iniciar los reptiles, tenemos que utilizar un PageProcessor crear un objeto de la araña y luego usar el run () comenzar.

Mientras que los otros componentes de la araña (Downloader, Scheduler, Pipeline) se pueden fijar por un método set.



Orugas de configuración del sitio

Site.me () puede estar hecho de una cierta configuración configuraciones de orugas, incluyendo codificación, intervalo de captura, tiempo de espera, reintentos y similares. Aquí establecemos brevemente sobre: el número de reintentos es 3, intervalo de captura de un segundo.

El sitio en sí una cierta información de configuración, como la codificación, las cabeceras HTTP, tiempo de espera, las estrategias de reintento, agentes, etc., se puede configurar mediante el establecimiento del objeto de sitio.

​​​​​​​

Publicados 434 artículos originales · ganado elogios 105 · Vistas a 70000 +

Supongo que te gusta

Origin blog.csdn.net/qq_39368007/article/details/105047471
Recomendado
Clasificación