rastreador de configuración, iniciar y detener
Araña
Araña es una entrada de inicio de reptiles. Antes de iniciar los reptiles, tenemos que utilizar un PageProcessor crear un objeto de la araña y luego usar el run () comenzar.
Mientras que los otros componentes de la araña (Downloader, Scheduler, Pipeline) se pueden fijar por un método set.
Orugas de configuración del sitio
Site.me () puede estar hecho de una cierta configuración configuraciones de orugas, incluyendo codificación, intervalo de captura, tiempo de espera, reintentos y similares. Aquí establecemos brevemente sobre: el número de reintentos es 3, intervalo de captura de un segundo.
El sitio en sí una cierta información de configuración, como la codificación, las cabeceras HTTP, tiempo de espera, las estrategias de reintento, agentes, etc., se puede configurar mediante el establecimiento del objeto de sitio.