Baidu sabe la documentación de la versión anti-rastreo del software de recopilación de agregación de preguntas y respuestas/script de recopilación de Python

Hola a todos, soy Tao Xiaobai ~

 Baidu conoce la documentación del software de recopilación de agregación. Antes solo hizo un video de demostración sin dar una introducción detallada. Hoy les daré una introducción detallada basada en el contenido actualizado.

1. Lenguaje de software: Python 

2. Lógica: recopilación por lotes basada en palabras clave----Agregación de varios artículos----Guardar en texto local 

3. Descripción del archivo de configuración:

Después de obtener el software, primero modificamos el archivo de configuración config.ini, que contiene los siguientes contenidos personalizados:

ruta: ruta de llamada de palabra clave;

bf_num: el número de concurrencia, el valor máximo es 20, si excede 20, el software lo cambiará automáticamente a 20 concurrencia;

out_path: ruta de salida de datos;

title_mode: modo de título, 0 1 2 3 4, el significado es el siguiente:

Título único de palabra clave: 1

Conozca el título de la hoja de título: 2

Palabras clave + Conoce el título Doble título: 3

Conoce el título + Conoce el título: 4  

Patrón de título aleatorio: 0

title_f, title_b: conector de título doble. Nota: si utiliza espacios para vincular, utilice comillas dobles en inglés, por ejemplo: " ", esto significa utilizar espacios para vincular;

title_len: filtrado del límite de longitud del título. Si la longitud del título es mayor que 30, se filtrará;

Article_seq: cambio de orden de extracción, si el orden de extracción de ID del artículo se altera aleatoriamente, por ejemplo: 123456789... Artículos secuenciales, codificados aleatoriamente: 951326487...
0 extractos en el orden predeterminado, 1 altera el orden de los artículos

número_artículo: el número de agregación de artículos está personalizado. El número de agregación de artículos personalizados: el mínimo es 2 y el máximo es 10. Si se establece en 0, será una combinación aleatoria de 3 a 5 artículos.

Las funciones principales anteriores son contenido agregado según las necesidades del cliente. Más adelante, continuaremos recopilando algunas preguntas de los clientes para optimizarlas y actualizarlas.

4. El uso requiere comprar una licencia y vincularla a una computadora;

5. Mapear automáticamente datos agregados;

6. Si necesita conocer la lógica personalizada de datos agregados basada en Baidu, puede contactarme para personalizar la lógica;

7. Otras notas: Intente utilizar Notepad++ para abrir y editar los archivos keywords.txt y config.ini. Intente no utilizar el Bloc de notas para editar. ¡Diferentes computadoras pueden tener diferentes errores desconocidos!

8. Vídeo de colección de demostración:

Baidu conoce la demostración del software de la herramienta de recopilación, la actualización del sitio web de agregación de combinaciones de artículos, la recopilación rápida y la recopilación por lotes.

Supongo que te gusta

Origin blog.csdn.net/u012917925/article/details/133244188
Recomendado
Clasificación