Análisis del rastreador de Python de la URL de la página web

¿Cuál es la información más básica del rastreador de Python? Por supuesto que es la URL. Toda la información que necesitamos debe obtenerse a través de la URL. ¿Conoce la URL?
Hoy, tome la URL de la imagen de Baidu como ejemplo para aprender algo de información sobre la URL.
Baidu Imagen de Yang Mi, obtener URL:

https://image.baidu.com/search/índice? tn = baiduimage & ct = 201326592 & lm = -1 & cl = 2 & ie = gb18030 & word =% D1% EE% C3% DD & fr = ala & ala = 1 & alatpl = dirección & pos = 0 & hs = 2 & xthttps = 111111

En este momento lo que se obtiene es una página web en cascada, si cambiamos el índice a voltear:

https://image.baidu.com/search/dar la vuelta? tn = baiduimage & ct = 201326592 & lm = -1 & cl = 2 & ie = gb18030 & word =% D1% EE% C3% DD & fr = ala & ala = 1 & alatpl = dirección & pos = 0 & hs = 2 & xthttps = 111111

La forma en que se cambia la imagen al número de página,
Inserte la descripción de la imagen aquí
encontramos que la URL de la imagen no es solo un índice, sino que también almacena cierta información. Si analiza esta URL en su conjunto, puede ver que la primera mitad es la URL de la imagen de Baidu https://image.baidu.com/, y la parte posterior Se compone de un par clave-valor, y los dos pares clave-valor están separados por &. Algunos solo tienen claves y no tienen valores. La eliminación no afecta los índices normales.

tn = baiduimage & ct = 201326592 & lm = -1 & cl = 2 & ie = gb18030 & word =% D1% EE% C3% DD & fr = ala & ala = 1 & alatpl = dirección & pos = 0 & hs = 2 & xthttps = 111111

Supongo que te gusta

Origin blog.csdn.net/xinzhilinger/article/details/102827250
Recomendado
Clasificación