¿Cuál es la información más básica del rastreador de Python? Por supuesto que es la URL. Toda la información que necesitamos debe obtenerse a través de la URL. ¿Conoce la URL?
Hoy, tome la URL de la imagen de Baidu como ejemplo para aprender algo de información sobre la URL.
Baidu Imagen de Yang Mi, obtener URL:
https://image.baidu.com/search/índice? tn = baiduimage & ct = 201326592 & lm = -1 & cl = 2 & ie = gb18030 & word =% D1% EE% C3% DD & fr = ala & ala = 1 & alatpl = dirección & pos = 0 & hs = 2 & xthttps = 111111
En este momento lo que se obtiene es una página web en cascada, si cambiamos el índice a voltear:
https://image.baidu.com/search/dar la vuelta? tn = baiduimage & ct = 201326592 & lm = -1 & cl = 2 & ie = gb18030 & word =% D1% EE% C3% DD & fr = ala & ala = 1 & alatpl = dirección & pos = 0 & hs = 2 & xthttps = 111111
La forma en que se cambia la imagen al número de página,
encontramos que la URL de la imagen no es solo un índice, sino que también almacena cierta información. Si analiza esta URL en su conjunto, puede ver que la primera mitad es la URL de la imagen de Baidu https://image.baidu.com/, y la parte posterior Se compone de un par clave-valor, y los dos pares clave-valor están separados por &. Algunos solo tienen claves y no tienen valores. La eliminación no afecta los índices normales.
tn = baiduimage & ct = 201326592 & lm = -1 & cl = 2 & ie = gb18030 & word =% D1% EE% C3% DD & fr = ala & ala = 1 & alatpl = dirección & pos = 0 & hs = 2 & xthttps = 111111