Python3 usa el módulo de solicitud para rastrear imágenes de la página web - Code World

Python3 usa el módulo de solicitud para rastrear imágenes de la página web

Others 2020-04-14 09:32:02 views: null

de urllib solicitud de
importación importación re
importación os

def down_html (url, fname):
r = request.urlopen (url)
con open (fname, 'wb') como fobj:
while True:
data = r.read ()
si no data:
break
fobj.write (data)

def get_url (fname, patt):
cpatt = re.compile (patt)
list = []
con open (fname) como fobj:
para la línea en fobj:
m = re.search (cpatt, line)
if m:
list.append ( m.group ())
lista de retorno

if __name__ == '__main__':
save_dir = '/ tmp / images'
si no es os.path.exists (save_dir):
os.mkdir (save_dir) patt
= 'http: // [. \ w / -] + \. (jpg | jpeg | png | gif) '
html_url =' http://www.tedu.cn/ '
html_fname =' /tmp/tedu.html '
down_html (html_url, html_fname)
urls = get_url (html_fname, patt)
para url en URL:
url_fname = url.split ('/') [- 1]
image_fname = os.path.join (save_dir, url_fname)
down_html (url, image_fname)

Seguidor de Linux

Publicado 73 artículos originales · elogiado 4 · 20,000+ visitas

carta privada preocupaciones

Supongo que te gusta

Origin blog.csdn.net/qq_27592485/article/details/102558166

Python3 usa el módulo de solicitud para rastrear imágenes de la página web

Python usa el módulo OpenCV para lograr la fusión de imágenes

Python usa el módulo de solicitudes para rastrear el contenido de Baidu Tieba

[La parte frontal de la página web realiza la rotación o el cambio de imágenes múltiples] Tres métodos para lograr

¡Python usa el módulo OpenCV para lograr un código de muestra de fusión de imágenes!

Python usa selenio para rastrear el sitio web de Fangtianxia, detalles de la lista de casas nuevas

El rastreador de Python usa el marco Scrapy para rastrear imágenes del auto de combate en el hogar de Mercedes-Benz

.NET usa PuppeteerSharp para generar imágenes de página

Python3 usa el módulo paramiko y el módulo de subprocesos para implementar la administración por lotes del host y ejecutar comandos

Python usa selenio para rastrear el sitio web de Fangtianxia, enumerando información dinámica

Java usa Jsoup para obtener el elemento especificado de la página web

Python usa hiper para rastrear datos de páginas web del protocolo http2.0

Código Java para rastrear el código fuente de una página web

Utilice el módulo de solicitudes para rastrear la traducción de Baidu

Python usa el módulo de subprocesos para crear subprocesos

Pyhton3 utiliza el módulo de solicitud y el módulo de solicitudes para implementar la consulta de pronóstico del tiempo

El proceso de solicitud de página web

springboot redirige el código de solicitud de WeChat para volver a la página actual, ##

¿No eres un rastreador de Python? Enséñele una idea general de rastreador para rastrear fácilmente los datos de la página web, ¡recójalos rápidamente! !

Python | Usa Python para rastrear toda la información de héroes y máscaras de héroes de LOL

[Crawler] Usa la magia para capturar imágenes de un sitio web

Artículos de Python----Python usa el módulo de registro para implementar la escritura de registros

Prueba jmeter una página durante 5 minutos para completar la solicitud de 5000, y el 90% del tiempo de respuesta de menos de 3 segundos, y calcula el número máximo de concurrentes

Arduino usa la placa de desarrollo esp8266 para leer la cantidad de seguidores en la página web de Bilibili usando el método https, etc.

Unity usa la pila para lograr el efecto de cambio de página deslizante

(Transferir) La página web de carga de WebView no muestra la solución de imágenes

Rastrear las imágenes de perros y gatos de Baidu y utilizar el aprendizaje de migración para lograr la clasificación de la red [medición exitosa]

Python usa selenium para rastrear 58 sitios web, detalles de alquiler

Rastrear rápidamente datos de imágenes de páginas web

.net descarga el código fuente de la página web, descarga imágenes de red o imágenes de IIS a local y copia imágenes de LAN a local

Recomendado

Clasificación

Diario

Más

2024-05-18(30)

2024-05-17(4)

2024-05-16(22)

2024-05-15(5)

2024-05-14(10)

2024-05-13(7)

2024-05-12(22)

2024-05-11(31)

2024-05-10(32)

2024-05-09(31)