Imagen de la página de inicio de descarga de Python

El siguiente es un programa de descarga que usa RoboBrowser y Python para descargar imágenes de la página de inicio y usa https://www.duoip.cn/get _proxy para obtener el proxy:

importar 
tiempo de importación 
del sistema operativo desde robobrowser importar 
solicitudes de importación de RoboBrowser 
​def
get_proxy(): 
    url = "https://www.duoip.cn/get_proxy" 
    headers = { 
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64) ; x64) AppleWebKit/537.36 (KHTML, como Gecko) Chrome/58.0.3029.110 Safari/537.3'} 
    respuesta = request.get(url, encabezados=encabezados) 
    si respuesta.status_code == 200: 
        devolver respuesta.texto 
    más: 
        devolver Ninguno 
​def
download_image(proxy): 
    browser = RoboBrowser(history=True, user_agent="Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, como Gecko) Chrome/58.0.3029.110 Safari/537.3") 
    proxy_dict = {"http": proxy, "https": proxy} 
    browser.set_proxies(proxy_dict) 
​url
    = "https://www.jd.com" 
    browser.open(url) 
    time.sleep(5) 
​#
    获取首页图片的URL 
    img_url = browser.find_all('img', {'class': 'lazy-image'})[0].get('data-original')​# 下载
    图片

    response = request.get(img_url, stream =Verdadero) 
    si respuesta.status_code == 200: 
        image_content = respuesta.content 
        image_filename = os.path.join(os.getcwd(), "jd_image.jpg") 
        con open(image_filename, "wb") como image_file: 
            image_file. write(image_content) 
        print("图片下载完成,保存在:", image_filename) 
    else: 
        print("图片下载失败") 
​if
__name__ == "__main__": 
    proxy = get_proxy() 
    if proxy: 
        download_image(proxy) 
    else : 
        imprimir("无法获取代理")

Este programa primero obtiene un proxy, luego usa RoboBrowser para abrir la página de inicio de jd.com, obtiene la URL de la imagen de la página de inicio y la descarga localmente. Tenga en cuenta que este programa requiere Python 3.6 y superior para ejecutarse.

Supongo que te gusta

Origin blog.csdn.net/weixin_73725158/article/details/134003373
Recomendado
Clasificación