El siguiente es un programa de descarga que usa RoboBrowser y Python para descargar imágenes de la página de inicio y usa https://www.duoip.cn/get _proxy para obtener el proxy:
importar tiempo de importación del sistema operativo desde robobrowser importar solicitudes de importación de RoboBrowser def get_proxy(): url = "https://www.duoip.cn/get_proxy" headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64) ; x64) AppleWebKit/537.36 (KHTML, como Gecko) Chrome/58.0.3029.110 Safari/537.3'} respuesta = request.get(url, encabezados=encabezados) si respuesta.status_code == 200: devolver respuesta.texto más: devolver Ninguno def download_image(proxy): browser = RoboBrowser(history=True, user_agent="Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, como Gecko) Chrome/58.0.3029.110 Safari/537.3") proxy_dict = {"http": proxy, "https": proxy} browser.set_proxies(proxy_dict) url = "https://www.jd.com" browser.open(url) time.sleep(5) # 获取首页图片的URL img_url = browser.find_all('img', {'class': 'lazy-image'})[0].get('data-original')# 下载 图片 response = request.get(img_url, stream =Verdadero) si respuesta.status_code == 200: image_content = respuesta.content image_filename = os.path.join(os.getcwd(), "jd_image.jpg") con open(image_filename, "wb") como image_file: image_file. write(image_content) print("图片下载完成,保存在:", image_filename) else: print("图片下载失败") if __name__ == "__main__": proxy = get_proxy() if proxy: download_image(proxy) else : imprimir("无法获取代理")
Este programa primero obtiene un proxy, luego usa RoboBrowser para abrir la página de inicio de jd.com, obtiene la URL de la imagen de la página de inicio y la descarga localmente. Tenga en cuenta que este programa requiere Python 3.6 y superior para ejecutarse.