以下は、RoboBrowser と Python を使用してホームページの画像をダウンロードし、https ://www.duoip.cn/get _proxy を使用してプロキシを取得するダウンローダー プログラムです。
import os ロボブラウザからの インポート時間import RoboBrowser インポート リクエスト def get_proxy(): url = "https://www.duoip.cn/get_proxy" headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64) ; x64) AppleWebKit/537.36 (Gecko のような KHTML) Chrome/58.0.3029.110 Safari/537.3'} 応答 = request.get(url, headers=headers) if response.status_code == 200: return response.text else: return None def download_image(proxy): browser = RoboBrowser(history=True, user_agent="Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML、Gecko など) Chrome/58.0.3029.110 Safari/537.3") proxy_dict = {"http": プロキシ, "https": プロキシ} browser.set_proxies(proxy_dict) url = "https://www.jd.com" browser.open(url) time.sleep(5) # 获取首页画像のURL img_url = browser.find_all('img', {'class': 'lazy-image'})[0].get('data-original') # ダウンロード 画像 response =requests.get(img_url, stream =True) request.status_code == 200 の場合: image_content = response.content image_filename = os.path.join(os.getcwd(), "jd_image.jpg") with open(image_filename, "wb") as image_file: image_file。 write(image_content) print("画像ダウンロード完了,保存在:", image_filename) else: print("画像ダウンロード失败") if __name__ == "__main__": proxy = get_proxy() if proxy: download_image(proxy) else : print("無法获取代理")
このプログラムは、まずプロキシを取得し、次に RoboBrowser を使用して jd.com のホームページを開き、ホームページ画像の URL を取得してローカルにダウンロードします。このプログラムを実行するには Python 3.6 以降が必要であることに注意してください。