Python ダウンロードのホームページの画像

以下は、RoboBrowser と Python を使用してホームページの画像をダウンロードし、https ://www.duoip.cn/get _proxy を使用してプロキシを取得するダウンローダー プログラムです。

import os
ロボブラウザからの
インポート時間import RoboBrowser
インポート リクエスト
def
get_proxy(): 
    url = "https://www.duoip.cn/get_proxy" 
    headers = { 
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64) ; x64) AppleWebKit/537.36 (Gecko のような KHTML) Chrome/58.0.3029.110 Safari/537.3'}
    応答 = request.get(url, headers=headers) 
    if response.status_code == 200: 
        return response.text 
    else: 
        return None 
def
download_image(proxy): 
    browser = RoboBrowser(history=True, user_agent="Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML、Gecko など) Chrome/58.0.3029.110 Safari/537.3") 
    proxy_dict = {"http": プロキシ, "https": プロキシ} 
    browser.set_proxies(proxy_dict) 
url
    = "https://www.jd.com" 
    browser.open(url) 
    time.sleep(5) 
#
    获取首页画像のURL 
    img_url = browser.find_all('img', {'class': 'lazy-image'})[0].get('data-original') # ダウンロード
    画像

    response =requests.get(img_url, stream =True) 
    request.status_code == 200 の場合: 
        image_content = response.content 
        image_filename = os.path.join(os.getcwd(), "jd_image.jpg") 
        with open(image_filename, "wb") as image_file: 
            image_file。 write(image_content) 
        print("画像ダウンロード完了,保存在:", image_filename) 
    else: 
        print("画像ダウンロード失败") 
if
__name__ == "__main__": 
    proxy = get_proxy() 
    if proxy: 
        download_image(proxy) 
    else : 
        print("無法获取代理")

このプログラムは、まずプロキシを取得し、次に RoboBrowser を使用して jd.com のホームページを開き、ホームページ画像の URL を取得してローカルにダウンロードします。このプログラムを実行するには Python 3.6 以降が必要であることに注意してください。

おすすめ

転載: blog.csdn.net/weixin_73725158/article/details/134003373