Python 下载Bing首页高清图片

Bing上有很多精美的图片,可以利用python将这些图片抓取下来作为电脑的壁纸。想要抓取Bing上的高清图,首先需要对Bing图片展示的源代码进行分析,可以确定非贪婪匹配字段为(非贪婪算法可参考):

pic_urls_match = r'data-progressive=\"(.*?)\"'

在这里插入图片描述
通过一下代码可以实现对网页的获取,具体原理我会在其他文章中介绍

def getPage(url):
    #用于浏览器伪装
    headers ={'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/77.0.3865.90 Safari/537.36'}
    req = urllib.request.Request(url=url,headers=headers)
    res = urllib.request.urlopen(req)
    #获得网页源码并解码
    html_code = res.read().decode('UTF-8')
    return html_code

设置图片保存函数,其中使用try是为了在图片抓取的过程中,某一张图片获取失败不影响其他图片的抓取:

def saveImg(img_url,dirname):
    #保存图片到磁盘文件夹dirname中
    try:
        if not os.path.exists(dirname):
            print ('文件夹',dirname,'不存在,重新建立')
            #os.mkdir(dirname)
            os.makedirs(dirname)
        #获得图片文件名,包括后缀
        basename = os.path.basename(img_url)
        #拼接目录与文件名,得到图片路径
        filepath = os.path.join(dirname, basename)
        #下载图片,并保存到文件夹中
        urllib.request.urlretrieve(img_url,filepath)
        print("Save", filepath, "successfully!")
    except IOError as e:
        print ('文件操作失败',e)
    except Exception as e:
        print ('错误 :',e)
    return filepath

主函数

def main():
    url = 'https://bing.ioliu.cn/'
    #dirname='C:\Users\wzr\Desktop\srceen'
    html_code = getPage(url)
    #用于匹配网址的字符串
    pic_urls_match = r'data-progressive=\"(.*?)\"'
    image_urls = re.findall(pic_urls_match,html_code)
    for i in range (len(image_urls)):
        img_url = image_urls[i]
        filepath = saveImg(img_url,'C:\\Users\\wzr\\Desktop\\srceen')   # 图片文件的的路径
    print('Compelet')

最后的图片展示,所有的源代码可以在我的Github上找到
在这里插入图片描述

发布了6 篇原创文章 · 获赞 1 · 访问量 1797

猜你喜欢

转载自blog.csdn.net/msssssss/article/details/103892657