Python爬取知乎上的图片

其他 2018-09-08 23:54:47 阅读次数: 0

Python爬取知乎上的图片

# coding=utf-8

from urllib import request as rr
from bs4 import BeautifulSoup
import os
import re

url = "https://www.zhihu.com/question/281282523/answer/473126030"  # 指定的URL

#下载图片并保存到本地
def download(_url, file_name):
    if (_url == None):  #地址若为None则pass
        pass
    result = rr.urlopen(_url)  #打开链接

    if (result.getcode() != 200):  #如果链接不正常则pass
        pass
    else:
        data = result.read()  #链接正常的话则进行下载
        with open(file_name, "wb") as f:
            f.write(data)
            f.close()

if __name__ == '__main__':
    res = rr.urlopen(url)   #打开目标地址
    content = res.read()    #获取网页内容

    cnt = 0 #计数器
    soup = BeautifulSoup(content)   #实例化一个BeautifulSoup对象
    link_list = []  #创建一个list来存放链接

    for link in soup.find_all('img'):   #获取img标签中的内容
        addr = link.get('data-original')    #属性data-original对应的值即为图片的地址
        link_list.append(addr)  #添加到list中

    link_set = set(link_list)   #去重
    for addr in link_set:
        if (addr != None):
            pathName = '/Users/jiangnan/Desktop/zhihu/images/' + str(cnt + 1) + '.jpg'  #设置文件路径
            cnt = cnt + 1
            print("Doenloading the " + str(cnt) + "th picture")
            download(addr, pathName)    #调用下载函数

猜你喜欢

转载自blog.csdn.net/J__Max/article/details/82499280

Python爬取知乎上的图片

python 爬取知乎图片

Python爬虫对知乎问题下的图片进行爬取

知乎问题图片爬取

知乎问答图片爬取

利用selenium爬取知乎图片

使用scrapy爬取知乎图片

Python爬虫--爬取知乎

Python爬取知乎文章（一）

用python爬取知乎问答

【python爬虫自学笔记】-----爬取知乎图片并保存在本地

python爬虫实战（一）--爬取知乎话题图片

使用python爬虫——爬取淘宝图片和知乎内容

Python爬虫入门教程：知乎文章图片爬取器

新手爬虫教程：Python爬取知乎文章中的图片

Python项目实战:实现简单爬取知乎问题下的图片

Python爬虫新手教程：知乎文章图片爬取器

python爬虫实战（1）——爬取知乎热门回答图片

java---网络爬虫爬取知乎图片

知乎搜索关键字爬取相关图片

知乎live爬取

scrapy爬取知乎

Python爬去知乎上问题下所有图片

Python爬取知乎专栏文章标题及URL

python爬取知乎（模拟登陆）

python requests 爬取知乎用户信息

爬取知乎Python中文社区信息

Python知乎热门话题数据的爬取实战

python：知乎发现页的爬取（问题，作者，回答）

python3 爬取知乎模拟登录

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

周排行

购置笔记本常识

从源码看Spring Security之采坑笔记（Spring Boot篇）

大数据学习——高可用配置案例

如何避免选择不专业的建站公司?

Euclid's Game HDU - 1525（博弈）

面试笔记（六）---Js实现eventHandler

Windows 实例搭建的 FTP 在外网无法连接和访问

设计模式 : 桥接模式

USB 设备驱动开发之几个重要结构体分析

14-p14_sqrt求平方根

每日归档

更多

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)