记录自己python爬虫的学习 - 代码天地

记录自己python爬虫的学习

其他 2019-03-08 15:41:04 阅读次数: 0

由于之前有java基础和web开发基础，所以把https://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000廖雪峰老师的python3的教程看到面向对象这里开始学习py爬虫

记录下今天的第一个爬虫例子

爬的是知乎的其中一个话题，但是感觉图片并没有爬完，目前不清楚情况，有待以后研究深入了解

贴下收获以及代码:

import urllib.request,re,os
if __name__ == '__main__':
    targetPath = "D:\\python\\download\\images"
    def saveFile(path):
        #校验路径,如果不存在则创建
        if not os.path.isdir(targetPath):
            os.mkdir(targetPath)
        pos = path.rindex('/')
        t = os.path.join(targetPath, path[pos + 1:])
        print(t)
        return t
    url = "https://www.zhihu.com/question/36006897"
    headers = {
        'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.84 Safari/537.36'
    }
    req = urllib.request.Request(url=url, headers=headers)
    res = urllib.request.urlopen(req)
    data = res.read()
    for myurl, other in set(re.findall(r'(https:[^\s]*?(png|gif|jpg))', str(data))):
        print(myurl)
        try:
            urllib.request.urlretrieve(myurl, saveFile(myurl))
        except:
            print('挂掉了.....')

猜你喜欢

转载自blog.csdn.net/qq_35902833/article/details/78856112

记录自己python爬虫的学习

python爬虫学习记录

python爬虫学习过程记录

python爬虫学习之日志记录模块

记录学习python爬虫遇到的问题

记录小白学习python爬虫的过程（二）

记录小白学习python爬虫的过程（一）

【python】——爬虫06 mongdb学习记录

Python爬虫学习记录- httpx库的使用

【python】——爬虫07scrapy学习记录

关于在学习python爬虫时的学习记录

记录自己的学习历程

记录自己的学习旅程

开始记录自己的学习

记录自己的学习过程

python 爬虫框架scrapy学习记录和整理 python爬虫框架scrapy入门文档学习

Python爬虫记录

简单爬虫学习记录

『爬虫』学习记录

学习爬虫记录

爬虫学习记录

java爬虫学习记录

记录下自己学习Python内容1

python爬虫学习记录——各种软件/库的安装

Python 爬虫学习糗事百科纯属敦促自己学习

爬虫学习记录（一）————Request库爬虫

记录自己学习spring的历程

记录自己学习Golang的历程

开始在CSDN记录自己的学习

记录自己的nest学习之旅

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)