利用python下载网页到本地(python3) - 代码天地

利用python下载网页到本地(python3)

其他 2019-03-07 08:51:10 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/WhoisPo/article/details/51064309

这个功能需要用到urlretrieve，这个函数在urllib.request包里面。如果有同学用的是python2，那么这个函数就在urllib里面。

关于urlretrieve这个函数的用法，http://www.nowamagic.net/academy/detail/1302861中给出了很好的说明，大家有兴趣可以看一看。

我的是另一个例子，出自《python核心编程》一书，原书是基于python2的版本

下载一个网页，然后显示第一和最后一非空行，代码如下

from urllib.request import urlretrieve

def firstNonBlank(lines):
    for eachLine in lines:
        if not eachLine.strip():
            continue
        else:
            return eachLine


def firstLast(webpage):
    f = open(webpage, 'r')
    lines = f.readlines()
    f.close()

    print(firstNonBlank(lines))
    lines.reverse()
    print(firstNonBlank(lines))

def download(url="http://info.tsinghua.edu.cn", process=firstLast):
    try:
        retval = urlretrieve(url)[0]
    except IOError:
        retval = None
    if retval:
        print(retval)
        process(retval)


if __name__ == '__main__':
    download()

猜你喜欢

转载自blog.csdn.net/WhoisPo/article/details/51064309

利用python下载网页到本地(python3)

python3的requests模块下载图片到本地

python3爬虫：下载unsplash美图到本地

python3 urllib网页下载

用python3从网页中爬取图片下载到本地

python3利用scrapy_redis将cbs系统在线产品信息到excel表，以及封面图和详情图下载到本地

python3 抖音短视频链接去水印下载视频到本地

python3实现从ftp下载文件到本地

Python3~scrapy项目之下载网页图片

python3网页抓取与下载文件

python3爬虫下载网页上的pdf

python3 beautifulsoup解析网页下载图片

利用Python下载网页视频

Python3 对象存储到本地与恢复演示

利用python3爬虫下载图片、pdf文档

python3 利用Instaloader下载instagram数据示例

python下载图片到本地

python3的下载与安装

cpp到python3

利用Python把网页内容转换为pdf格式文件，批量下载到本地！

利用Python把网页内容转换为pdf格式文件，批量下载到本地！

利用python下载网页上的文件

【转载】Python3网络爬虫(一)：利用urllib进行简单的网页抓取

Python3网络爬虫(一)：利用urllib进行简单的网页抓取

python3 利用正则获取网页中的想保存下来的内容

python3爬取网页图片

Python3 抓取网页中的图片

python3 爬取天气网页

【python3】下载并安装python3

从Python 2到Python3的变化

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)