urllib请求返回网页 - 代码天地

urllib请求返回网页

编程语言 2018-10-19 20:04:24 阅读次数: 0

开始学习python爬虫

参考书籍《Python网络爬虫实战》

出版社：清华大学出版社

主编：胡松涛

原书中使用的是python2，而我自己使用的是python3，所以在模块名称方面有较大差异，特写此记录

urllib请求返回网页

与书中的差异以及疑问都已标注在代码段上

import urllib.request  
#书中使用的模块为urllib2，在python3中名称变为urllib.request
import time, platform, os   
#书中并没有导入这几个模块

def clear():
    '''该函数用于清屏'''
    print(u'内容较多，显示3秒后翻页')
    time.sleep(3)
    OS = platform.system()
    if (OS == u'Windows'):
        os.system('cls')
    else:
        os.system('clear')

def linkBaidu():
    url = 'http://www.baidu.com'
    try:
        response = urllib.request.urlopen(url,timeout=3)
        #书中python2的写入方法为response =urllib2.urlopen(url,timeout=3)
    except urllib.request.URLError:
        print(u"网络地址错误")
        exit()
    with open('./baidu.txt','wb+') as fp:
        fp.write(response.read())
    # 书中这里是用的是with open('./baidu.txt','w') as fp:
    #运行会报错TypeError: write() argument must be str, not bytes+
    print(u"获取url信息，response.geturl() \n: %s " %response.geturl())
    print(u"获取返回代码，response.getcode() \n %s "%response.getcode())
    print(u"获取返回信息， response.info() \n: %s" %response.info())
    print(u"获取的网页内容已经存入当前目录的baidu.txt中")

if __name__ == '__main__':
    linkBaidu()

参考于https://www.jianshu.com/p/dd8392db5917

猜你喜欢

转载自blog.csdn.net/sinat_31308671/article/details/83148870

urllib请求返回网页

502 网页请求返回错误

socket,urllib,urllib3,request多种方法请求网页首页

已解决（Python3中urllib请求网页报错）AttributeError: module ‘urllib‘ has no attribute ‘request‘

网页请求从URL到返回数据

初识网页urllib模块

urllib 网页爬虫

urllib库 request请求

urllib 中的post请求

urllib中的get请求

HttpGet 请求爬去网页内容，返回乱码问题

Urllib库爬取网页

Python通过urllib访问网页

【Python爬虫】用urllib请求一个网页，响应的content中中文为16进制，如何转换为中文

python网络爬虫指南一：网页基础（html/css/JavaScript）、网络请求（urllib/requests)、数据解析(XPath/BeautifulSoup)

urllib基础-请求对象request

爬虫-3.urllib请求

Python网络请求---urllib库

2，urllib库-网络请求

网络请求之urllib网络请求库

Python网络请求urllib和urllib3详解

爬虫基础框架之urllib(一) --- urllib post请求

Python网页下载器urllib2

网页下载器urllib2实例

python快速使用Urllib爬取网页

urllib中的网页的编码（urlencode）、解码(unquote)

【爬虫】01 urllib 爬取网页

python3 urllib网页下载

python通过flask框架接收网页请求并返回结果

浏览器输入地址到返回页面理解一个简单的网页请求过程

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)