urllib库与爬虫的简单示例程序 - 代码天地

urllib库与爬虫的简单示例程序

其他 2020-02-12 16:30:32 阅读次数: 0

示例：urlopen的使用

import urllib.request


url = 'http://www.baidu.com'
with urllib.request.urlopen(url) as res:
    html = res.read()
    print(type(html))
    print(html)

执行代码，可以看到这段程序把整个百度首页的html代码全部下载下来了，没有经过任何解析。

Request类对象

import urllib.request


url = 'https://www.baidu.com'
request=urllib.request.Request(url)
res = urllib.request.urlopen(request)
html = res.read()
print(type(html))
print(html)

利用url构造了一个Request类对象，并用这个类对象作为urlopen的参数获得响应，这段程序的结果与上例相同。

构造User-Agent

import urllib.request

# 构造request
url = 'https://www.baidu.com'
ua = {'User-agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36'}
request=urllib.request.Request(url,headers=ua)

# 读取数据
res = urllib.request.urlopen(request)
print(type(res))
html = res.read().decode()  # 使用.decode()可以将获得的数据由bytes转换为str
print(type(html))
print(html)
# ctrl+/ 注释代码块

注意.decode()的使用，使bytes->str。

url中字符的编码与解码
编码需要使用urllib.request.urlencode方法

此方家的空腹

发布了38 篇原创文章 · 获赞 9 · 访问量 6301

私信关注

猜你喜欢

转载自blog.csdn.net/qq_42138454/article/details/104106387

urllib库与爬虫的简单示例程序

MatplotLib库的简单示例程序

Python爬虫基础：简单的爬虫入门示例（urllib库）

Python 爬虫学习02 Urllib库示例学习

AJAX 简单例程示例

HadoopMapReduceWordcount示例程序

Thrift示例程序

Keras示例程序

WebService示例程序

简单的爬虫例子urllib

python 爬虫urllib基础示例

tf学习（二）—— 简单示例程序学习

python爬虫——urllib库

python爬虫，Urllib库

爬虫中urllib库

Python 爬虫 ---- urllib 库

爬虫库Urllib

爬虫之urllib库

【python】urllib库（爬虫）

爬虫Urllib库，Requests库

urllib库与requests库爬虫

jrtplib示例程序1

pin示例程序详解

PHP接口示例程序

readv writev示例程序

管道创建示例程序

java注解示例程序

optix prime示例程序

接口的应用示例程序

【Python爬虫】urllib库的使用

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)