python urllib.parse解析url

其他 2018-10-20 13:04:24 阅读次数: 0

1.urllib.parse.urlparse(urlstring, scheme=’’, allow_fragments=True)

功能: 将url分为6部分，返回一个元组；
协议, 服务器的地址(ip:port), 文件路径，访问的页面

from urllib import parse
url = 'https://www.baidu.com/s?ie=utf-8&f=8&rsv_bp=0&rsv_idx=1&tn=baidu&wd=hello&rsv_pq=d0f841b10001fab6&rsv_t=2d43603JgfgVkvPtTiNX%2FIYssE6lWfmSKxVCtgi0Ix5w1mnjks2eEMG%2F0Gw&rqlang=cn&rsv_enter=1&rsv_sug3=6&rsv_sug1=4&rsv_sug7=101&rsv_sug2=0&inputT=838&rsv_sug4=1460'
parsed_tuple = parse.urlparse(url)
print(parsed_tuple)
print(parsed_tuple.netloc)
print(parsed_tuple.path)

在这里插入图片描述

urlencode:

from urllib.parse import   urlencode
params = {
    'name':'westos',
    'age':20
}
base_url = 'http://www.baidu.com?'
url = base_url + urlencode(params)
print(url)

在这里插入图片描述

url异常处理

- 异常
     exception urllib.error.URLError¶
     exception urllib.error.HTTPError
     exception urllib.error.ContentTooShortError(msg, content)

** 超时异常处理
from urllib import request, error
import  socket
#
try:
    url = 'https://www.baidu.com'
    response = request.urlopen(url, timeout=0.01)
    print(response.read().decode('utf-8'))
except error.HTTPError as e:
    print(e.reason, e.code, e.headers, sep='\n')
except error.URLError as e:
    print(e.reason)
    if isinstance(e.reason, socket.timeout):
        print("超时")
else:
    print("成功")

在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/zcx1203/article/details/83118785

python urllib.parse解析url

python库的解析--URL解析(urllib.parse库)

使用 Python 的 urllib.parse 库解析 URL

利用Python库urllib.parse对URL路径进行解析、拆分

Python urllib库使用教程（urllib.request、urllib.parse、urllib.error和urllib.robotparser）（URL解析、URL编码）

利有Python库urllib.parse的成员函数parse_qs()解析URL 中的查询字符串

python3 使用urllib.parse对url进行处理

Python3标准库：urllib.parse分解URL

python的urllib.parse用法

urllib.parse库用于解析URL

urllib.parse 用于解析 URL

Python3 urllib.parse 常用函数示例

python学习笔记（17）urllib.parse模块使用

Python3的urllib.parse常用函数小结

url中urllib.parse小技巧

Python3模块详解--老司机工具urllib模块详解之urllib.parse子模块

学习笔记(28):21天通关Python（仅视频课）-网络模块概述与urllib.parse模块讲解

urllib.parse包学习

Python-urllib库parse模块解析链接常用方法

URL组成成分及各部分作用简介及urllib.parse / uri

urllib.parse：很底层，但是是一个处理url路径的好模块

处理urlparse/urllib.parse中修改url参数结果的奇思异想

urllib.parse quote/unquate/urlencode

Python 3.x 中如何使用urllib.parse.unquote()函数对URL进行解码

python库的解析--urllib.request 用于打开 URL 的可扩展库(urllib.request库)

python学习笔记——urllib库中的parse

python-保存cookie信息/urllib模块里面的异常/url解析模块

关于爬虫urllib.request模块、urllib.parse模块的基础使用

Python urllib urlretrieve函数解析

python标准库urllib.parse.urlencode的应用

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)