吴裕雄实战python编程（2） - 代码天地

吴裕雄实战python编程（2）

其他 2018-12-03 22:11:18 阅读次数: 0

from urllib.parse import urlparse

url = 'http://www.pm25x.com/city/beijing.htm'
o = urlparse(url)
print(o)

print("scheme={}".format(o.scheme)) # http
print("netloc={}".format(o.netloc)) # www.pm25x.com
print("port={}".format(o.port)) # None
print("path={}".format(o.path)) # /city/beijing.htm
print("query={}".format(o.query)) # 空

import requests

url = 'http://www.wsbookshow.com/'
html = requests.get(url)
html.encoding="GBK"
print(html.text)

import requests
import numpy as np

url = 'http://www.wsbookshow.com/'
html = requests.get(url)
html.encoding="gbk"
htmllist = html.text.splitlines()
print(type(htmllist))
print(np.shape(htmllist))
for row in htmllist:
print(row)

import requests

url = 'http://www.wsbookshow.com/'
html = requests.get(url)
html.encoding="gbk"

htmllist = html.text.splitlines()
n=0
for row in htmllist:
if "新概念" in row:
n+=1
print("找到 {} 次!".format(n))

import re
pat = re.compile('[a-z]+')

m = pat.match('tem12po')
print(m)

if not m==None:
print(m.group())
print(m.start())
print(m.end())
print(m.span())

import re
m = re.match(r'[a-z]+','tem12po')
print(m)

if not m==None:
print(m.group())
print(m.start())
print(m.end())
print(m.span())

import re

pat = re.compile('[a-z]+')

m = pat.search('3tem12po')
print(m) # <_sre.SRE_Match object; span=(1, 4), match='tem'>

if not m==None:
print(m.group()) # tem
print(m.start()) # 1
print(m.end()) # 4
print(m.span()) # (1,4)

import re
pat = re.compile('[a-z]+')

m = pat.findall('tem12po')
print(m) # ['tem', 'po']

import requests,re

regex = re.compile('[a-zA-Z0-9_.+-]+@[a-zA-Z0-9-]+\.[a-zA-Z0-9-.]+')
url = 'http://www.wsbookshow.com/'
html = requests.get(url)
emails = regex.findall(html.text)
for email in emails:
print(email)

猜你喜欢

转载自www.cnblogs.com/tszr/p/10061172.html

吴裕雄实战python编程（2）

吴裕雄实战python编程（1）

吴裕雄实战PYTHON编程（8）

吴裕雄实战PYTHON编程（7）

吴裕雄--python编程：CGI编程

吴裕雄 python 爬虫（4）

吴裕雄--python学习笔记：爬虫

吴裕雄--天生自然python编程：实例

吴裕雄 python 机器学习-DMT（2）

吴裕雄 python oracle检索数据（2）

吴裕雄 python深度学习与实践（2）

吴裕雄--天生自然 JAVA开发学习：网络编程

吴裕雄--天生自然KITTEN编程：小猫解题

吴裕雄 python 数据可视化

吴裕雄 python神经网络（8）

吴裕雄 python 数据处理（1）

吴裕雄 python神经网络（6）

吴裕雄 python神经网络（7）

吴裕雄 python 机器学习-KNN算法（1）

吴裕雄 python 机器学习-DMT（1）

吴裕雄 python深度学习与实践（1）

吴裕雄 python深度学习与实践（5）

吴裕雄 python深度学习与实践（6）

吴裕雄 python深度学习与实践（9）

吴裕雄 python深度学习与实践（8）

吴裕雄 python深度学习与实践（12）

吴裕雄 python深度学习与实践（10）

吴裕雄 python深度学习与实践（3）

吴裕雄 python深度学习与实践（4）

吴裕雄 python深度学习与实践（7）

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)