爬虫：一个url多页 - 代码天地

爬虫：一个url多页

其他 2018-05-07 20:36:13 阅读次数: 5

import urllib.request
import urllib.parse

from lxml import etree

#链接

url = 'http://www'

#循环得到分页

for i in range(1,26):

#查到到页数关键词

query = {'Page':'i'}
data = urllib.parse.urlencode(query).encode(encoding = 'utf8')
post = urllib.request.Request(url,data)

response = urllib.request.urlopen(post)

#获得源代码

page = response.read()

s = etree.HTML(page)

#查找需到的信息

file = s.xpath('//a[@class="link-01"][1]/text()')

print(file)

走了很多坑，python3.x和python2.x有些不同，2.x有urllib、urllib2，3.x只有urllib：

在Pytho2.x中使用import urllib2——-对应的，在Python3.x中会使用import urllib.request，urllib.error。
在Pytho2.x中使用import urllib——-对应的，在Python3.x中会使用import urllib.request，urllib.error，urllib.parse。
在Pytho2.x中使用import urlparse——-对应的，在Python3.x中会使用import urllib.parse。
在Pytho2.x中使用import urlopen——-对应的，在Python3.x中会使用import urllib.request.urlopen。
在Pytho2.x中使用import urlencode——-对应的，在Python3.x中会使用import urllib.parse.urlencode。
在Pytho2.x中使用import urllib.quote——-对应的，在Python3.x中会使用import urllib.request.quote。
在Pytho2.x中使用cookielib.CookieJar——-对应的，在Python3.x中会使用http.CookieJar。
在Pytho2.x中使用urllib2.Request——-对应的，在Python3.x中会使用urllib.request.Request。

猜你喜欢

转载自blog.csdn.net/z13405546523/article/details/80112840

爬虫：一个url多页

Python爬虫：一个完整的爬取多页短租房的案例！

做一个爬虫专用的url解析器

js声明一个全局的url，多页面调用

织梦一个标签获取当前链接url(首页/列表页/列表分页/内容页/内容页分页)

【使用JSOUP实现网络爬虫】从一个URL加载一个Document

一个简易的Java多页面队列爬虫程序

一个爬虫

点击一个url

一个URL之旅

vue-multi-tab--一个让你在SPA里使用多页签的框架页

用springMVC做一个多页的用户注册过程

VueCli3 多页开发 token权限控制的一个框架说明

账户在一个窗口下多tab页切换商户问题

分享：ThinkPHP和Webpack前后端结合构建SEO多页应用的一个思路

window.open的同一url打开是同一个tab页签在怎么办

Python爬虫--一个简单的爬虫

一个简单的爬虫——新闻爬虫

一个简单的爬虫

一个小爬虫

一个非常漂亮的登录页

push一个透明页

CSS：一个简单的欢迎页

一个微信页的模板

1:创建一个搜索页

Android一个标签页的实现

从一个URL加载一个Document

Linux访问一个url

获取一个URL的参数

一个完整的URL 解析过程

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)