crawler碎碎念6 豆瓣爬取操作之获取数据 - 代码天地

crawler碎碎念6 豆瓣爬取操作之获取数据

其他 2018-10-21 11:08:21 阅读次数: 0

import requests

from lxml import etree

s = requests.Session()

for id in range(0,251,25):

　　url ='https://movie.douban.com/top250/?start-'+str(id)

　　r = s.get(url)

　　r.encoding = 'utf-8'

　　root = etree.HTML(r.content)

　　items = root.xpath(' ')

　　#print(len(items))

　　for item in items:

　　　　title = item.xpath(' ') #/text加在最后就是找它的文本内容

　　　　print(title)

猜你喜欢

转载自www.cnblogs.com/xingnie/p/9706328.html

crawler碎碎念6 豆瓣爬取操作之获取数据

碎碎念之

碎碎念之工作②

碎碎念之工作①

大数据碎碎念

数据的范围碎碎念

机器学习的碎碎念之概述

数据结构碎碎念（一）

数据结构碎碎念（二）

数据分析+数据挖掘暑期实习碎碎念

机器学习碎碎念之聚类

机器学习碎碎念之逻辑回归

机器学习碎碎念之线性回归

python_数据分析_笔记碎碎念

DataTables碎碎念-动态更改数据

Android数据持久化SQLite碎碎念

数据仓库建设碎念

【Pandas】【碎碎念】做切片操作，防止DataFrame对象转换为Series对象

编程日志&&刷题日志&&开发日志迁移之碎碎念

深度学习之自监督学习——一些碎碎念

排序碎碎念（三）：数据结构基础— 统计工龄 QuickSort

排序碎碎念（一）：数据结构基础— Insert or Merge

排序碎碎念（二）：数据结构基础— Insert or Heap

排序碎碎念（五）：数据结构基础— Sort with Swap(0, i)

排序碎碎念（四）：数据结构基础— PAT Judge

基于Netfilter hook功能的数据包拦截---有关DCN优化的碎碎念

【Pandas】【碎碎念】数据list对象去重，转字符串

碎碎念

近日碎碎念

lua 碎碎念

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)