Python 利用BeautifulSoup和正则表达式来爬取旅游网数据 - 代码天地

Python 利用BeautifulSoup和正则表达式来爬取旅游网数据

其他 2018-11-11 11:30:49 阅读次数: 0

import re
import requests
import time
from bs4 import BeautifulSoup

url = ‘http://www.cntour.cn/’
r = requests.get(url)
print(r.encoding,len(r.text))
soup = BeautifulSoup(r.text, ‘lxml’)
data = soup.select(’#main > div > div.mtop.firstMod.clearfix > div.leftBox > div > ul > li > a’) #注意删除 (：nth-child )字符串，否则会报错
print(data)
for i in data:
print(‘item:’,i.get_text(), ’ ‘,‘href:’,i.get(‘href’), ’ ‘,‘ID:’,re.findall(’\d+’,i.get(‘href’)))

猜你喜欢

转载自blog.csdn.net/qq_40256654/article/details/83903780

Python 利用BeautifulSoup和正则表达式来爬取旅游网数据

爬取实例-Python3.6，Xpath，BeautifulSoup4, 正则表达式

python利用re正则表达式提取数据

PYTHON 爬虫笔记九:利用Ajax+正则表达式+BeautifulSoup爬取今日头条街拍图集（实战项目二）

python3.6 利用requests和正则表达式爬取猫眼电影TOP100

Python爬虫-利用正则表达式爬取猫眼电影

python-对豆瓣的top250的爬取(利用正则表达式)

利用正则表达式处理爬取的今日头条内容数据（Python爬虫数据清洗）

python正则表达式爬取猫眼电影

python爬取准备二正则表达式

Python爬虫学习（一）使用Requests和正则表达式爬取简单网页

利用Python正则表达式抓取京东网商品信息

Python爬虫：正则表达式爬取校花网

Python爬虫学习第一天--利用正则表达式爬取图片

Python爬虫入门——2. 5 利用正则表达式爬取豆瓣电影 Top 250

python爬虫正则表达式爬妹子图

Python数据分析实战-利用正则表达式提取文本中的URL网址和邮箱（附源码和实现效果）

python爬虫数据解析之正则表达式

【python数据抓取技术与实战】正则表达式

数据之路 - Python爬虫 - 正则表达式

python接口用正则表达式提取数据

如何使用Python和正则表达式处理XML表单数据

python爬虫入门练习，使用正则表达式和requests爬取LOL官网皮肤

python爬虫入门——爬取猫眼电影排行（使用requests库和正则表达式）

Python爬虫包 BeautifulSoup 之正则表达式与Lambda表达式

python爬取天气网的全国空气质量指数排行榜（使用正则表达式和Xpath方法

利用正则表达式爬取官网数据及反反爬虫方法分析

《利用Python进行数据分析》第7章字符串操作与正则表达式

Python中利用正则表达式用逗号分割数据，但是忽略引号中的逗号的方法

Python学习笔记10-爬虫中利用正则表达式分析出页面中想要的数据

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)