爬取豆瓣图书首页的图书信息 - 代码天地

爬取豆瓣图书首页的图书信息

其他 2019-01-10 23:36:02 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/weixin_40567229/article/details/84201041

使用requests库和re库来爬取豆瓣图书首页的图书信息

import requests
import re

content = requests.get("http://book.douban.com").text    #get函数获取豆瓣图书网页代码
pattern = re.compile('<li.*?cover.*?href="(.*?)".*?alt="(.*?)".*?author">(.*?)<',re.S)    #complip函数保存正则式
result = re.findall(pattern,content)    #findall寻找符合正则式的信息
for results in result:
    url,name,author = results
    url = re.sub('\s',' ',url)    #将换行符转换为空格
    name = re.sub('\s',' ',name)
    author = re.sub('\s','',author)
    print(url,name,author)

爬取结果:

猜你喜欢

转载自blog.csdn.net/weixin_40567229/article/details/84201041

爬取豆瓣图书首页的图书信息

爬取豆瓣读书的图书信息和评论信息

Python爬取豆瓣图书信息学习记录

爬取豆瓣图书网站的图书信息，并生成xlsx文档

JD图书信息爬取

Python爬虫入门 | 4 爬取豆瓣TOP250图书信息

爬取豆瓣上某个用户标记的想读的图书信息

python爬虫-使用IP代理爬取豆瓣读书图书信息

python采用requests+bs4爬取豆瓣top250图书信息

Python爬虫——豆瓣下图书信息

爬去当当热销图书信息

【python爬虫实例】爬取豆瓣图书及信息

爬取豆瓣网图书TOP250的信息

2-6-6 应用案例：爬取豆瓣 TOP250 图书信息并存储（版本：py3）——学习笔记

爬取豆瓣图书TOP250

爬虫之爬取豆瓣图书的评论

豆瓣爬取图书标签

requests+beautifulsoup爬取豆瓣图书

爬取豆瓣的最新推荐图书

爬取锦城学院图书馆学生借书信息

Python爬取当当、京东、亚马逊图书信息代码实例

当当网程序设计类图书信息爬取

Python爬虫实战+Scrapy框架爬取当当网图书信息

requests + re 爬去网站图书信息（Python）

爬取豆瓣电影Top250和和豆瓣图书

图书信息系统

Java存储图书信息

Java查询图书信息

图书信息查询系统

[Python爬虫]爬虫实例:在线爬取当当网畅销书Top500的图书信息

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

OOP第二次作业

java web 乱码问题

android 禁止scrollview 因控件变化自动滚动到底的方法

mysql服务解压版的安装(5.7)

centos7 nginx+tomcat配置https 安装免费SSL Let’s Encrypt

使用Mosquitto遗嘱机制实现感知客户端上下线功能的方法

面向对象之------多态与多态性

开发Teams Tabs应用程序

C# 希尔排序

第2章 Jupyter Notebooks

每日归档

更多

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)