python爬虫豆瓣推理书籍及链接 - 代码天地

python爬虫豆瓣推理书籍及链接

其他 2018-08-19 18:13:54 阅读次数: 0

前言

因为喜欢的妹子特别喜欢推理书籍，因此就想用python把豆瓣上的推理书籍给爬下来，让她惊喜惊喜，但是好像没达到预期的目的。先上一张爬到的数据图片。
这里写图片描述

代码

我的代码比较简单只实现基本的功能大家可以自己改

# -*- coding: utf8 -*-
from bs4 import BeautifulSoup
import requests
from openpyxl import Workbook
import sys
reload(sys)
sys.setdefaultencoding('utf8')
f = open("D:\\python\\demos\\crawler\\DouBanSpider\\dybooks.txt", "a")
def get_html(url):
    header = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:47.0) Gecko/20100101 Firefox/47.0'}
    html = requests.get(url,headers=header).content
    return html
def get_con(html):
    soup = BeautifulSoup(html,'html.parser')      
    for href in soup.find_all('li',class_='subject-item'):
        cnt=0
        for link in href.find_all("a"):
            if cnt==1:
                links=link.get('href')
                name=link.get('title')    
            cnt=cnt+1;
        for detail in href.find(class_='pub'):
            details= detail.string
        for rank in href.find(class_='rating_nums'):
            rating=rank.string        
            f.write("书籍名称： "+name+"\n")
            f.write("信息： "+details+"\n")
            f.write("评分： "+rating+"\n")
            f.write("链接： "+links+"\n")
            f.write("\n\n")    
def main():
    url = 'https://book.douban.com/tag/推理?start='
    for i in range(0,90):
        urls=url+str(i*20)+"&type=T"
        html=get_html(urls)
        get_con(html)
    f.close()
if __name__ == '__main__':
    main()

猜你喜欢

转载自blog.csdn.net/u013309870/article/details/80184592

python爬虫豆瓣推理书籍及链接

python爬虫爬取豆瓣书籍信息并生成表格

python爬虫豆瓣250排行书籍

python爬虫练习之爬取豆瓣读书所有标签下的书籍信息

Python多线程网络爬虫实战：获取豆瓣评价人数超过1w+的书籍

Python 爬虫-豆瓣读书

Python 豆瓣爬虫

Python爬虫——豆瓣读书

python豆瓣电影爬虫

Python爬取豆瓣指定书籍的短评

python从入门到进阶推荐书籍最全整理pdf分享附网盘链接已拿BT豆瓣offer

[Python][爬虫04]Fiddler与HTTP请求：抓取豆瓣评分以及资源链接（一）

[Python][爬虫05]Fiddler与HTTP请求：抓取豆瓣评分以及资源链接（二）

python数据分析之爬虫七：爬取豆瓣书籍排行榜Top250

【Python爬虫】听说你又闹书荒了？豆瓣读书9.0分书籍陪你过五一

利用爬虫获取豆瓣上可能喜欢的书籍

初试python爬虫之：豆瓣电影爬虫

Python之父强烈推荐，Python3网络爬虫开发实战，爬虫入门必看书籍，豆瓣评分9.2

推荐书籍《Python爬虫开发与项目实战》附下载链接

推荐书籍《精通Python网络爬虫核心技术、框架与项目实战》附下载链接

[python]书籍信息爬虫示例

python网络爬虫书籍推荐

python从入门到进阶推荐书籍史上最全整理pdf分享网盘下载附链接已拿BT豆瓣offer

Python3采集豆瓣用户的书籍评论信息

python批量查询豆瓣书籍评分（教程附源码）

Python 爬虫——模拟登陆豆瓣

python 爬虫豆瓣top250

Python爬虫——豆瓣下图书信息

python爬虫实现豆瓣模拟登录

python——爬虫（豆瓣top250）

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)