全书网 - 代码天地

全书网

其他 2019-03-11 09:41:25 阅读次数: 0

import requests
import re
from lxml import etree
start_url ='http://www.quanshuwang.com/list/5_{}.html'
book_page=1
# 1到128页书的网址
for book_page in range(1):
    url =start_url.format(book_page)
    response =requests.get(url).content.decode('gbk')
    # print(response)
    book_html= ' <li><a target="_blank" href="(.*?)" class="l mr10">'

    # book_title ='alt="(.*?)"'
    book_title ='<a target="_blank" title="(.*?)" '
    re_html= re.findall(book_html,response)
    re_title =re.findall(book_title,response)
    # for title,html in  zip(re_title,re_html):
    #     print(title,html)

    #range(1,20)书的数量,1到20的书籍数量
    for j in range(1,20):

        response_book =requests.get(re_html[j]).content.decode('gbk')
        read_start=' <a href="(.*?)" class="reader" title="(.*?)">开始阅读</a>'
        read_menu=re.findall(read_start,response_book)
        print(read_menu[0][0])
        print(read_menu[0][1])
        menu_url =requests.get(read_menu[0][0]).content.decode('gbk')
        print(menu_url)
        book_mulu='<DIV class="dirtitone"><H2>(.*?)</H2></div>'
        print(re.findall(book_mulu,menu_url))

猜你喜欢

转载自www.cnblogs.com/LQ970811/p/10508680.html

全书网

python爬全书网

python爬虫——全书网

爬取全书网小说

python爬取全书网小说

Python爬取全书网小说，免费看小说

全书结构

爬虫入门（四）——Scrapy框架入门：使用Scrapy框架爬取全书网小说数据

Scrapy框架入门：使用Scrapy框架爬取全书网小说数据

Python爬虫 | 爬取全书网小说斗罗大陆

xpath+多进程爬取全书网纯爱耽美类别的所有小说。

solr in Action全书翻译

安全书籍

《PyCharm 指南全书》

Javaweb全书总结

DBGrid 应用全书

delphi DBgrid应用全书

Delphi StringGrid使用全书

web安全书籍整理

《快速阅读》全书脉络梳理

网络安全书籍

Python工匠 | 全书要点汇总

ChatGPT百科全书（全网最全面）

《安士全书》原文及白话版

《iOS Wow Factor》全书译文精选

信息安全书籍大全(pdf版）

【产品经理】从专业走向管理 pdf全书

现代工厂管理必备全书

考研数学复习全书——函数极限连续

网络扫描信息揭秘（全书总结）

今日推荐

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

周排行

阿里云短信服务平台注册

Windows下的字符串处理(1)

sqoop: mysql导入数据到hdfs, hive, hbase

commons.lang中常用的工具类

离线安装PostgreSQL11.6

使用PyTorch简单实现卷积神经网络模型

一文彻底搞定谱聚类

一道面试题引发的血案

One Chat for Mac(聊天工具)

TCP/IP的底层队列是如何实现的？

每日归档

更多

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)