零基础也能学会，python采集整站小说！ - 代码天地

零基础也能学会，python采集整站小说！

其他 2019-03-26 14:52:50 阅读次数: 0

版权声明：禁止转载至其它平台，转载至博客需带上此文链接。 https://blog.csdn.net/qq_41841569/article/details/88776590

获取整站小说的url地址：

allurl='https://www.qidian.com/all?
当然在学习Python的道路上肯定会困难，没有好的学习资料，怎么去学习呢？学习Python中有不明白推荐加入交流群号：683380553 群里有志同道合的小伙伴，互帮互助，群里有不错的视频学习教程和PDF！
分析url地址：

可以看到当你翻页时page是会跟随着变化的，寻找变化的规律。

重点：

从利用python采集一本小说中的一章这个思路出发，从一本小说中采集一章与从一夜中采集一本是同一个道理，然后利用循环采集所有小说。

代码：

当然在学习Python的道路上肯定会困难，没有好的学习资料，怎么去学习呢？学习Python中有不明白推荐加入交流群号：683380553群里有志同道合的小伙伴，互帮互助，群里有不错的视频学习教程和PDF！

allurl='https://www.qidian.com/all?orderId=&style=1&pageSize=20&siteid=1&pubflag=0&hiddenField=0&page={}'
import requests
from lxml import etree
import os

for i in range(0,56495):
    url=allurl.format(i)
    #url='https://www.qidian.com/all'
    respond = requests.get(url).text
    #print(respond)
    html = etree.HTML(respond)
    data2 = html.xpath('//div[@class="book-mid-info"]/h4/a/text()')
    print(data2)
    data1 = html.xpath('//div[@class="book-mid-info"]/h4/a/@href')
    #print(data2)
    for shuming,lianjie in zip(data2,data1):
        #print(shuming,lianjie)·
        if os.path.exists(shuming) == False:
            os.mkdir(shuming)  # 创建文件夹
        zj=requests.get("http:"+lianjie).text
        html1=etree.HTML(zj)
        zjlj=html1.xpath('//ul[@class="cf"]/li/a/@href')
        zjmz=html1.xpath('//ul[@class="cf"]/li/a/text()')
        #print(zjlj)
        for a,b in zip(zjlj,zjmz):
            #print(a,b)
            respond1=requests.get('http:'+a).text
            html3=etree.HTML(respond1)
            wz=html3.xpath('//div[@class="read-content j_readContent"]/p/text()')
            wza=" ".join(wz)
            file_name = shuming + "\\" + b + ".txt"
            print("正在抓取文章：" + file_name)
            with open(file_name, 'a', encoding="utf-8") as f:
                f.write(wza)

猜你喜欢

转载自blog.csdn.net/qq_41841569/article/details/88776590

零基础也能学会，python采集整站小说！

什么是Python?零基础能学会Python吗?

零基础学习Python能学会吗

就像看小说一样，让你一个小时学会Python零基础

献给Python初学者，零基础学习Python能学会吗？

零基础小白能学会python吗有没有什么好方法

零基础学Python能学会吗？会不会跟不上学习进度？

零基础自学Java能学会吗？

零基础能学会编程，怎么学习？

零基础也能学python！（一）

一行Python代码就可以下载任意网站视频，零基础小白也能轻松学会

零基础怎样才能系统快速的学会Python？

零基础初学者如何快速学会python

码上行动：零基础学会Python编程

零基础学会Python编程——开发环境的搭建

零基础学会python编程——输入 / 输出函数与变量

快乐python 零基础也能P图 —— PIL库

转行Java能学会吗？零基础学习Java的学习路线

零基础也能学会的SpringCloud教程(三)：完成微服务的注册

零基础也能学会的编程开发益智类小游戏

【70行JavaScript代码实现除夕夜倒计时零基础也能学会～

云计算主要学些什么技术内容？零基础能学会吗？

零基础python3爬虫爬取起点小说

零基础学会MyBatisPlus（SpringBoot环境）

零基础也能学好html

【halcon教程】人工智能机器视觉越来越火，零基础也能学会（附学习步骤）

嵌入式开发培训都要学什么？零基础参加嵌入式学习培训能学会吗

用几小时，零基础也能学会可视化大屏，这百张模板帮了大忙

零基础入门python爬虫，采集豆瓣网电影排名top250！

爬虫小案例：适合Python零基础、对爬虫数据采集感兴趣的同学！

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)