python爬虫之爬取网站小说，获取一部小说 - 代码天地

python爬虫之爬取网站小说，获取一部小说

其他 2020-04-11 11:39:49 阅读次数: 0

python爬虫之爬取网站小说，由于学习没多久，许多小细节还不是很理解清楚，在大佬的帮助下，完成了这篇。
代码仅作参考：

'''
函数式编程
纵横中文网爬取阴阳酒馆小说
'''

# 导入第三方库
import requests
from lxml import etree
import time
import os
from fake_useragent import UserAgent
ua = UserAgent()
headers = {'User-Agent':ua.random}


# 得到html文本的函数
def get_html(url):
    time.sleep(1)
    html = requests.get(url, headers=headers).content.decode()
    return html


# 解析html文本的函数
def paser_html(html):
    e = etree.HTML(html)
    href = e.xpath('//ul[@class="chapter-list clearfix"]/li[@class=" col-4"]/a/@href')
    return href


# 定义解析详情页并保存的函数
def paser_detail(href):
    if not os.path.exists('阴阳酒馆'):
        os.mkdir('阴阳酒馆')
    for url in href:
        time.sleep(1)
        parg = requests.get(url, headers=headers).content.decode()
        e = etree.HTML(parg)
        text = e.xpath('//div[@class="content"]/p/text()')
        title = e.xpath('//div[@class="title"]/div[@class="title_txtbox"]/text()')
        with open('阴阳医馆' + '/' + '{}.txt'.format(title[0]), 'a', encoding='utf-8') as f:
            f.write(title[0])
            f.write('\r')
            for i in text:
                f.write(i)
            f.write('\r')


# 定义主函数
def main():
    url = "http://book.zongheng.com/showchapter/894704.html"
    html = get_html(url)
    href = paser_html(html)
    paser_detail(href)


# 运行函数
if __name__ == '__main__':
    main()

warm...

发布了44 篇原创文章 · 获赞 16 · 访问量 2385

私信关注

猜你喜欢

转载自blog.csdn.net/qq_46292926/article/details/104830702

python爬虫之爬取网站小说，获取一部小说

python爬虫之类的方法爬取一部小说

python爬虫之爬取网站小说

Python爬虫爬取网站小说

python爬虫爬取网站小说

爬取一部小说（适合爬虫新手来练习）

初探scrapy（用scrapy爬取一部小说）

Python爬虫——爬取小说

(二）Python爬虫笔记--爬取网站小说

Python爬虫基础入门实战案例（爬取网站小说）

python爬虫，简单的爬取小说网站的阅读排名

Python实现某网站爬取小说（爬虫）

python之爬取小说

Python爬虫层层递进，从爬取一章小说到爬取全站小说

如何用python爬虫从爬取一章小说到爬取全站小说

爬虫爬取小说网站

爬虫小案例——爬取网站小说

python爬虫入门之爬取小说.md

Python爬虫系列之小说网爬取

Python爬虫实战项目之小说信息爬取

python爬虫实例之——多线程爬取小说

python爬虫实例之小说爬取器

python爬虫--一次爬取小说的尝试

Python爬虫—爬取小说名著

python：爬虫练习爬取小说(初学)

用Python爬取某网站小说

python 爬取小说网站实战

Python爬取小说网站

python 爬取小说

Python爬取小说

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)