Python爬虫练习二：爬取笔趣阁小说 - 代码天地

Python爬虫练习二：爬取笔趣阁小说

其他 2018-05-30 22:07:20 阅读次数: 0

爬取这个小说网站真的很EASY！很有成就感~适合爬虫的初学者！

以一个叫《凡人修仙传仙剑篇》的小说作为目标进行爬取测试。

废话不多说，上代码！

import requests
from bs4 import BeautifulSoup
aimurl="http://www.biquge.com.tw/18_18998/"#爬虫目标网址
url="http://www.biquge.com.tw"#href前面的内容
#输入网址 获得网页的soup
def getsoup(url):
   res=requests.get(url) #以get方法访问目标网址获取网页信息
   res.encoding= 'gb2312'#该网页是以gb2312的编码形式显示的
   soup=BeautifulSoup(res.text, 'html.parser')#使用美丽汤解析网页内容
   return soup

soup=getsoup(aimurl)

chapterlist=[]#存放章节的url
chaptertextlist=[]#存放章节标题
for i in soup.select('.box_con #list a'):
    chapterlist.append(url+i['href'])
    chaptertextlist.append(i.text)
#分析章节内容，并写入txt文本
for i,j in zip(chapterlist,chaptertextlist):
    tempsoup = getsoup(i)
    temptext=tempsoup.select('#content')[0].text#正文内容在属性content下   class用.xx  属性＃
    path=r'E:\fanren.txt'
    with open(path,'a',encoding='utf-8') as f:
        f.write(j+'\n'+temptext+'\n')

没有太多要说明的，通过更改aimurl基本可以实现爬取该小说网站的任何一部小说。

猜你喜欢

转载自blog.csdn.net/weixin_41710905/article/details/80501892

Python爬虫练习二：爬取笔趣阁小说

python爬虫--小说爬取--笔趣阁篇

Python 爬取笔趣阁小说

python爬取笔趣阁小说

Python爬虫——从笔趣阁爬小说

爬虫练习——爬取笔趣阁

学习笔记（爬虫）：爬取笔趣阁小说

java爬虫爬取笔趣阁小说

python3.6.5爬虫之一：笔趣阁小说爬取（首页爬取法）

用Python实现笔趣阁小说爬取

python3.6.5爬虫之四：多线程同时爬取笔趣阁小说

笔趣阁的小说爬取

爬取笔趣阁小说

scrapycrawl 爬取笔趣阁小说

爬取笔趣阁网站小说

Python爬取新笔趣阁小说

python爬取书趣阁小说

python应用：爬虫框架Scrapy系统学习第四篇——scrapy爬取笔趣阁小说

爬虫学习：request+xpath爬取笔趣阁小说

学习笔记（爬虫）：爬取笔趣阁剑来小说

爬虫初学（一）：爬取笔趣阁小说（萌新用-详细讲解）

爬取笔趣阁小说（一念永恒）

用Scrapy爬取笔趣阁小说

Python3中BeautifulSoup爬取笔趣阁小说网

Python BeautifulSoup 爬取笔趣阁所有的小说

python爬取笔趣阁小说（TK可视化）

通过python爬取笔趣阁小说，获取图片保存本地，数据保存mysql

用Python实现笔趣阁小说爬取 GUI版

笔趣阁小说 python3爬虫实例

Python笔记（五） --写一个爬虫对新笔趣阁的小说进行爬取

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)