python虫虫（平凡之路） - 代码天地

python虫虫（平凡之路）

其他 2018-09-02 22:36:43 阅读次数: 0

爬取单一网页上的内容，并保存到txt文档内，以小说排行榜首页为例：

import requests
import time
import re

url = 'http://top.baidu.com/buzz/book.html'
res = requests.get(url)
res.encoding = 'gb2312'
kk = '<a class=".*?" target=".*?" href="(.*?)" href_top=".*?">(.*?)</a>'
url_list = re.findall(kk, res.text)
for i in range(len(url_list)):
    with open('D:\\***\\***.txt', 'a') as f:
        f.write(str(i+1) + '、' + str(url_list[i]) + '\n')
        print('{}.{}\t'.format(i, url_list[i]))
        time.sleep(1)

这里通过正则来选取了百度链接以及小说的名字，在写入txt文档里面的时候加入了排名序号。

我曾经跨过山和大海，也穿过人山人海，我曾经拥有着的一切，转眼都飘散如烟，我曾经失落失望失掉所有方向，直到看见平凡才是唯一的答案。
——韩寒《平凡之路》

猜你喜欢

转载自blog.csdn.net/shangxiaqiusuo1/article/details/80961335

python虫虫（平凡之路）

Python的平凡之路（20） Python的平凡之路（20）

平凡之路

不平凡之路——Python转义符序列

平凡之路，我的路，

python虫虫BeautifulSoup与re的比较（通过实战）

python虫虫（抖音歌曲大全）

善良之光，平凡之路——INFJ成长之路

【小说】平凡之路 **年**月**日完成

我的平凡秋招-春招之路

平凡之路——关于代码世界的构建 2018.5

字节跳动不平凡的崛起之路

平凡

虫虫钢琴好音乐

平凡且不平凡

三十二、新人成才之路《职场新人从平凡到卓越》

张小贤的平凡之路---机器学习之神经网络---周志华《机器学习》

张小贤的平凡之路---机器学习之PCA降维---周志华《机器学习》

一个平凡计算机爱好者的linux进步之路

平凡的2017

什么是平凡

平凡的世界

《平凡的世界》

python之路

python之路！

使用 VMware 装一个 fedora 虚拟机并设置共享文件夹的平凡之路…

python系列之（4）豆瓣图书《平凡的世界》书评及情感分析

平凡的Python为什么能一跃成为世界排名第一的语言

Python之路--Python基础

甘于平凡而不甘于平凡的腐烂——《平凡的世界》所感

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)