20行python代码——爬取知乎神回复

其他 2020-04-18 15:51:47 阅读次数: 0

知乎简单爬虫代码

简单思路

1、集成BeautifulSoup

2、用urllib.request解析 url

3、用bs4解析

4、soup.findAll找出某一类class

5、对该类别中的标签进行解析

import time
import urllib.request
from bs4 import BeautifulSoup

for p in range(1, 76):
    url = "http://www.zhihu.com/collection/27109279?page=" + str(p)
    page = urllib.request.urlopen(url)
    soup = BeautifulSoup(page, 'html.parser')  # 使用html解析器进行解析
    allp = soup.findAll(class_='zm-item')
    print('                                 第' + str(p) + '页\n')
    for each in allp:
        answer = each.findNext(class_='zh-summary summary clearfix')
        answer = answer.text.replace('显示全部', '')
        answer = answer.replace('\n', '')
        if len(answer) > 200:
            continue
        problem = each.findNext(class_='zm-item-title')
        print(str(allp.index(each) + 1) + '、问题： ' + problem.text)
        print('   神回：' + answer)
    time.sleep(5)

源码下载请点击：20行python代码爬取知乎

爬取的神回复内容非常搞笑：一起笑一笑

抓数据、处理数据、分析数据

发布了16 篇原创文章 · 获赞 9 · 访问量 7139

私信关注

猜你喜欢

转载自blog.csdn.net/qq_30803353/article/details/78415475

20行python代码——爬取知乎神回复

如何用 60 行代码爬取知乎神回复？

【Python数据分析】简单爬虫，爬取知乎神回复

知乎神回复

python爬了下知乎1000赞+的神回复，笑死人了~

python实战1.0——爬取知乎某问题下的回复

Python爬虫--爬取知乎

Python爬取知乎上的图片

Python爬取知乎文章（一）

python 爬取知乎图片

用python爬取知乎问答

知乎上的那些神回复

【python实现网络爬虫20】知乎热榜爬取

大神用爬虫爬了下知乎上超级搞笑的神回复，笑死个人~

知乎live爬取

scrapy爬取知乎

利用python实现20行代码爬取《完美世界》

Python爬取知乎专栏文章标题及URL

python爬取知乎（模拟登陆）

爬取知乎Python中文社区信息

python requests 爬取知乎用户信息

Python知乎热门话题数据的爬取实战

python：知乎发现页的爬取（问题，作者，回答）

python3 爬取知乎模拟登录

Python实现爬取知乎热榜

Python知乎热门话题爬取

Python爬虫对知乎问题下的图片进行爬取

Python爬取知乎单个问题下的回答

python爬虫7---爬取知乎文章

Python爬取知乎专栏文章并生成PDF

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)