python爬虫——爬取抽屉新热榜

其他 2018-08-18 04:00:22 阅读次数: 0

爬取抽屉新热榜

爬取段子

抽屉网址https://dig.chouti.com/r/scoff/hot/
这里写图片描述
爬虫的常规操作，根据需求进行分析。我们要爬取段子，也就是每条段子信息。先按F12查看一下网页，审查元素。

我们刚好找到段子信息，看看其他段子是不是也在这个位置。我们发现了25条一样的标签。每条标签下都有段子信息，刚好和这页的25条信息相对应。

这里写图片描述
提取这些信息，我们同样使用BeautifulSoup。BeautifulSoup的用法我在另一篇文章中有所介绍BeautifulSoup用法

这是一页的信息，如何获取多页呢，看看第二页的网址。
这里写图片描述
再看看第三页的网址。

我们发现了规律，用表达式写出来
url = 'http://dig.chouti.com/r/scoff/hot/'+str(i)
这样就可以获取多页的段子信息了。

直接上代码

完整代码

import requests
from bs4 import BeautifulSoup

headers={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64; rv:58.0) Gecko/20100101 Firefox/58.0'}
for i in range(10):
    url = 'http://dig.chouti.com/r/scoff/hot/'+str(i)
    html=requests.get(url,headers=headers)
    html.encoding=html.apparent_encoding


    soup=BeautifulSoup(html.text,'html.parser')
    div=soup.find(id='content-list')
    div2=div.find_all('div',class_="item")


    for i in div2:
        a=i.find('div',class_="part2")
        b = a.get('share-title')
        print(b)
        with open('duanzi.txt','a',encoding='utf-8')as f:
            f.write(b)

猜你喜欢

转载自blog.csdn.net/qq_41251963/article/details/81710274

python爬虫——爬取抽屉新热榜

抽屉新热榜

Python爬取网易云音乐热歌榜（爬虫）

Python爬虫爬取猫眼电影热映口碑榜

scripy爬取给抽屉新热榜点赞

爬虫之抽屉新热榜点赞基本示例

爬虫案例：自动登录抽屉新热榜

python爬虫爬取bilibili新番榜

Python爬虫：爬取抽屉网

【python实现网络爬虫20】知乎热榜爬取

python爬虫爬取微博知乎热搜榜

python入门爬虫之爬取百度首页的热搜榜

python爬虫实战（2）——爬取知乎热榜内容

示例：自动登录抽屉新热榜

抽屉新热榜头部实现

java爬虫爬取微博热搜榜

爬虫---Beautiful Soup 爬取知乎热榜

爬取抽屉热搜榜文章

Python实现爬取知乎热榜

Python爬取新浪微博热搜榜

python爬取网易云热榜歌曲

python爬取知乎热榜Top50

python爬取知乎热榜了解时事

使用Python爬取百度热搜榜

Python爬虫以及数据可视化分析之某站热搜排行榜信息爬取分析

仿写抽屉新热榜 (html+css)

python爬虫爬取酷狗音乐排行榜

python爬虫七：爬取音乐V榜

python爬虫练习--爬取猫眼热映口碑榜

python爬虫 — 爬取豆瓣最受关注图书榜

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)