爬取贴吧热议榜 - 代码天地

爬取贴吧热议榜

其他 2020-03-19 15:50:53 阅读次数: 0

import requests
from bs4 import BeautifulSoup
import pandas as pd
titles=[]
hots=[]
url='http://tieba.baidu.com/hottopic/browse/topicList?res_type=1&red_tag=l2774431756'
headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.3; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko)Chrome/69.0.3497.100 Safari/537.36'}
r=requests.get(url)
r.raise_for_status()
r.encoding = r.apparent_encoding
html = r.text
table = BeautifulSoup(html,"html.parser").find("table")
soup=BeautifulSoup(html,'lxml')
for m in soup.find_all(class_="topic-text"):
    titles.append(m.get_text().strip())
for n in soup.find_all(class_="topic-num"):
    hots.append(n.get_text().strip())
final=[titles,hots]
print(final)
s=pd.DataFrame(final,index=["标题","内容数"])
print(s.T)

　　

猜你喜欢

转载自www.cnblogs.com/tzq-0716/p/12524668.html

爬取贴吧热议榜

爬取百度贴吧热议榜

爬取贴吧

贴吧爬取

爬取贴吧页面

爬取贴吧图片

爬取贴吧数据

用python爬取贴吧数据

Python实现爬取贴吧图片

爬取贴吧小项目

简单的爬取贴吧案例

urllib:爬取贴吧静态数据

爬虫Spider--爬取贴吧

python爬取贴吧图片

爬虫（四）：简单爬取贴吧

爬取百度热议榜单

爬取知乎热榜

爬取百度热榜

爬取微博热搜榜

python：爬取贴吧的某个吧的网页信息

1.4举个栗子——爬起lol贴吧网页源码（可以修改爬取贴吧名字）

Python爬取贴吧内容-南华大学贴吧为例

利用爬虫爬取百度贴吧内容

python爬虫四：爬取贴吧数据

ulrlib案例-爬取百度贴吧

urllib爬取百度贴吧贴子页面

python爬取百度贴吧张国荣图片

python爬虫爬取百度贴吧图片

用Python 爬虫爬取贴吧图片

Python爬取百度贴吧图片

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

基本数据类型封装类比较 Java源码解读(一) 8种基本类型对应的封装类型

JS实现无缝滚动上

深入解析HashMap原理（基于JDK1.8）

mysql的连接池

关于.htc

linux下的ubuntu12.04图形界面

【数论】好推不好记的扩展欧几里德

设备树详解

cscope + tags 简单设置

xml学习

每日归档

更多

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)