36行代码爬取微博热搜榜和要闻榜 - 代码天地

36行代码爬取微博热搜榜和要闻榜

其他 2020-09-10 10:13:23 阅读次数: 0

import requests
from bs4 import BeautifulSoup
import time
from urllib import parse

headers = {
    'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_6) AppleWebKit/537.36 (KHTML, like Gecko) '
                  'Chrome/85.0.4183.83 Safari/537.36 '
}

def text(url):
    html = requests.get(url, headers=headers)
    if html.status_code == 200:
        print('成功')
        parse_html(html.text)
    else:
        print('失败')

def parse_html(html):
    soup = BeautifulSoup(html,'lxml')
    hot = soup.select('table tbody tr')
    for i in hot:
        title = i.select_one('td a').text
        url = i.select_one('td a')['href']
        print(title,url)
        url = parse.urljoin('https://www.weibo.com',url)
        print(url)
        
if __name__ == '__main__':
    start = time.time()
    url = 'https://s.weibo.com/top/summary?Refer=top_hot&topnav=1&wvr=6'
    text(url=url)
    url2 = 'https://s.weibo.com/top/summary?cate=socialevent'
    text(url = url2)
    time = time.time() - start
    print(time)

同步爬取

猜你喜欢

转载自blog.csdn.net/weixin_43554217/article/details/108442735

36行代码爬取微博热搜榜和要闻榜

爬取微博热搜榜

java爬虫爬取微博热搜榜

Python爬取新浪微博热搜榜

爬取微博热搜排行榜

利用python爬取微博热搜榜制作词云图

python爬虫爬取微博知乎热搜榜

微博发布公告：加大力度处理热搜榜刷榜行

微博热搜榜前20信息数据爬取进行数据分析与可视化

微博热搜排行榜前十

Python爬虫抓取微博热搜榜

1-打印微博热搜榜

Api-微博热搜榜免费接口

爬取百度热搜榜

爬取搜狗热搜榜前十

使用Python爬取百度热搜榜

使用2句python代码获取微博热搜榜表格版

知乎热榜？微博热门？爬！

Python|30行代码实现微博热榜爬虫（及可视化进阶）

python爬虫知乎热榜、微博热搜并发送邮件至邮箱

Python网络爬虫-爬取微博热搜

Python网络爬虫之爬取微博热搜

webMagic入门案例 -- 爬取微博热搜

爬取微博热搜Top25的数据

用python爬取微博热搜数据并保存

使用requests库和re库爬取微博热搜前十榜单

网络热点微博热门话题榜热搜榜网络互动问答平台推广营销

怎样快速获取新浪微博热搜榜排名数据？

国内程序员这次牛逼了，「微博热搜」「GitHub 」双双霸榜了

“比特币”现位于微博热搜榜第10位

今日推荐

技术解析 GPT-4o：即时语音交互的突破与 GenAI 发展策略

开源大模型与闭源大模型

微信小程序授权登录获取用户的openid

亿级流量系统架构设计与实战

人工智能时代的程序设计教学与课程设计

纽交所技术问题致伯克希尔 (BRK.A) 显示跌近 100%

探索 api.maynor1024.live：一站式 AI 服务平台

AI一键去衣技术：窥见深度学习在图像处理领域的革命(最后有彩蛋)

艾体宝案例 | 使用Redis和Spring Ai构建rag应用程序

Apple M1 vs 高通8Gen2 vs Apple A12Z各方面比较

【升职加薪必备架构图】Springboot学习路线汇总_springboot四层架构流程图

与Apollo共创生态：Apollo7周年大会自动驾驶生态利剑出鞘

周排行

面试爱奇艺，竟然挂在第5轮……

scala方法和函数的区别

NYIST--2018大一新生第一次周赛题解

java如何通过client客戶端http实现get/ post请求传递json参数到restful 服务接口

RabbitMQ 队列类型

2018-2019-1 20165311 20165329 20165334 实验一开发环境的熟悉

iOS打包工具配置相应的文件路径一键打包到指定位置

【每日一题】替换空格

【转载】FPGA配置方式

旅行青蛙

每日归档

更多

2024-06-03(52)

2024-06-02(4)

2024-06-01(60)

2024-05-31(47)

2024-05-30(4)

2024-05-29(65)

2024-05-28(2)

2024-05-27(56)

2024-05-26(6)

2024-05-25(68)