python爬取微博热题-官宣赵丽颖并做词云分析 - 代码天地

python爬取微博热题-官宣赵丽颖并做词云分析

其他 2018-10-21 14:11:31 阅读次数: 0

来来来，看一下今天的头条新闻，接下来我们来python以下到底发生了什么情况，毕竟我虽然不关注这些，但是一早上被很多人通知，并且报以不友好的评价。通过python去爬该条微博的评论，并做分词，且做词云分析：

###部分代码


import requests,json,re


def get_comment():
    headers = {
           'Cookies':'_T_WM=cf11b1dea37c9289ed064f8059b35d3d; SCF=Ai8Ki_8XZFpkUIS91rKFntgL-MmbDkbYxignZAs0XqMN-LtWo9nbpVLp-TbiiyWu3WD0hShJb4u33VG5ltISuD4.; SUB=_2A252wQgFDeRhGeBL71EV-C3JzzuIHXVSTahNrDV6PUJbkdBeLWLVkW1NRxtPax6yparr4gNIxExtsJOQF0Y7BP-s; SUHB=079j6k0Kc9u8Zb; SSOLoginState=1539668053; MLOGIN=1; M_WEIBOCN_PARAMS=oid%3D4295689414745032%26lfid%3D4295689414745032%26luicode%3D20000174; WEIBOCN_FROM=1110106030',
           'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.100 Safari/537.36'
           }
    #url = 'https://m.weibo.cn/api/comments/show?id=4295689414745032&page=1'
    for i in range (0,101):
        url_comment = 'https://m.weibo.cn/api/comments/show?id=4295689414745032&page=%d'%(i)
        wb_data = requests.get(url_comment,headers=headers).text
        data_comment = json.loads(wb_data)
       # print(data_comment)
        data = data_comment['data']
        for a in data['data']:
            print(re.sub('<[^>]*>', '',a['text']))


def main():
    get_comment()


if __name__ == '__main__':
    main()

最后的结果还是很好的

猜你喜欢

转载自blog.csdn.net/OYY_90/article/details/83096593

python爬取微博热题-官宣赵丽颖并做词云分析

冯绍峰赵丽颖官宣结婚，微博瘫痪，微博技术专家如何应对？

盘点赵丽颖和冯绍峰官宣引爆微博，你不知道的那些事！

NO.16——Pathon爬取杨超越新浪微博数据做词云分析

赵丽颖冯绍峰官宣结婚，区块链+结婚证未来应用

威猛“官宣体”，比赵丽颖冯绍峰官宣更有爆炸力，震惊..

python爬取美团评论做词云分析

赵丽颖官宣后，程序员聊天记录流出，看完原谅笑出猪声

因赵丽颖结婚，微博工程师受到的高并发挑战

向娱乐圈看齐，Python爬取微博评论并制作酷炫的词云！

Python爬取微博评论并制作酷炫的词云！

Python网络爬虫-爬取微博热搜

Python网络爬虫之爬取微博热搜

Python爬取新浪微博热搜榜

用python爬取微博热搜数据并保存

Python爬取网易云歌曲评论，做词云分析

爬虫小案例爬取百度贴吧赵丽颖图片案例 xpath 美丽汤

爬取微博热搜榜

python小白也可以分分钟爬取微博数据，并生成有个性的词云，你get到了吗？

Python实现爬取马云的微博

赵丽颖冯绍峰结婚微博照例崩溃,论IPFS网络如何支持800个明星并发出轨

爬取微博热搜榜单存入mysql并部署在云服务器上

爬取微博热搜数据进行数据分析与可视化处理

分析Ajax并爬取微博列表

简单微博爬取以及分析

tensorflow目标检测--识别赵丽颖

python 爬取微博实时热搜，并存入数据库实例

利用python爬取微博热搜榜制作词云图

Python定时爬虫爬取微博热搜数据 pyecharts动态图展示

python爬虫爬取微博知乎热搜榜

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)