微博数据挖掘

选取微博关于比特币的话题,从爬虫,清洗,到分析一体化的数据解决方案,从混乱的数据到隐晦的信息,最后成为金字塔顶端的知识,是如何华丽转身?从比特币暴涨,到迅速下跌,在到触底不反弹,这个过程人们最爱讨论写什么呢?人们的心态又如何?回顾历史,我们又能学到些什么?这一切都在数据矿山中,我们一起去挖掘。

本次 Chat 您将学会以下小技巧:

  1. 简单的社会媒体爬虫;
  2. 对中文文本进行分词处理;
  3. 过滤通用词并统计词频;
  4. 分析词频绘制统计图和炫酷云图;
  5. 规范化时间序列并进行重采样分析。

最后说明,本场 Chat 代码完整,运行流畅,数据齐全,门槛较低,适合小白入门数据行业的首选。

阅读全文: http://gitbook.cn/gitchat/activity/5c394dcb21da07194d35c1e8

一场场看太麻烦?成为 GitChat 会员,畅享 1000+ 场 Chat !点击查看

猜你喜欢

转载自blog.csdn.net/valada/article/details/86443531
今日推荐