选取微博关于比特币的话题,从爬虫,清洗,到分析一体化的数据解决方案,从混乱的数据到隐晦的信息,最后成为金字塔顶端的知识,是如何华丽转身?从比特币暴涨,到迅速下跌,在到触底不反弹,这个过程人们最爱讨论写什么呢?人们的心态又如何?回顾历史,我们又能学到些什么?这一切都在数据矿山中,我们一起去挖掘。
本次 Chat 您将学会以下小技巧:
- 简单的社会媒体爬虫;
- 对中文文本进行分词处理;
- 过滤通用词并统计词频;
- 分析词频绘制统计图和炫酷云图;
- 规范化时间序列并进行重采样分析。
最后说明,本场 Chat 代码完整,运行流畅,数据齐全,门槛较低,适合小白入门数据行业的首选。
阅读全文: http://gitbook.cn/gitchat/activity/5c394dcb21da07194d35c1e8
一场场看太麻烦?成为 GitChat 会员,畅享 1000+ 场 Chat !点击查看