【自研项目】一次发帖引发的思考,用户行为分析

因为某个话题在网上引发围观,看到如此火爆,就想把数据拿下来做分析。

第一天搞定抓包,工具选择、工具使用和简单的调试。

克服困难:网络代理配置

输出工具:花瓶、安卓模拟器

第二天搞定采集,数据异常值处理

克服困难:json嵌套解析

输出文档:多个excel文档

扫描二维码关注公众号,回复: 11335775 查看本文章

第三天搞定数据分析,分析数据指标

克服困难:map、apply、lambda得函数使用

输出文档:pandas.DataFrame

第四天搞定出图,主要有pyecharts、bokeh、matplotlib

克服困难:调参、数据格式等

输出文档:png、html

第五天优化,主要有作图风格,补充指标【语义情感分析】

克服困难:命名规范、调用腾讯云,情感分析接口调试

输出文档:前面所有文档大更新

输出成果如下:

这是本人完整记录自研过程,最晚做到凌晨1点,每天除了日常生活,几乎全部投入精力。

猜你喜欢

转载自www.cnblogs.com/hightech/p/13173485.html