社交网站的数据挖掘与分析(高清版)PDF

社交网站的数据挖掘与分析(高清版)PDF
百度网盘
链接:https://pan.baidu.com/s/1ia57ZMxvdTtq7eragsITzg
提取码:5hth
复制这段内容后打开百度网盘手机App,操作更方便哦
内容简介 · · · · · ·
Facebook、Twitter和LinkedIn产生了大量宝贵的社交数据,但是你怎样才能找出谁通过社交媒介正在进行联系?他们在讨论些什么?或者他们在哪儿?这本简洁而且具有可操作性的书将揭示如何回答这些问题甚至更多的问题。你将学到如何组合社交网络数据、分析技术,如何通过可视化帮助你找到你一直在社交世界中寻找的内容,以及你闻所未闻的有用信息。
每个独立的章节介绍了在社交网络的不同领域挖掘数据的技术,这些领域包括博客和电子邮件。你所需要具备的就是一定的编程经验和学习基本的Python工具的意愿。
•获得对社交网络世界的直观认识
•使用GitHub上灵活的脚本来获取从诸如Twitter、Facebook和LinkedIn之类的社交网络API中的数据
•学习如何应用便捷的Python工具来交叉分析你所收集的数据
•通过XHTML朋友圈探讨基于微格式的社交联系
•应用诸如TF-IDF、余弦相似性、搭配分析、文档摘要、派系检测之类的先进挖掘技术
•通过基于HTML5和JavaScript工具包的网络技术建立交互式可视化
目录 · · · · · ·
前言1
第1章绪论:Twitter 数据的处理9
Python 开发工具的安装9
Twitter 数据的收集和处理11
小结24
第2章微格式:语义标记和常识碰撞26
XFN 和朋友27
使用XFN 来探讨社交关系29
地理坐标:兴趣爱好的共同主线37
(以健康的名义)对菜谱进行交叉分析41
对餐厅评论的搜集43
小结45
第3章邮箱:虽然老套却很好用47
mbox:Unix 的入门级邮箱48
mbox+CouchDB= 随意的Email 分析54
将对话线程化到一起70
使用SIMILE Timeline 将邮件“事件”可视化79
分析你自己的邮件数据82
小结84
第4章Twitter :朋友、关注者和Setwise 操作85
REST 风格的和OAuth-Cladded API86
干练而中肯的数据采集器90
友谊图的构建108
小结116
第5章Twitter:tweet ,所有的tweet ,只有tweet 118
笔PK 剑:和tweet PK 机枪(?!?)118
对tweet 的分析(每次一个实体)121
并置潜在的社交网站(或#JustinBieber VS #TeaParty)144
对大量tweet 的可视化155
社交网站的数据挖掘与分析(高清版)PDF

猜你喜欢

转载自blog.51cto.com/12650227/2331455
今日推荐