【Mark Schmidt课件】机器学习与数据挖掘——数据探索

本课件的主要内容包括:

  1. 数据挖掘:鸟瞰视图;

  2. 数据挖掘:一些典型的处理步骤

  3. 什么是数据?

  4. 数据类型

  5. 数据清理

  6. 特征聚合

  7. 特征选择

  8. 特征转换

  9. 探索性数据分析

  10. 分类汇总统计

  11. 连续汇总统计

  12. 距离与相似度

  13. 汇总统计的局限性

  14. 可视化

  15. 基本绘图

  16. 直方图

  17. 箱形图

  18. 散点图

  19. 散点图阵列

  20. 等值线绘图

  21. 树形图

  22. 统计地图

  23. 流图

  24. 视频与交互可视化

  25. 熵作为随机性的量度

  26. Hamming距离 vs. Jaccard系数

  27. 大数据集与并行/分布式计算

  28. 数据清理与杜克癌症丑闻

关于“杜克癌症丑闻”是美国杜克大学的医生恶意篡改实验数据导致的学术界造假丑闻,从2006年持续到2012年。

更详细的事件经过请查看以下网站:http://bbs.tianya.cn/post-100-1137194-1.shtml

在这里插入图片描述

在这里插入图片描述

英文原文课件下载地址:

http://page2.dfpan.com/fs/9l8c8jd262f1f2c9163/

更多精彩文章请关注微信号:在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/weixin_42825609/article/details/83068238
今日推荐