如何学习数据挖掘和数据科学的7个步骤

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/sty945/article/details/79832045

前言

最近一直一再学习数据挖掘的相关知识,这是一篇国外的文章,我添加了自己的一些理解,大概的翻译过来,供大家一起学习参考。

概括

  1. 语言:学习R,Python和SQL
  2. 工具:了解如何使用数据挖掘和可视化工具
  3. 教科书:阅读入门教科书以了解基本原理
  4. 教育:观看网络研讨会,参加课程并考虑证书或数据科学学位
  5. 数据:检查可用的数据资源并在那里找到
  6. 比赛:参加数据挖掘比赛
  7. 通过社交网络,团体和会议与其他数据科学家进行交流

1 学习语言

现用于数据挖掘的最流行的语言是R,Python和SQL。
每种资源都有很多

2 工具:数据挖掘,数据科学和可视化软件

对于不同的任务有许多数据挖掘工具 ,但最好使用支持整个数据分析过程的数据挖掘套件进行学习。

您可以从开源(免费)工具开始,如KNIMERapidMinerWeka

但是,对于许多分析工作,您需要了解SAS ,这是领先的商业工具并得到广泛应用。

其他流行的分析和数据挖掘软件包括MATLAB,StatSoft STATISTICA,Microsoft SQL Server,Tableau,IBM SPSS Modeler和Rattle。

可视化是任何数据分析的重要组成部分 - 了解如何使用Microsoft Excel(适用于许多更简单的任务), R图形 (特别是ggplot2 )以及Tableau - 一个用于可视化的出色软件包。 其他好的可视化工具包括TIBCO Spotfire和Miner3D。
国内百度的Echarts也是相当好用的

3 教科书

有许多数据挖掘和数据科学教科书可用,但你可以检查这些

4 教育:网络研讨会,课程,证书和学位

您可以从关于分析,大数据,数据挖掘和数据科学领域最新主题的许多免费网络研讨会和网络直播开始。

也有很多在线课程,其中很多都是免费的 - 请参阅KDnuggets在线教育目录

特别检查这些课程:

最后,考虑在数据挖掘,数据科学或高级学位获得证书 ,例如数据科学中的MS - 请参阅KDnuggets目录中的教育分析,数据挖掘和数据科学 。

5 数据

你需要分析数据 - 请参阅数据挖掘的数据集的 KDnuggets目录,其中包括

6 比赛

再一次,你最好通过练习来学习,所以参加Kaggle比赛 - 从初学者比赛开始,比如使用机器学习预测泰坦尼克号生存

7 互动:会议,团体和社交网络

您可以加入许多同行组 - 查看前30名LinkedIn分组,大数据,数据挖掘和数据科学组

AnalyticBridge是分析和数据科学的活跃社区。

您可以参加关于分析,大数据,数据挖掘,数据科学和知识发现的众多会议和会议

另外,考虑加入组织年度KDD会议 - 领域领先的研究会议的ACM SIGKDD 。

more


原文链接
这里跳转

转载请注明出处:
CSDN:楼上小宇__home:http://blog.csdn.net/sty945
简书:楼上小宇:http://www.jianshu.com/u/1621b29625df

猜你喜欢

转载自blog.csdn.net/sty945/article/details/79832045
今日推荐