拥有这十个资源,2020年成为一名优秀的数据科学家吧!

全文共3412字,预计学习时长10分钟

来源:Pexels

我读的是机械专业,大学后成为了一名机械工程师。我的职业生涯始于钢铁行业的一份核心工作。

戴着那些沉重的钢制胶靴和塑料头盔,在大型高炉和轧钢厂里工作。这些安全措施也只是些心理安慰,因为我知道如果发生了什么不好的事情,它们都没有用。也许跑鞋能帮上忙。至于头盔,我只想说钢水在1370摄氏度下就会化为灰烬。

随着我对这份工作恐惧渐深,我意识到这份工作不适合我,所以我制定了一个目标,大概在2011年进入分析和数据科学领域。从那时起,慕课就成了我学习新知识的首选平台,通过它我收获了很多新知识。好的也有和坏的也有。

如今,到了2020年,数据科学领域的日新月异,不会缺少学习数据科学的资源。但这也常常给初学者带来问题:从哪里开始学习?学习什么?互联网上有很多优质资源,但与此同时也有很多不好的资源。

过多选择反而让人们停滞不前,因为因为焦虑是学习的大敌。

施瓦茨(Schwartz)在其著作《选择的悖论——为什么更多反而是更少》中提出,减少消费者的选择可以大大减少他们的焦虑。数据科学课程也是如此。

这篇文章为迷失的学习者们提供建议,推荐一些数据科学之旅的起始点。

1)Python3编程专业化

Python2.7的“Goodbye World”!

首先,你需要确定一门编程语言。这是密歇根大学的专业课,你可以学习使用Python和自己创造新事物。

你将学习变量、条件和循环等编程基础知识,并获得一些中间材料,如关键字参数、列表理解、lambda表达式和类继承。

2)Python应用数据科学

先做,后理解

在充分理解机器学习之前,我们需要先体验一下它。

Python在应用数据科学方面为你介绍了许多应该了解的现代机器学习方法。不是彻底的磨合,但你会得到建立你的模型的工具。

这种基于技能的专业化面向具有基本python或编程背景,并希望通过流行的python工具包(如pandas、matplotlib、scikitlearn、nltk和networkx)进行应用统计、机器学习、信息可视化、文本分析和社交网络分析技术的学习者,以深入了解他们的数据。

3) 机器学习理论与基础

来源:Pexels

完成以上课程后,你就成为了所谓的“初学者”。

恭喜!!!你已经了解了一些基本概念,也知道怎么去实现一些功能了。

你是有价值的

然而,你并没有完全理解这些模型背后的所有数学原理和模型。

你需要了解clf.fit背后的逻辑。你要面对现实:除非你了解模型背后的数学原理,否则没人会真正认可你。

如果你不明白,就无法改进它

GameChanger机器学习课程包含了许多机器学习算法背后的数学逻辑。

我将把这门课当作一门必修课,因为正是这门课程激励我进入这个领域,而吴恩达是一位伟大的导师,这是我学习的第一门课程。

这门课程包含了回归,分类,异常检测,推荐系统,神经网络,还有很多很棒的建议。

4) 学习统计推断

“事实是固定的,但统计数字是灵活的。”——马克·吐温

我的导师切蒂卡娅·伦德尔(Çetinkaya-Rundel)教授这门推理统计学,它简单易学。

她是一位优秀的讲师,很好地解释了统计推断的基本原理——这是一门必修课。

你将学习假设检验、置信区间以及数值和分类数据的统计推断方法。

5) 学习数据科学的SQL基础知识

SQL是所有数据ETL的核心

虽然我们觉得通过创建模型和提出不同的假设可以完成更多的工作,但数据咀嚼的作用是不可低估的。

而且随着SQL在ETL和数据准备任务中的广泛应用,每个人都应对其有些许了解,因为它至少是有用的。

SQL也已经成为使用ApacheSpark等大数据工具的事实标准。这个UCDavis的SQL专门化课程将教你SQL以及如何使用SQL进行分布式计算。

通过使用数据科学应用程序的四个逐步增加难度的SQL项目,你将了解诸如SQL基础知识、数据争用、SQL分析、AB测试、使用ApacheSpark的分布式计算等主题。

6) 高级机器学习

在大联盟里,没有填鸭式灌输。

你可能不同意,但到目前为止,我们所做的一切都是骗人的。材料有固定的结构的,数学原理很少说明。但你已经为下一步做好了准备。这种高级机器学习专业化由顶级Kaggle机器学习实践者和欧洲核子研究中心的科学家采用了另一种学习方法,通过经历许多困难的概念,并指导您了解过去的事情是如何工作的,以及机器学习世界中最新的进步。网站上的描述是:

该专业介绍了深度学习、强化学习、自然语言理解、计算机视觉和贝叶斯方法。顶级Kaggle机器学习实践者和CERN科学家将分享他们解决现实世界问题的经验,并帮助你填补理论和实践之间的空白。

7) 深度学习

来源:Pexels

深度学习乃未来大势所趋

吴恩达带着全新的深度学习专业再次回归。

他以一种通俗易懂的方式完成了对这个困难概念的理解。他所遵循的术语与网络上所有其他教程和课程都不一样,我希望它能流行起来,因为这对理解所有基本概念非常有帮助。

专业网站上有说:

了解深层学习的基础,了解如何构建神经网络,并学习如何领导成功的机器学习项目。你将了解卷积网络、RNNs、LSTM、Adam、Dropout、BatchNorm、Xavier/He初始化等。且能接触医疗保健、自动驾驶、手语阅读、音乐生成和自然语言处理等方面的案例研究。

8) Pytorch

PythononFire

我通常从不提倡学习工具,但这不一样,因为如果你了解Pythorch,你便能够在许多最近的研究论文中学习代码,这真的很难得。Pythorch已经成为从事深度学习的研究人员的默认编程语言,它会对我们的学习极有帮助。

学习Pythorch的一种结构化方法是使用Pythorch学习深神经网络课程。课程网站说明:

课程将从Pytorch的张量和自动微分包开始。然后每个部分将涵盖不同的模型,从基本原理开始,如线性回归和logistic/softmax回归。其次是前馈型深层神经网络,作用不同的激活函数,归一化层和脱落层。然后介绍卷积神经网络和转移学习。最后,还将介绍其他一些深度学习方法。

9) AWS机器学习入门

秘诀:不是你知道什么,而是你展示什么。

在构建一个伟大的机器学习系统时,有很多事情需要考虑。但作为数据科学家,我们常常只担心项目的某些部分。

但我们有没有想过,一旦我们拥有了模型,要如何部署它们呢?

我见过很多ML项目,其中很多项目注定要失败,因为它们从一开始就没有一个固定的生产计划。

拥有一个好的平台,并了解该平台如何部署机器学习应用程序,将在现实世界中发挥所有作用。这门关于实现机器学习应用程序的AWS的课程就承诺了这一点。

本课程将教你:

1.如何使用带有内置算法和Jupyter笔记本实例的AmazonSageMaker构建、培训和部署模型。

2.如何使用Amazon-AI服务构建智能应用程序,如Amazon-Comprehend、Amazon-Rekognition、Amazon-Translate等。

10) 数据结构和算法

来源:Pexels

算法。是的,你需要它们。

算法和数据结构是数据科学的组成部分。虽然大多数的数据科学家在学习的时候并没有学习一门正确的算法课程,但它们是必不可少的。

许多公司要求将数据结构和算法作为招聘数据科学家面试内容的一部分。

它们需要和你的数据科学访谈一样的热情去破解,因此,你可能需要一些时间来研究算法、数据结构和算法问题。

我认为学习算法的一个最佳资源是UCSanDiego在Coursera上的算法专项课程。专业网站显示:

你将学习解决各种计算问题的算法技术,并将使用选择的编程语言实现大约100个算法编码问题。没有任何一门其他的在线算法课程能让你在下一次面试中有如此丰富的面临编程挑战经验。

希望你有所收获~

留言 点赞 关注

我们一起分享AI学习与发展的干货
欢迎关注全平台AI垂类自媒体 “读芯术”

(添加小编微信:dxsxbb,加入读者圈,一起讨论最新鲜的人工智能科技哦~)

发布了817 篇原创文章 · 获赞 2763 · 访问量 45万+

猜你喜欢

转载自blog.csdn.net/duxinshuxiaobian/article/details/104515083