从零开始学习Python用于数据科学,Python比你想象的要强大!

为什么是Python?

Python是一种多用途的编程语言,广泛应用于数据科学,被称为本世纪最性感的工作。数据科学家通过大数据集挖掘,以获得洞察力并做出有意义的数据驱动决策。Python是一种通用的编程语言,用于Web开发、网络建设、科学计算等领域。我们将进一步讨论python中的一系列令人敬畏的库,例如用于数据操作和争论的numpy、ciply和大熊猫,以及用于数据可视化的matplotlib、seABON和bokeh。

不管你你用Python做什么,首先你必须要入门Python,所以小编准备了一份Python入门学习资料,进群:943752371即可获取!

从零开始学习Python用于数据科学,Python比你想象的要强大!

因此,Python&R只是用作数据科学的工具,但作为数据科学家,您需要更多地了解数据的统计和数学方面,而且除了所有方面之外,还必须具备良好的领域知识。

在我的这篇文章中,我将为用Python学习数据科学铺平道路,并将分享一些有用的资源来学习它。记住,数据科学的学习需要时间,不可能在一个月左右完成,它需要大量的实践、奉献和自信。所以永远不要放弃和快乐的学习。

步骤1:学习python的基础知识

Python是一种很容易开始使用的语言,但是掌握这些成语需要时间,就像任何其他语言一样。因此,作为新手,首先您需要了解语言的所有基础知识,一个良好的开端是遵循以下教程:

补习点

&

Google Python类

一旦完成了本教程,那么是时候迈出更大的一步,了解更复杂、更实时的python用法了,最好是少读一些书和博客文章:

书籍:

a)学习Python的硬道

b)用Python实现镗孔的自动化

博客:

a)前20位Python博客

b)我最喜欢的博客之一 : 丹巴德

第二步:基本统计与数学

强烈建议学习统计数据,并将重点放在编写示例上,最好是在Python或R.

最著名的是统计学习系列。这是一个很好的入门统计建模/机器学习与应用,在R.阅读ISLR之前,首先跳到ESLR。

(A)统计学习简介

b)统计学习的要素

如果你想要一件Python重的东西,请看这本书“思考统计”(ThinkStats)。

这是一个很好的MOOC来学习数据科学所需的基本统计数据:

— R专业化统计

利用这个可怕的可汗学院系列来复习你的高中统计和数学知识:

高中统计

步骤3:用于数据分析的Python

一旦你完成了第一步和第二步,那么是时候用一些真正的东西弄脏你的手了,首先你需要安装Anaconda

Anaconda下载

Anaconda的优势:

a)用户级安装所需的python版本

(B)能够完全独立于系统库或管理特权来安装/更新软件包

(C)附带Numpy、Sciy、PyQt、SpyderIDE等。或者在Minimal/alacarte版本(Miniconda)中,您可以在需要时安装您想要的东西。

这是Anaconda附带的工具:

a)木星笔记本IPython笔记本现在被称为木星笔记本。它是一个交互式的计算环境,在这个环境中,您可以将代码执行、富文本、数学、情节和丰富的媒体结合在一起。

您可以在本地使用此笔记本进行数据分析和绘图,并将数据可视化并最终共享。

  • 安装Anaconda之后,从终端打开IPython笔记本:

从零开始学习Python用于数据科学,Python比你想象的要强大!

  • 在默认浏览器中打开笔记本:

从零开始学习Python用于数据科学,Python比你想象的要强大!

  • 在笔记本单元格中执行Python代码

从零开始学习Python用于数据科学,Python比你想象的要强大!

(B)Numpy

NumPy是Python用于科学计算的基本包。除其他外,其中包括:

1)一个强大的N维数组对象。

2)精密(广播)功能

3)C/C+和Fortran代码集成工具

4)有用的线性代数、傅里叶变换和随机数能力

URL:Numpy

c)熊猫

熊猫是一个为Python编程语言编写的用于数据操作和分析的软件库。

查看我在那里的位置,获得关于Pandas的简单而简短的介绍。

URL:熊猫

书:用于数据分析的Python

d)Matplotlib

Matplotlib是一个Python2D绘图库,它以各种硬拷贝格式和跨平台交互环境生成出版物质量数字。Matplotlib可以用于Python脚本、Python和IPython shell、jupyter笔记本、Web应用服务器和四个图形用户界面工具包。

URL:Matplotlib

查看我的位置,获得关于matplotlib的简单而简短的介绍。

e)海运

Seborn是一个基于matplotlib的Python可视化库。它为绘制有吸引力的统计图形提供了一个高级界面。

URL:海航

请查看使用上述所有库进行数据分析的木星笔记本电脑的以下数字:

(A)使用PADAS导入数据:

从零开始学习Python用于数据科学,Python比你想象的要强大!

(B)数据分析和清理:

从零开始学习Python用于数据科学,Python比你想象的要强大!

(C)使用Ploly绘制图表(或者,还可以使用matplotlib和海运)

从零开始学习Python用于数据科学,Python比你想象的要强大!

c)在木星笔记本上绘制方框图、条形图和热图

第4步:机器学习

机器学习是一门让计算机在不被明确编程的情况下行动的科学。机器从大量的培训数据中学习,并帮助对新的数据集进行预测或分类。

它分为以下两类:

(I)监督学习(参数/非参数算法、支持向量机、核、神经网络)。

(2)无监督学习(聚类、降维、推荐系统、深度学习)。

安装PythonScikit学习朱庇特笔记本中机器学习练习图书馆。它有非常好的文件可循:

从零开始学习Python用于数据科学,Python比你想象的要强大!

最佳MOOC首先:

a)斯坦福机器学习

b)基于Udacity的机器学习介绍

关于这个问题有很多书可读,而且都写得很好,所以我不想特别推荐任何一本书。所有的书都同样适合阅读和阅读。

第五步:实践与实践

最后但并非最不重要的是,练习和艰苦的工作是关键,很多次我在Reddit&Quora上看到了一些问题,所以我可以从哪里获得用于分析的开源数据。我们是在2017年,到处都是丰富的数据,只是你需要挑选这些数据,并开始玩弄它。我个人最喜欢练习的是卡格尔。在这里,您可以自己学习,并查看内核,以查看一些最好的数据科学家的工作。

猜你喜欢

转载自blog.csdn.net/weixin_44138053/article/details/85774182