关于执行机器学习任务的开源科学python库,我比较熟的有numpy, matplotlib, pandas, 较熟的是scikitlearn,看过相关的相关书籍,探索一下其他的科学python库。
python有一些常用于执行数据处理和机器学习的开源软件库。有很多的**科学Python库(Scientific Python Libraries)**可用于执行基本的机器学习任务,如Numpy、Pandas、Matplotlib、Scikit-learn等,可以借助这些第三方扩展库来实现数据分析和机器学习的功能。
- 矩阵操作函数库 - Numpy
- Python的会图库 - Matplotlib
- 数据分析包 - Pandas
- 科学计算的核心包 - Scipy
- 机器学习函数库 - Scikit-learn
- 统计建模工具包 - StatsModels
- 深度学习框架 - TensorFlow
1. 矩阵操作函数库 - Numpy
why 要有numpy ?
由于机器学习算法再数据处理过程中大都涉及线性代数的知识,需要用到矩阵操作,Python本身没有处理矩阵的数据类型,因此需要使用附加的函数库。Numpy可以用来存储和处理大型多位矩阵,比Python自身的列表结构要高效的多。
2. Python的会图库 - Matplotlib
特点
是Python中常用的可视化工具之一,可以非常方便地创建2D图表和一些基本的3D图表。
3. 数据分析包 - Pandas
名字?
Python Data Analysis Library
来自面板数据Panel Data和Python数据分析Data Analysis
维护方?
PyData开发team
优势?
Pandas提供了大量可以快速便捷地处理数据的函数和方法,是Python成为强大而高效的数据分析工具的重要因素之一。
4. 科学计算的核心包 - Scipy
特点
SciPy函数库在Numpy库的基础上增加了众多的数学、科学及工程计算中常用的库函数,如线性代数、常微分方程数值求解、信号处理、图像处理、稀疏矩阵等。
5. 机器学习函数库 - Scikit-learn
需要的辅助?
需要NumPy和SciPy等其他包的支持
为开发者提供哪些帮助?
总体来说,作为专门面向机器学习的Python开源框架,Scikit-learn可以在一定范围内为开发者提供非常好的帮助。
它内部实现了各种各样成熟的算法,容易安装和使用,样例丰富,而且教程和文档也非常详细。
6. 统计建模工具包 - StatsModels
地位?
以前是SciKits的一部分,是SciPy统计函数的补充。
特性?
一般线性模型,离散选择模型,时间序列分析,一系列描述统计学及参数和非参数检验
7. 深度学习框架 - TensorFlow
引入知名case?
AlphaGo就是用TensorFlow深度学习系统制作出来的。
谁研发的?
Google研发的第二代人工智能系统
应用?
语音识别,自然语言理解,计算机视觉,广告等