人工智能典型库

科学运算、人工智能: 典型库NumPy, SciPy, Matplotlib, Enthought librarys,pandas 

 

numpy

   
NumPy系统是Python的一种开源的数值计算扩展。这种工具可用来存储和处理大型矩阵,比Python自身的嵌套列表(nested list structure)结构要高效的多(该结构也可以用来表示矩阵(matrix))。
外文名
numpy
含    义
Python的一种开源的数字扩展
内    容
一个强大的N维数组对象Array
用    途
存储和处理大型矩阵


一个用python实现的科学计算包。包括:1、一个强大的N维数组对象Array;2、比较成熟的(广播)函数库;3、用于整合C/C++和Fortran代码的工具包;4、实用的线性代数、傅里叶变换和随机数生成函数。numpy和稀疏矩阵运算包scipy配合使用更加方便。
NumPy(Numeric Python)提供了许多高级的数值编程工具,如:矩阵数据类型、矢量处理,以及精密的运算库。专为进行严格的数字处理而产生。多为很多大型金融公司使用,以及核心的科学计算组织如:Lawrence Livermore,NASA用其处理一些本来使用C++,Fortran或 Matlab等所做的任务。
SciPy
SciPy是一款适用于PC平台的应用软件,软件大小为7.4MB。
SciPy是一款方便、易于使用、专为科学和工程设计的Python工具包.它包括统计,优化,整合,线性代数模块,傅里叶变换,信号和图像处理,常微分方程求解器等等.

 Matplotlib,
Matplotlib 是一个  Python 的 2D绘图库,它以各种硬拷贝格式和跨平台的交互式环境生成出版质量级别的图形。
通过 Matplotlib,开发者可以仅需要几行代码,便可以生成绘图,直方图,功率谱,条形图,错误图,散点图等。
Matplotlib基础知识
1.Matplotlib中的基本图表包括的元素
x轴和y轴
水平和垂直的轴线
x轴和y轴刻度
刻度标示坐标轴的分隔,包括最小刻度和最大刻度
x轴和y轴刻度标签
表示特定坐标轴的值
绘图区域
实际绘图的区域
2.hold属性
hold属性默认为True,允许在一幅图中绘制多个曲线;将hold属性修改为False,每一个plot都会覆盖前面的plot。
但是目前不推荐去动hold这个属性,这种做法(会有警告)。因此使用默认设置即可。
3.网格线
grid方法
使用grid方法为图添加网格线
设置grid参数(参数与plot函数相同)
.lw代表linewidth,线的粗细
.alpha表示线的明暗程度
4.axis方法
如果axis方法没有任何参数,则返回当前坐标轴的上下限
5.xlim方法和ylim方法
除了plt.axis方法,还可以通过xlim,ylim方法设置坐标轴范围
6.legend方法
两种传参方法:
【推荐使用】在plot函数中增加label参数
在legend方法中传入字符串列表
配置matplotlib参数
永久配置
matplotlib配置信息是从配置文件读取的。在配置文件中可以为matplotlib的几乎所有属性指定永久有效的默认值
安装级配置文件(Per installation configuration file)
Python的site-packages目录下(site-packages/matplotlib/mpl-data/matplotlibrc)
系统级配置,每次重新安装matplotlib后,配置文件会被覆盖
如果希望保持持久有效的配置,最好选择在用户级配置文件中进行设置
对本配置文件的最佳应用方式,是将其作为默认配置模板
用户级.matplotlib/matplotlibrc文件(Per user .matplotlib/matplotlibrc)
用户的Documents and Settings目录
可以用matplotlib.get_configdir()命令来找到当前用户的配置文件目录
当前工作目录
代码运行的目录
在当前目录下,可以为目录所包含的当前项目代码定制matplotlib配置项。配置文件的文件名是matplotlibrc
在Windows系统中,没有全局配置文件,用户配置文件的位置在C:\Documents and Settings\yourname\.matplotlib。
在Linux系统中,全局配置文件的位置在/etc/matplotlibrc,用户配置文件的位置在$HOME/.matplotlib/matplotlibrc。
动态配置
程序中配置代码
To finetune settings only for that execution; this overwrites every configuration file.
配置方法的优先级为:
Matplotlib functions in Python code
matplotlibrc file in the current directory
User matplotlibrc file
Global matplotlibrc file
rcParams方法
通过rcParams字典访问并修改所有已经加载的配置项
Matplotlib 是一个 Python 的 2D绘图库,它以各种硬拷贝格式和跨平台的交互式环境生成出版质量级别的图形。



 Enthought
 
   
  Enthought Canopy (Enthought Python Distribution),曾用名:Enthought Python Distribution(EPD),网站在这里:https://www.enthought.com/。canopy其实就是一个集成的IDE,包含了之前所说的众多科学计算库。现在最新版本是canopy-1.6.2,支持Linux、Microsoft Windows以及Mac OSX,官网提供free版本供下载使用,当然,如果你有一个大学的邮箱,就可以轻松使用full版本,比free版本提供更多的计算库。当然,欢迎土豪付费使用!

Enthought, Inc. is a software company based in Austin, TexasUnited States that develops scientific and analytic computing solutions using primarily the Python programming language. It is best known for the early development and maintenance of the SciPy library of mathematics, science, and engineering algorithms[3] and for its Python for scientific computing distribution Enthought Canopy (formerly EPD).[4]

The company was founded in 2001 by Travis Vaught and Eric Jones.


 librarys,

library,中文翻译为:库,也常称为:库文件

之所以此处不说是Python中的library,那是因为,本身library这个词,一般都是针对其他的编译型语言,比如C,C#等语言来说的。

常见的C/C#等语言中的library,一般指的就是:

静态的库文件:xxx.a

动态的库文件:xxx.dll


pandas 
Python Data Analysis Library 或 pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素之一。
Pandas [1]    是python的一个数据分析包,最初由AQR Capital Management于2008年4月开发,并于2009年底开源出来,目前由专注于Python数据包开发的PyData开发team继续开发和维护,属于PyData项目的一部分。Pandas最初被作为金融数据分析工具而开发出来,因此,pandas为时间序列分析提供了很好的支持。 Pandas的名称来自于面板数据(panel data)和python数据分析(data analysis)。panel data是经济学中关于多维数据集的一个术语,在Pandas中也提供了panel的数据类型。
Series:一维数组,与Numpy中的一维array类似。二者与Python基本的数据结构List也很相近,其区别是:List中的元素可以是不同的数据类型,而Array和Series中则只允许存储相同的数据类型,这样可以更有效的使用内存,提高运算效率。
Time- Series:以时间为索引的Series。
DataFrame:二维的表格型数据结构。很多功能与R中的data.frame类似。可以将DataFrame理解为Series的容器。以下的内容主要以DataFrame为主。
Panel :三维的数组,可以理解为DataFrame的容器。



















猜你喜欢

转载自blog.csdn.net/flyingsir_zw/article/details/79162778