【机器学习】 Python 科学计算工具(SciPy/NumPy/pandas)参考资料汇总

版权声明:欢迎转载 https://blog.csdn.net/antony1776/article/details/83271462

SciPy 是一个基于 Python 开发的用以科学计算的工具集,包括:NumPy,SciPy library,Matplotlib,Sympy, pandas。

官网:https://www.scipy.org/

一、文档资料

Numpy Reference Guide(pdf)
Complete Numpy Manual(zip)
Numpy User Guide(pdf)
Scipy Reference Guide(pdf)
pandas(pdf)
NumPy quickstart(html)

二、SciPy

SciPy contains modules for optimization, linear algebra, integration, interpolation, special functions, FFT, signal and image processing, ODE solvers and other tasks common in science and engineering.

scipy包含致力于科学计算中常见问题的各个工具箱。它的不同子模块相应于不同的应用。像插值,积分,优化,图像处理,统计,特殊函数等等。

模块 功能
scipy.cluster 矢量量化 / K-均值
scipy.constants 物理和数学常数
scipy.fftpack 傅里叶变换
scipy.integrate 积分程序
scipy.interpolate 插值
scipy.io 数据输入输出
scipy.linalg 线性代数程序
scipy.ndimage n维图像包
scipy.odr 正交距离回归
scipy.optimize 优化
scipy.signal 信号处理
scipy.sparse 稀疏矩阵
scipy.spatial 空间数据结构和算法
scipy.special 任何特殊数学函数
scipy.stats 统计

三、NumPy

NumPy (pronounced /ˈnʌmpaɪ/ (NUM-py) or sometimes /ˈnʌmpi/[1][2] (NUM-pee)) is a library for the Python programming language, adding support for large, multi-dimensional arrays and matrices, along with a large collection of high-level mathematical functions to operate on these arrays.

NumPy是Python语言的一个扩充程序库,支持大数量、多维数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。

数组创建 arange, array, copy, empty, empty_like, eye, fromfile, fromfunction, identity, linspace, logspace, mgrid, ogrid, ones, ones_like, r, zeros, zeros_like
转换 ndarray.astype, atleast_1d, atleast_2d, atleast_3d, mat
操作 array_split, column_stack, concatenate, diagonal, dsplit, dstack, hsplit, hstack, ndarray.item, newaxis, ravel, repeat, reshape, resize, squeeze, swapaxes, take, transpose, vsplit, vstack
条件 all, any, nonzero, where
排序 argmax, argmin, argsort, max, min, ptp, searchsorted, sort
运算 choose, compress, cumprod, cumsum, inner, ndarray.fill, imag, prod, put, putmask, real, sum
基础统计 cov, mean, std, var
线性代数 cross, dot, outer, linalg.svd, vdot

四、Pandas

In computer programming, pandas is a software library written for the Python programming language for data manipulation and analysis. In particular, it offers data structures and operations for manipulating numerical tables and time series.

pandas 是一个基于 NumPy 的 Python 库,主要用于数据操作和分析,pandas 提供了一些标准的数据模型,使其能高效、便捷的处理数值表格及时间序列数据集。

  • Series :一维数组,与Numpy中的一维array类似。二者与Python基本的数据结构List也很相近。Series如今能保存不同种数据类型,字符串、boolean值、数字等都能保存在Series中。
  • Time- Series:以时间为索引的Series。
  • DataFrame:二维的表格型数据结构。很多功能与R中的data.frame类似。可以将DataFrame理解为Series的容器。
  • Panel :三维的数组,可以理解为DataFrame的容器。

猜你喜欢

转载自blog.csdn.net/antony1776/article/details/83271462