机器学习工具库 http://tensorfly.cn/tfdoc/mltools.html
Python
计算机视觉
- Scikit-Image - Python中的图像处理算法的集合。
- SimpleCV - 一个开源的计算机视觉框架,允许访问几个高性能计算机视觉库,如OpenCV。可以运行在Mac,Windows和Ubuntu Linux操作系统上。
- Vigranumpy - 计算机视觉库VIGRA C++ 的Python绑定。
自然语言处理
- NLTK - 构建与人类语言数据相关工作的Python程序的领先平台。
- Pattern - 基于Python的Web挖掘模块。它有自然语言处理,机器学习等工具。
- Quepy - 将自然语言问题转换成数据库查询语言。
- TextBlob - 为普通的自然语言处理(NLP)任务提供一致的API。构建于NLTK和Pattern上,并很好地与两者交互。
- YAlign - 句子对齐工具,从对照语料中抽取并行句子。
- jieba - 中文分词工具
- SnowNLP - 中文文本处理库。
- loso - 中文分词工具
- genius - 基于条件随机场的中文分词工具
- KoNLPy - 韩语自然语言处理
- nut - 自然语言理解工具
- Rosetta - Text processing tools and wrappers (e.g. Vowpal Wabbit)
- BLLIP Parser - BLLIP Natural Language Parser 的Python绑定(即 Charniak-Johnson parser)
- PyNLPl - Python的自然语言处理库。还包含用于解析常见NLP格式的工具,如FoLiA, 以及 ARPA language models, Moses phrasetables, GIZA++ 对齐等。
- python-ucto - ucto(面向unicode的基于规则的tokenizer)的Python 绑定
- python-frog - Frog的Python 绑定。荷兰语的词性标注,lemmatisation,依存分析,NER。
- python-zpar - ZPar的Python 绑定(英文的基于统计的词性标注, constiuency解析器和依赖解析器)
- colibri-core - 高效提取 n-grams 和 skipgrams的C++库的Python 绑定
- spaCy - 工业级 NLP with Python and Cython.
- PyStanfordDependencies - 将 Penn Treebank tree转换到Stanford 依存树的Python接口.
通用机器学习
- machine learning - 构建和 web-interface, programmatic-interface 兼容的支持向量机API. 相应的数据集存储到一个SQL数据库,然后生成用于预测的模型,存储到一个NoSQL的数据库。
- XGBoost - eXtreme Gradient Boosting (Tree)库的Python 绑定
- Featureforge一组工具,用于创建和测试机器学习的特征,具有与scikit-learn兼容的API
- scikit-learn - 基于SciPy的机器学习的Python模块。
- metric-learn - metric learning的Python模块
- SimpleAI -实现了“人工智能现代方法”一书中描述的许多人工智能算法。它着重于提供一个易于使用的,文档良好的和经过测试的库。
- astroML - 天文学机器学习和数据挖掘库。
- graphlab-create - 基于disk-backed DataFrame的库,实现了各种机器学习模型(回归,聚类,推荐系统,图形分析等)。
- BigML - 与外部服务器交流的库。
- pattern - Web数据挖掘模块.
- NuPIC - Numenta智能计算平台.
- Pylearn2 - 基于 Theano的机器学习库。
- keras - 基于 Theano的神经网络库
- hebel - GPU加速的Python深度学习库。
- Chainer - 灵活的神经网络架构
- gensim - 易用的主题建模工具
- topik - 主题建模工具包
- PyBrain - Another Python Machine Learning Library.
- Crab - 灵活的,快速的推荐引擎
- python-recsys - 实现一个推荐系统的Python工具
- Restricted Boltzmann Machines -受限玻尔兹曼机
- CoverTree - Python implementation of cover trees, near-drop-in replacement for scipy.spatial.kdtree
- nilearn - NeuroImaging机器学习库
- Shogun - Shogun Machine Learning Toolbox
- Pyevolve - 遗传算法框架
- Caffe - deep learning 框架,结构清晰,可读性好,速度快。
- breze - 基于Theano 的深度神经网络
- pyhsmm - 贝叶斯隐马尔可夫模型近似无监督的推理和显式时长隐半马尔可夫模型,专注于贝叶斯非参数扩展,the HDP-HMM and HDP-HSMM,大多是弱极限近似。
- mrjob - 使得 Python 程序可以跑在 Hadoop上.
- SKLL - 简化的scikit-learn接口,易于做实验
- neurolab - https://github.com/zueve/neurolab
- Spearmint - 贝叶斯算法的优化。方法见于论文: Practical Bayesian Optimization of Machine Learning Algorithms. Jasper Snoek, Hugo Larochelle and Ryan P. Adams. Advances in Neural Information Processing Systems, 2012.
- Pebl - 贝叶斯学习的Python环境
- Theano - 优化GPU元编程代码,生成面向矩阵的优化的数学编译器
- TensorFlow - 用数据流图进行数值计算的开源软件库
- yahmm - 隐马尔可夫模型,用Cython实现
- python-timbl - 包装了完整的TiMBL C ++编程接口. Timbl是一个精心制作的k最近邻机器学习工具包。
- deap - 进化算法框架
- pydeep - Python 深度学习
- mlxtend - 对数据科学和机器学习任务非常有用的工具库。
- neon - 高性能 深度学习框架
- Optunity - 致力于自动化超参数优化过程,使用一个简单的,轻量级的API,以方便直接替换网格搜索。
- Annoy - Approximate nearest neighbours implementation
- skflow - TensorFlow的简化界面, 类似 Scikit Learn.
- TPOT - 自动创建并利用genetic programming优化机器学习的管道。将它看作您的数据科学助理,自动化机器学习中大部分的枯燥工作。
数据分析、可视化
- SciPy - A Python-based ecosystem of open-source software for mathematics, science, and engineering.
- NumPy - A fundamental package for scientific computing with Python.
- Numba - Python JIT (just in time) complier to LLVM aimed at scientific Python by the developers of Cython and NumPy.
- NetworkX - A high-productivity software for complex networks.
- Pandas - A library providing high-performance, easy-to-use data structures and data analysis tools.
- Open Mining - Business Intelligence (BI) in Python (Pandas web interface)
- PyMC - Markov Chain Monte Carlo sampling toolkit.
- zipline - A Pythonic algorithmic trading library.
- PyDy - Short for Python Dynamics, used to assist with workflow in the modeling of dynamic motion based around NumPy, SciPy, IPython, and matplotlib.
- SymPy - A Python library for symbolic mathematics.
- statsmodels - Statistical modeling and econometrics in Python.
- astropy - A community Python library for Astronomy.
- matplotlib - A Python 2D plotting library.
- bokeh - Interactive Web Plotting for Python.
- plotly - Collaborative web plotting for Python and matplotlib.
- vincent - A Python to Vega translator.
- d3py - A plottling library for Python, based on D3.js.
- ggplot - Same API as ggplot2 for R.
- ggfortify - Unified interface to ggplot2 popular R packages.
- Kartograph.py - Rendering beautiful SVG maps in Python.
- pygal - A Python SVG Charts Creator.
- PyQtGraph - A pure-python graphics and GUI library built on PyQt4 / PySide and NumPy.
- pycascading
- Petrel - Tools for writing, submitting, debugging, and monitoring Storm topologies in pure Python.
- Blaze - NumPy and Pandas interface to Big Data.
- emcee - The Python ensemble sampling toolkit for affine-invariant MCMC.
- windML - A Python Framework for Wind Energy Analysis and Prediction
- vispy - GPU-based high-performance interactive OpenGL 2D/3D data visualization library
- cerebro2 A web-based visualization and debugging platform for NuPIC.
- NuPIC Studio An all-in-one NuPIC Hierarchical Temporal Memory visualization and debugging super-tool!
- SparklingPandas Pandas on PySpark (POPS)
- Seaborn - A python visualization library based on matplotlib
- bqplot - An API for plotting in Jupyter (IPython)