1 - AutoML
AutoML(自动机器学习)是将机器学习应用于现实问题的端到端流程自动化的过程。
什么是自动化机器学习呢?
简单来说就是一种自动化(https://www.automl.org/automl/ )任务的方法:
- 预处理并清理数据。
- 选择并构建适当的功能。
- 选择合适的模型系列。
- 优化模型超参数。
- 后处理机器学习模型。
- 批判性地分析所获得的结果。
AutoML的优点:
- 自动化重复的任务,如管道创建和超参数调整等,让数据科学家在实际中可以能够更多地关注业务问题而不是模型
- 自动化ML管道中的步骤,在只需最少人力的情况下仍保持模型的性能,有助于避免可能因手动引入的错误
- 不同知识背景的人都能使用机器学习的功能来解决复杂的场景
2 - H2O 简介
Automatic Machine Learning for the Enterprise. Driverless AI automates feature engineering, model building, visualization and interpretability.
- H2O是企业级机器学习框架、开源的预测引擎,提供了一站式自动建模平台DAI(Driverless AI)。
- H2O实际上是通过增加一个专有超参数调整和功能工程层 Driverless AI,从而使性能得到提升。
- H2O是商业程序,价格昂贵,目前提供试用期:(Driverless AI 21-Day Free Trial)。
一些特性
- H2O框架的核心代码由Java编写,数据和模型通过分布式的key/value存储在各个集群节点的内存中,算法使用Map/Reduce框架实现,并使用了Java中的Fork/Join机制来实现多线程。
- 支持深度学习、梯度推进(Gradient Boosting)、随机森林(Random Forest)、广义线性模型(即逻辑回归,弹性网络)等各种机器学习算法。
- 支持多语言Python、Java、Scala、R等
- 多种数据接口:HDFS, S3, SQL and NoSQL
- 界面简洁,易于扩展和长期维护
官网信息
- HomePage:https://www.h2o.ai/
Driverless AI:https://www.h2o.ai/products/h2o-driverless-ai/
- Docs:http://docs.h2o.ai/
- Tutorials:https://h2oai.github.io/tutorials/
User Guide:http://docs.h2o.ai/driverless-ai/latest-stable/docs/userguide/index.html
- Download:https://www.h2o.ai/download/
Installation:http://docs.h2o.ai/driverless-ai/latest-stable/docs/userguide/installing.html
3 - AutoKeras 简介
官网:https://github.com/keras-team/autokeras
- AutoKeras是一个由易用深度学习库Keras编写的开源Python包。
- 安装快速,运行简单,案例丰富,易于修改。
- 可通过 pip install autokeras快速安装,然后就可以在准备好在的数据集上做自己专属的架构搜索。
AutoKeras不仅能帮助开发人员快速准确地创建模型,而且允许研究人员深入研究架构搜索。
AutoKeras使用神经架构搜索(Efficient Neural Architecture Search,ENAS)为给定的学习任务搜索最佳的神经网络架构
- TensorFlow:https://github.com/melodyguan/enas
- Pytorch:https://github.com/carpedm20/ENAS-pytorch