10个开源的机器学习工具,小白入门必看

1. DataRobot

DataRobot(DR)是一款高度自动化的机器学习平台,由全球最好的Kagglers构建,包括Jeremy Achin,Thoman DeGodoy和Owen Zhang。该平台声称已经消除了对数据科学家的需求。这从他们网站的一句话中可以明显看出 - “数据科学需要数学和统计资质、编程技能和商业知识。借助DataRobot,你只需提供商业知识和数据,而我们的尖端自动化负责其余部分。”

10个开源的机器学习工具,小白入门必看!

 

模型优化:

平台通过采用文本挖掘、变量类型检测、编码、插补、缩放、转换等自动检测最佳数据预处理和特征工程。

部署:

只需点击几下即可轻松部署设施(无需编写任何新代码)。

对于软件工程师:

Python SDK和API可用于将模型快速集成到工具和软件中。

2. BigML

BigML提供了一个良好的图形用户界面,可以让用户通过以下6个步骤掌握:

来源:使用各种信息来源

数据集:使用定义的源创建数据集

模型:制作预测模型

预测:基于模型生成预测

合成:创建各种模型的合成

评估:针对验证集的非常模型

这些过程显然会以不同的顺序迭代。BigML平台提供了很好的结果可视化,并具有求解分类、回归、聚类、异常检测和关联发现问题的算法。他们提供按月、季度和年度订阅捆绑在一起的几个软件包。他们甚至提供免费套餐,但上传数据集的大小限制为16MB。

4. Google Cloud AutoML

Cloud AutoML是Google机器学习组件的一部分,它允许有限ML专业知识的人员来构建高质量模型。作为Cloud AutoML产品组合的一部分,第一款产品是Cloud AutoMLVision。该服务使得训练图像识别模型变得更加简单。它具有拖放界面,可以让您上传图像,训练模型,然后直接在Google Cloud上部署这些模型。

Cloud AutoML Vision基于Google的迁移学习和神经架构搜索等技术。这个工具已经被很多组织所使用。看看这篇文章,看看AutoML在两个惊人的现实生活例子的表现,以及它如何产生比任何其他工具更好的结果。

5. MLBase

MLBase是加州大学伯克利分校的AMP(算法机器人)实验室开发的一个开源项目。背后的核心思想是为机器学习应用于大规模问题提供一个简单的解决方案。

它有3种产品:

MLlib:它是Apache Spark中的核心分布式ML库。它最初是作为MLBase项目的一部分开发的,但现在Spark社区也支持它。

MLI:用于特征提取和算法开发的实验性API,它引入了高级ML编程抽象。

ML优化器:该层旨在自动执行ML管道构建任务。优化器通过包含在MLI和MLlib中的特征提取器和ML算法来解决搜索问题。

6.Google AIY Projects

谷歌越来越关注神经网络和人工智能,以解决搜索、图像处理和其他计算领域的问题。它也正在通过“AIY项目”这样的计划来促进开发人员和DIY社区对人工智能的兴趣,这些计划本身代表了人工智能。AIY Projects——AIY 全称是 Artificial Intelligence Yourself,其目标是让每个Maker(创客)都能DIY自己的 AI 人工智能产品,让更多人能学习、探索并体验人工智能。

10个开源的机器学习工具,小白入门必看!

 

借助 AIY 项目,创客可以利用人工智能来实现更像人与人交流的人机交互。

Google 先后在 5 月、12 月份分别推出该项目代表的两组套件 Voice Kit 和 Vision Kit。

Voice Kit 是 Google 首个推出的 DIY 人工智能产品。它可借助 Google Assistant SDK 和 Cloud Speech API,将树莓派转换为语音数字助理。用户可在此基础上创建虚拟语音助手,为自己的项目添加语音交互功能。

Vision Kit 则是 Google 推出的第二弹 DIY 人工产品。AIY Vision Kit的主要组件是 Raspberry Pi 的 Vision Bonnet 配件板。这个组件的低功耗视觉处理单元能在设备上运行神经网络模型。它是一套简单的计算机视觉系统,可运行 3 种基于 TensorFlow 的类神经网路模型应用程序。

7. Driverless AI

Driverless AI是支持自动机器学习的h2o.ai企业的神奇平台。这个链接上可以使用1月试用版的docker映像。您只需使用简单的下拉列表选择文件来训练,测试并指定您想要跟踪模型性能的指标。坐下来,看着界面直观的平台在你的数据集上训练出优秀的结果,并能与一个经验丰富的数据科学家能够提出的好解决方案相比。

它支持XGBOOST,GLM和K-Means等多GPU支持,即使对于大型复杂数据集也能提供出色的训练速度。

自动功能工程,调整和综合各种模型以产生高度准确的预测。

在训练过程中,有解释模型以及用于实时特征重要性排序的面板的强大功能。

10个开源的机器学习工具,小白入门必看!

 

8. Microsoft Azure ML Studio

Azure ML Studio是一个简单却强大的基于浏览器的ML平台。它有一个可视化的拖放环境,不需要编程。他们已经为新手发布了全面的教程和示例实验,可以帮助他们快速掌握该工具。

9. MLJar

MLJar是一个基于浏览器的平台,用于快速构建和部署机器学习模型。它有一个直观的界面,并允许您并行地训练模型。它具有内置的超参数搜索功能,可以更轻松地部署模型。MLJar提供与NVIDIA的CUDA,python,TensorFlow等的集成。

10. IBM Wastson Studio

IBM Watson Studio为构建和部署学习机和深度学习模型提供了一个美丽的平台。您可以交互式地发现、清理和转换您的数据,使用Jupyter笔记本电脑和RStudio等熟悉的开源工具,访问最流行的库,训练深度神经网络以及大量其他事物。

猜你喜欢

转载自www.cnblogs.com/aiyprojects/p/9334739.html