Oryx简介

Oryx 的前身叫 Myrrix,后来被 Cloudera 收购改了这个名字。值得一提的是 Oryx 的维护者就是 Mahout 的主要贡献者—— Sean Owen
Oryx开源项目旨在提供实时的大规模机器学习/预测分析基 础框架目前它实现了一列工程应用常用到的机器学习算法:协同过滤,分类/回归以及聚类。Oryx 通过Apache hadoop来实现对大规模的数据流进行建模。同时可以通过实时的REST API来对建好的模型进行查询,并且有也可以通过API将新数据输入到模型中进行训练。

Oryx 具有以下特点:

  • Hadoop 版本跟着 CDH 升级
  • 将推荐引擎分为 Serving Layer 和 Computing Layer,隔离出 Serving Layer 让扩展变得很容易
  • 同时支持推荐、聚类、分类的机器学习
  • 数据引入了 Generation 的概念,提供了很好的增量补充数据的支持

目前Oryx release的版本是Oryx1.0,而Oryx2.0也正在孵化当中。相较于1.0版本,Oryx2.0更好的实现了lambda架构,使得各个层之间可复用性更强。实现了比1更多的机器学习算法(1.0只实现了,ALS协同过滤,随机森林,以及K-means++算法)同时2.0版本还引入更新的Spark和Streaming技术。

猜你喜欢

转载自m635674608.iteye.com/blog/2286749