Fregata: TalkingData开源的轻量级大规模机器学习库 - 代码天地

Fregata: TalkingData开源的轻量级大规模机器学习库

编程语言 2018-05-10 03:26:58 阅读次数: 1

Fregata是TalkingData开源的一个基于Spark的轻量级、超快速的大规模机器学习库，并在Scala中提供高级API。

显著特征：

更加准确：Fregata的精确度要高于MLLib；
高速度：对于广义线性模型，Fregata通常汇合在一个数据历元。对于10亿*10亿的数据集，Fregata可以在1分钟内使用内存缓存或10分钟完成一个广义线性模型训练，速度要比MLLib快10-100倍；
参数自由：Fregata使用GSA SGD优化，无需学习速率调整，原因是研发团队找到了一种在训练过程中计算学习速率的方法。当面对超高维问题时，Fregata会动态计算剩余内存来确定输出的稀疏性，自动平衡精度和效率；
轻量：Fregata只使用了Spark的标准API即可快速、无缝地集成到Spark上的大多数业务数据处理流程中。

架构

这里主要介绍1.0版本架构。核心部分主要基于GSA独立算法实现，包括分类，回归和聚类：

分类：支持二进制和多重分类
回归：在下面的版本中发布
聚类：在下面的版本中发布

Spark：主要通过封装core.jar实现基于Spark的大规模机器学习算法，并提供相应的算法。

如何安装及快速入门，大家可以访问其在Github上的开源地址。

猜你喜欢

转载自fengbin2005.iteye.com/blog/2342168

Fregata: TalkingData开源的轻量级大规模机器学习库

轻量级大规模机器学习算法库Fregata开源：快速，无需调参

大规模机器学习

大规模机器学习（二）

大规模机器学习（一）

机器学习基础---大规模机器学习

【机器学习--学习笔记】大规模机器学习

通过大规模机器学习自动调优数据库参数

机器学习笔记（十六）：大规模机器学习

吴恩达机器学习——大规模机器学习

吴恩达机器学习—大规模机器学习

《吴恩达机器学习》17 大规模机器学习

机器学习笔记（十）大规模机器学习

机器学习笔记（十五）大规模机器学习

NVIDIA针对大规模数据分析和机器学习推出RAPIDS开源GPU加速平台！

使用SGD(Stochastic Gradient Descent)进行大规模机器学习

基于大规模机器学习模型的推荐系统

大规模机器学习框架的四重境界

大规模机器学习（Large Scale Machine Learning）

Machine Learning第十讲【大规模机器学习】

[C12]大规模机器学习（待整理）

Large scale machine learning(大规模机器学习)

Android 机器学习模型的轻量级框架 TensorFlow Lite

Open X-Embodiment 超大规模开源真实机器人数据集分享

轻量级数据库SQLite的学习

吴恩达《机器学习》课程总结(17)大规模机器学习

机器学习笔记8——大规模机器学习(Large scale machine learning)

吴恩达机器学习笔记 —— 18 大规模机器学习

吴恩达机器学习笔记9-大规模机器学习

【吴恩达】机器学习第18章大规模机器学习

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)