Apache Zeppelin 简单介绍，以及下载地址 - 代码天地

Apache Zeppelin 简单介绍，以及下载地址

企业开发 2023-04-08 20:22:42 阅读次数: 0

https://zeppelin.apache.org

Zeppelin 是一个提供交互数据分析且基于Web的笔记本。方便你做出可数据驱动的、可交互且可协作的精美文档，并且支持多种语言，包括Scala(使用Apache Spark)、Python(Apache Spark)、SparkSQL、 Hive、 Markdown、Shell等等。 (类似于ipython notebook，可以直接在浏览器中写代码、笔记并共享)。同时，Zeppelin 还提供了单机 Docker、分布式、K8s、Yarn 四种系统运行模式，以适应各类团队的需求。

首先，在数据预处理和特征工程方面，从数据导入、数据处理、数据探索、数据抽样到数据训练，Zeppelin 已经实现了全覆盖：数据导入支持 HDFS、S3和RDNMS，数据聚合加工处理支持 Hive、Spark，数据探索是 Zeppelin 的强项之一，数据抽样、模型训练和A/B测试则支持Spark。

其次，在模型训练方面，包括逻辑回归（LR）、梯度提升树（GDBT）等传统机器学习模型，以及等卷积神经网络（CNN）、循环神经网络（RNN）、长短期记忆网络（LSTM）等常用于图像、语音、视频的深度学习模型，Zeppelin 都支持各种主流的库，针对前者如Python 库、Spark MLlib、XGBoost，针对后者包括TensorFlow、PyTorch、MXNet等。由于机器学习从业者常用语言包括Python、Scala、R 等，各种环境、版本的冲突是一个很大的挑战，Zeppelin 采用 Docker 的部署解决了这个问题。

再次，在模型在线服务方面，模型的管理支持 Hadoop，模型部署支持 Hadoop 和 Kubernetes，模型库的批处理采用 Spark，增量更新则采用性能更好的 Flink 流计算（以保持模型与时俱进）。

此外，在生态方面，Zeppelin还和 Hadoop Submarine 做了集成，后者是 Hadoop 社区开发的一款机器学习引擎，旨在解决机器学习算法在Kubernetes / YARN 平台上的批量作业处理。二者的集成，可以将 Zeppelin 从支持单任务开发扩展到了支持分布式任务调度的场景。

下载： Download

来源：

1. https://zeppelin.apache.org

猜你喜欢

转载自blog.csdn.net/stellao_o/article/details/129207279

Apache Zeppelin 简单介绍，以及下载地址

【Apache之 Zeppelin 介绍】

Apache Zeppelin是什么？

Apache Zeppelin(2)Zeppelin and Spark Yarn Cluster

Zeppelin介绍

Apache Zeppelin(1)Build and Installation

apache zeppelin 初次使用体验.

Apache Zeppelin使用说明

Apache Hudi集成Apache Zeppelin实战

Zeppelin 的安装及简单使用

记录使用Apache zeppelin安装和使用

Zeppelin

Apache Zeppelin系列教程第八篇——LRU算法在Apache Zeppelin中的应用

Apache Zeppelin系列教程第九篇——SQL Debug In Zeppelin

Apache Zeppelin系列教程第九篇——Zeppelin NoteBook数据缓存

Apache Zeppelin 0.8.0 发布，协作数据分析

MRS +Apache Zeppelin，让数据分析更便捷

Apache Zeppelin系列教程第二篇——整体架构

Apache Zeppelin 番外篇——参与开源的得与失

zeppelin集成openldap，以及admin用户设置

Zeppelin推荐 Zeppelin源码

基于Apache Zeppelin Notebook和R的交互式数据科学

1. Apache Zeppelin0.9.0 CDH6.2.0 下安装记录和spark示例运行

Apache Zeppelin系列教程第七篇——运行paragraph的整个流程分析

Apache Zeppelin系列教程第六篇——Zengine调用Interpreter原理分析

Apache Zeppelin系列教程第五篇——Interpreter原理分析

Apache Zeppelin系列教程第四篇——JDBCInterpreter原理分析

Apache Zeppelin系列教程第三篇——Note的持久化管理

Apache Zeppelin系列教程第一篇——安装和使用

Zeppelin使用

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)