容器化大数据 - 代码天地

容器化大数据

其他 2018-12-17 13:00:49 阅读次数: 0

搞容器并且想做数据处理和分析的同学有福了，这里有一个基于Spark的项目，可以让我们不写spark代码，用最简单的配置，迅速跑起来流式streaming或离线处理spark程序，大家可以玩一玩。它有丰富的数据输入，输出插件，比如kafka, elasticsearch, mongodb, mysql, hdfs, hive，clickhouse，还可以直接用sql做数据处理。如果觉得功能不够还可以开发自己的插件，挺方便的。

项目地址：https://github.com/InterestingLab/waterdrop

这里有一个基于Spark的项目，可以让我们不写spark代码，用最简单的配置，迅速跑起来流式streaming或离线处理spark程序，大家可以玩一玩。它有丰富的数据输入，输出插件，比如kafka, elasticsearch, mongodb, mysql, hdfs, hive，clickhouse，还可以直接用sql做数据处理。如果觉得功能不够还可以开发自己的插件，挺方便的。目前有微博，新浪，永辉超市等多家公司在线上使用。
项目地址：https://github.com/InterestingLab/waterdrop
文档地址：https://interestinglab.github.io/waterdrop/

猜你喜欢

转载自blog.csdn.net/xsjzdrxsjzdr/article/details/84981904

容器化大数据

云计算与大数据-虚拟化与容器技术题库

字节跳动大数据容器化构建与落地实践

又卡了，大数据平台容器化运维走起

【华为云技术分享】大数据容器化，头部玩家尝到了甜头

docker容器与大数据组件的冲突点

openstack stein 部署大数据容器及prometheus

docker容器数据持久化

提升60%基础资源利用率！中国联通的容器化大数据平台实践

一键部署容器化版本，助力开发者快速试用WeDataSphere开源大数据平台套件

容器化云原生大数据平台什么样？智领云KDP给你打个样儿

大数据与可视化

大数据之数据可视化

大数据系列11：Gora – 大数据持久化

Docker容器虚拟化（四）：容器数据卷与DockerFile

docker镜像和容器数据持久化

Docker数据持久化与容器迁移

Docker 容器实现数据持久化

【Docker存储】Docker容器的数据持久化

数据容器化：如何降低企业IT成本？

Docker容器数据持久化存储机制

华为云OBS：让大数据的容器再无容量限制

大数据可视化的最新动态

大数据的可视化诠释

大数据和虚拟化结合是方向

现代化养猪——养殖大数据

pickle对大数据序列化

大数据——个性化推荐系统

DataEye助力大数据可视化

大数据可视化技术栈

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)