1、介绍:
1.1、介绍:
StreamSets数据操作平台是唯一旨在简化如何构建,执行和操作企业数据流的平台。构建在开源核心上,开发人员可以轻松构建批处理和流式数据流,而且代码少,而运营商使用云本地产品将数十或数百个数据流聚合到拓扑中,并通过实时可见性和性能控制集中管理。
其对数据流采用pipeline方式进行处理,源端数据可以来自多个组件,kafka,directory,mysql,redis等,pipeline的destination也可以有丰富的终端组件,kafka,directory,mysql,redis,hdfs等,中间处理节点也有很多丰富的节点
1.2、官网地址:https://streamsets.com/
2、安装: ——本文介绍最方便快捷的docker安装!
2.1、docker环境
没有docker环境的,请参考 https://blog.csdn.net/qq_18769269/article/details/80618823
2.2、启动
有了环境以后,一条命令,连下载镜像带启动,一气呵成~
docker run --restart on-failure -p 18630:18630 -d --name streamsets-dc streamsets/datacollector
2.3、访问登录
在浏览器输入: ip:18630
用户名: admin
密码 : admin