新一代流式计算平台Apache Heron专题【更新】

声明:均为原创文章,转载请注明出处!

Heron相关基础概念

本地及集群环境搭建

Heron单节点环境为单机环境中的配置过程,高可用集群环境配置使用了Aurora+Mesos+Zookeeper+HDFS的真实可用的Heron流式计算环境。

基础过程

整体搭建过程

部分详细内容

高可用节点中将Heron配置在了Apache Mesos中配合Aurora进行运行。Heron使用Zookeeper作为State Manager,这里为Zookeeper多节点集群的搭建方式,用于在大规模集群中使用,也可以简化为一个zookeeper节点部署在Master主机中。Heron使用了Aurora Scheduler作为任务调度器,这里的重点问题是,如何将aurora和mesos集群进行集成,以正常使用aurora-scheduler。同时,这里作为heron的调度器,也是之后研究的内容。此外,Heron使用HDFS作为Uploader,因此,需要在集群中的各个节点上安装配置HDFS环境。

集群扩充配置

集群部署及更改记录(个人)

集群运行详情

Heron in IntelliJ IDEA

基础过程及尝试

Heron-get-start Project

这里使用IntelliJ IDEA作为Heron拓扑的开发IDE,并提供一个简单的开始项目,介绍如何使用Heron编写自己的流式作业拓扑并提交至Heron中运行。

Topology运行调试

集群运行命令总结

资源监测与可视化

Streaming Benchmark for Heron

部署基础过程:

流式计算组件集成:

调度机制及任务分配算法解析

  • Heron调度机制源码解析(待完成)
  • RoundRobin Packing Algorithm解析
  • RoundRobin Comparison Algorithm解析
  • First Fit Decreasing Packing Algorithm解析

学术论文资源

Heron相关原始论文:

  • Twitter Heron: Stream Processing at Scale
  • Streaming@Twitter
  • Twitter Heron: Towards Extensible Streaming Engines

我的论文:

异常及问题记录

1. 集群环境搭建

Stack Overflow相关问题及解答:

2. 拓扑提交运行

3. Heron streaming benchmark

主要参考资料

发布了296 篇原创文章 · 获赞 35 · 访问量 2万+

猜你喜欢

转载自blog.csdn.net/yitian_z/article/details/102961885