流分组: spout和bolt通讯的方式成为流分组。
意义: 便于同性质的数据放在一起
流分组类型:如下三种常用
1 Shuffle Grouping: 随机分组,随机发送tuple保证每个bolt接收,
每个bolt内的executor内接受到的tuple数目相同,实现负载均衡
2 Fields Grouping: 按字段分组,eg:userid分组,具有相同userid的tuple分到相同的Bolt
扫描二维码关注公众号,回复:
515092 查看本文章
3 All Grouping: 全局分组,