répartition des étincelles
Description du problème: le
streaming consomme plusieurs rubriques , mais le volume de données de chaque partition de rubriques différentes est très différent, plus qu'un ordre de grandeur. La quantité de données consommée par chaque tâche est différente,
ce qui entraîne une grave asymétrie des données. Par conséquent, une répartition est nécessaire pour rendre le traitement plus uniforme.
[Transfert depuis: https://www.jianshu.com/p/9690f5bcd950
Auteur: pcqlegend
Lien: https://www.jianshu.com/p/9690f5bcd950
Source: Brief Book]