ClickHouse为什么不往分布式表直接写数据

参考博客
https://segmentfault.com/a/1190000037480509
https://blog.csdn.net/ashic/article/details/108725437

简单总结一下原因

  1. Distributed表在写入时会在本地节点生成临时数据,会产生写放大,所以会对CPU及内存造成一些额外消耗,建议尽量少使用Distributed表进行写操作;
  2. Distributed表写的临时block会把原始block根据sharding_key和weight进行再次拆分,会产生更多的block分发到远端节点,也增加了merge的负担;

猜你喜欢

转载自blog.csdn.net/wenyichuan/article/details/114019734