草庐IT

ClickHouse分布式表的使用

背景当数据量剧增的时候,clickhouse是采用分片的方式进行数据的存储的,类似于redis集群的实现方式。然后想进行统一的查询的时候,因为涉及到多个本地表,可以通过分布式表的方式来提供统一的入口。分布式表的写入听了很多大厂的分享,专家的讲解,都是建议不要直接写分布式表,大厂毕竟是大厂,基于大厂的数据量这样是合理的。凡事都要结合实际,结合自己的业务场景。就像我们一天的数据量可能不到TB级别,整个clickhouse的机器规模不过6台,所以我们决定,还是直接写分布式表,如果性能真的出了问题,再改由写入本地表的方式。官方的建议最优方案也是写本地表,查询分布式表。对于分布式表的INSERT,数据块