分布式系统设计中的一大挑战,是对磁盘的均衡使用,这在一个全新的集群中,是比较容易实现的。关键问题在于,随着时间的推移,我们需要在集群中不断地新增或者移除设备,在分布式文件存储系统YRCLoudFile产品中,我们可能会使用冷热分层策略将文件下刷至对象存储,这些行为都可能会导致集群内的磁盘使用不均,从而产生访问热点、资源利用率低等问题。数据分布算法决定了磁盘均衡的最终效果,一个良好的分布策略,往往需要完成数据分布均匀的基本目标,同时在此基础上兼顾节点异构和故障域隔离。节点异构——存储节点间的容量或性能差异故障域隔离——例如不同数据中心、机房、机柜、交换机、机器等,均可以组成一个故障域,尽量使主备