我有一个小型集群,其中一个节点具有RAID存储,以及几个功能强大的无盘计算节点,这些节点通过PXE启动。所有节点都通过InfiniBand连接(以及用于引导的1G以太网)。我需要在这个集群上部署Hadoop。请建议最佳配置据我所知,默认配置意味着所有计算节点都有自己的小存储,但在我的情况下(如果我有NFS共享)它会通过网络制作太多副本。我找到了有关将Hadoop与Lustre结合使用的资源,但我不明白如何配置它 最佳答案 您所描述的可能是可行的,但您没有使用Hadoop功能,而是试图找到解决它们的方法。移动计算比移动数据便宜-数据局