我正在评估各种系统监控工具,以便使用其中一个来监控我的hadoop集群。我印象深刻的工具之一是collectl。几天以来我一直在研究它。我正在努力寻找如何在使用colmux时聚合collectl捕获的指标?比如说,我的hadoop集群中有10个节点,每个节点都将collectl作为服务运行。使用colmux我可以看到单个View中每个节点的性能指标(单行和多行格式)。太棒了!但是,如果我正在考虑集群中所有节点上的CPU、IO等聚合,该怎么办?那就是我要找的通过将每个节点的性能指标聚合到相应的集群中,我的集群整体表现如何数字,从而为我提供集群级指标而不是节点级指标。非常感谢任何帮助。谢谢