草庐IT

hadoop - Gridmix 使所有工作失败

我正在尝试在Hadoop(2.6.1)上运行Gridmix我能够在yarn上运行mapreduce作业并运行Rumen来提取轨迹进行模拟,但是我无法完成最后一步并运行gridmix。如果我检查日志,我发现了一个错误:{"org.apache.hadoop.mapreduce.jobhistory.TaskAttemptUnsuccessfulCompletion"{"taskid":"task_1449829849459_0042_m_000000","taskType":"MAP","attemptId":"attempt_1449829849459_0042_m_000000_0"

hadoop - Rumen 的 sample 输出或 Gridmix 的 sample 输入

我对使用Hadoop等大数据工具还很陌生。我想在Yarn/或YarnSimulator上执行公开可用的集群跟踪(https://github.com/google/cluster-data)。一种方法是通过Gridmix将输入馈送到Yarn。Gridmix(https://hadoop.apache.org/docs/r2.8.3/hadoop-gridmix/GridMix.html)接受输入的格式基本上是Rumen的输出。Rumen(https://hadoop.apache.org/docs/r2.8.3/hadoop-rumen/Rumen.html)将从map-reduce集