草庐IT

apache - hadoop.mapred vs hadoop.mapreduce?

为什么在Apache的hadoop包树中有两个独立的包map-reduce包:org.apache.hadoop.mapredhttp://javasourcecode.org/html/open-source/hadoop/hadoop-1.0.3/org/apache/hadoop/mapred/org.apache.hadoop.mapreducehttp://javasourcecode.org/html/open-source/hadoop/hadoop-1.0.3/org/apache/hadoop/mapreduce/为什么要分开呢?是否有说明这一点的文档?

hadoop - 使用 mapred 或 mapreduce 包来创建 Hadoop 作业哪个更好?

要创建MapReduce作业,您可以使用旧的org.apache.hadoop.mapred包或更新的org.apache.hadoop.mapreduce包用于Mappers和Reducers,乔布斯……第一个被标记为已弃用,但同时又被恢复了。现在我想知道使用旧的mapred包还是新的mapreduce包来创建作业更好,为什么。还是仅仅取决于您是否需要像MultipleTextOutputFormat这样的东西,它只在旧的mapred包中可用? 最佳答案 在功能方面,旧的(o.a.h.mapred)和新的(o.a.h.mapred

apache - Apache Hadoop YARN 中的 'mapreduce.map.memory.mb' 和 'mapred.map.child.java.opts' 是什么关系?

我想知道mapreduce.map.memory.mb和mapred.map.child.java.opts参数之间的关系。mapreduce.map.memory.mb>mapred.map.child.java.opts? 最佳答案 ma​​preduce.map.memory.mb是Hadoop允许分配给映射器的内存上限,以兆字节为单位。默认值为512。如果超过此限制,Hadoop将终止映射器并显示如下错误:Container[pid=container_1406552545451_0009_01_000002,contain