mapr

hadoop - 在 MapR 集群之间切换

我在mapr-clusters.conf中指定了两个集群cluster1secure=truecldb1:7222cldb2:7222cldb3:7222cluster2secure=truecldb4:7222cldb5:7222cldb6:7222在某些情况下，我想将数据加载到cluster1中。在其他场合，我想在cluster2中加载数据。默认情况下，MapR客户端将第一个指定为默认客户端。如何告诉MapR客户端使用第二个指定的集群？这样hadoopfs-put目标集群2？最佳答案通常，MapR支持HDFSAPI的/map

hadoop - org.apache.hadoop.mapred.Mapper 中的 'key K1' 有什么用？

我正在学习ApacheHadoop并且正在查看WordCount示例org.apache.hadoop.examples.WordCount.我已经理解这个例子，但是我可以看到变量LongWritablekey没有在中使用(...)publicvoidmap(LongWritablekey,Textvalue,OutputCollectoroutput,Reporterreporter)throwsIOException{Stringline=value.toString();StringTokenizeritr=newStringTokenizer(line);while(itr.h

hadoop amp section apache mapreduce

java - 即使在命令行上告诉为 -D mapred.reduce.tasks=0 后，hadoop reduce 任务仍在运行

我有一个MapReduce编程为publicstaticclassMapClassextendsMapReduceBaseimplementsMapper{privatefinalstaticIntWritableuno=newIntWritable(1);privateIntWritablecitationCount=newIntWritable();publicvoidmap(Textkey,Textvalue,OutputCollectoroutput,Reporterreporter)throwsIOException{citationCount.set(Integer.par

上告 reduce IntWritable JobClient java hadoop mapreduce

xml - 改变 mapred.reduce.tasks

我应该在哪个文件中设置reducer的数量和设置mapred.reduce.tasks参数？我的conf文件夹中只有以下文件，没有一个有这个参数:ubuntu@group-3-vm1:~/conf$lscapacity-scheduler.xmlhdfs-site.xmlmapred-site.xmlyarn-site.xmlcore-site.xmlhive-site.xmltez-site.xml 最佳答案所有Hadoop配置属性都分为以下几组。Hadoop-1.X.X:核心-core-site.xmlhdfs-hdfs-si

mapred reduce site xml section hadoop mapreduce hive hdfs

java - 在 MAPR 中找不到 Hadoop FS API 文件问题

我在运行hadoopfsapi删除目录时遇到问题。即使我有适当的配置，程序也会抛出异常。需要帮助解决问题。我正在使用下面的maven依赖项hadoop-common2.4.1-mapr-1408hadoop-核心2.4.1-mapr-1408hadoop客户端2.7.1repo:http://repository.mapr.com/maven/packagecom.cisco.installbase.hiveconnector;importjava.io.IOException;importorg.apache.hadoop.conf.Configuration;importorg.a

Hadoop java apache maven hdfs

hadoop - 避免用户覆盖 hadoop 2 中的默认 mapred 属性

如何避免用户在提交hive作业时覆盖hadoop配置文件的默认属性？例子:mapred-site.xml:mapreduce.job.heap.memory-mb.ratio0.8用户在配置单元作业中使用以下属性来覆盖setmapreduce.job.heap.memory-mb.ratio=0.9 最佳答案来自Hadoopdocumentation:Configurationparametersmaybedeclaredfinal.Oncearesourcedeclaresavaluefinal,nosubsequently-l

hadoop mapred code section hive hbase hive-configuration

hadoop - 从SVN “no namenode to stop”通过Hadoop替换mapred/hdfs/common jar构建后

我从中checkout源代码http://svn.apache.org/repos/asf/hadoop/commonhttp://svn.apache.org/repos/asf/hadoop/hdfshttp://svn.apache.org/repos/asf/hadoop/mapreduce并得到hadoop-mapred-0.23.0-SNAPSHOT.jarhadoop-hdfs-0.23.0-SNAPSHOT.jarhadoop-common-0.23.0-SNAPSHOT.jar但是我无法使用这些jar启动all.sh...Jobtracker和tasktracker启

namenode hadoop apache java

hadoop - 如何为 Hadoop 启动 mapred？

我在三台虚拟CentOS6.2上搭建了Hadoop测试环境。一切顺利，但start-mapred。我总是得到的是:2012-02-0319:54:17,592警告org.apache.hadoop.mapred.JobTracker:无法初始化恢复管理器。org.apache.hadoop.ipc.RemoteException:java.io.IOException:文件/home/hadoop/devx/var/tmp/mapred/system/jobtracker.info可以只被复制到0个节点，而不是1并且我检查了名称节点和数据节点上的nameSpaceID，它们是相同的。我

何为 hadoop section mapred

hadoop - 有人在 hadoop 流媒体作业中使用过 mapred.job.tracker=local 吗？

在过去的几周里，我们每天都使用hadoopstreaming来计算一些报告。最近我们对我们的程序进行了更改，如果输入大小小于10MB，我们将在JobConf中设置mapred.job.tracker=local，然后作业将在本地运行。但是昨晚，许多作业都失败了，runningJob.getJobState()返回了状态3。我不知道为什么，stderr里什么也没有。我无法用谷歌搜索与此问题相关的任何内容。所以我想知道我是否应该在生产模式下使用mapred.job.tracker=local？也许它只是hadoop提供的开发中的调试解决方案。有人知道吗？任何信息，任何信息，谢谢。

流媒 hadoop section mapred streaming local

windows - mapred.JobClient : Error reading task output http:. .. 在 Windows 操作系统上从 Cygwin 运行 hadoop 时

我在Windows上运行来自Cygwin的“MahoutinAction”一书中的“从文档生成向量”样本。Hadoop仅在本地计算机上启动。下面是我的运行命令:$bin/mahoutseq2sparse-ireuters-seqfiles/-oreuters-vectors-ow但是下面显示java.io.IOException，有谁知道这个问题是什么原因造成的？提前致谢!Runningonhadoop,usingHADOOP_HOME=my_hadoop_pathHADOOP_CONF_DIR=my_hadoop_conf_path13/05/1318:38:03WARNdriver

JobClient windows hadoop mapred INFO cygwin mahout

4 5 678 9 10