草庐IT

start-mapred

全部标签

hadoop - 避免用户覆盖 hadoop 2 中的默认 mapred 属性

如何避免用户在提交hive作业时覆盖hadoop配置文件的默认属性?例子:mapred-site.xml:mapreduce.job.heap.memory-mb.ratio0.8用户在配置单元作业中使用以下属性来覆盖setmapreduce.job.heap.memory-mb.ratio=0.9 最佳答案 来自Hadoopdocumentation:Configurationparametersmaybedeclaredfinal.Oncearesourcedeclaresavaluefinal,nosubsequently-l

java - Hadoop:TaskTracker 和 JobTracker 不以 start-dfs.sh 开头

我正在尝试使用此链接在我的笔记本电脑上设置hadoop0.22.0以用于学习目的http://www.michael-noll.com/tutorials/running-hadoop-on-ubuntu-linux-single-node-cluster/当我运行脚本start-dfs.sh时,这是输出startingnamenode,loggingto/usr/local/hadoop/bin/../logs/hadoop-raunak-namenode-ubuntu.outlocalhost:startingdatanode,loggingto/usr/local/hadoop/

hadoop - 从SVN “no namenode to stop”通过Hadoop替换mapred/hdfs/common jar构建后

我从中checkout源代码http://svn.apache.org/repos/asf/hadoop/commonhttp://svn.apache.org/repos/asf/hadoop/hdfshttp://svn.apache.org/repos/asf/hadoop/mapreduce并得到hadoop-mapred-0.23.0-SNAPSHOT.jarhadoop-hdfs-0.23.0-SNAPSHOT.jarhadoop-common-0.23.0-SNAPSHOT.jar但是我无法使用这些jar启动all.sh...Jobtracker和tasktracker启

hadoop - 如何为 Hadoop 启动 mapred?

我在三台虚拟CentOS6.2上搭建了Hadoop测试环境。一切顺利,但start-mapred。我总是得到的是:2012-02-0319:54:17,592警告org.apache.hadoop.mapred.JobTracker:无法初始化恢复管理器。org.apache.hadoop.ipc.RemoteException:java.io.IOException:文件/home/hadoop/devx/var/tmp/mapred/system/jobtracker.info可以只被复制到0个节点,而不是1并且我检查了名称节点和数据节点上的nameSpaceID,它们是相同的。我

hadoop - 使用 start-all.sh 启动 Hadoop 时出错

使用strat-all.sh启动Hadoop时出现如下错误:2012-06-2819:51:56,655FATALorg.apache.hadoop.mapred.JobTracker:java.lang.IllegalArgumentException:Doesnotcontainavalidhost:portauthority:localhost:54311atorg.apache.hadoop.net.NetUtils.createSocketAddr(NetUtils.java:147)atorg.apache.hadoop.net.NetUtils.createSocketA

hadoop - 有人在 hadoop 流媒体作业中使用过 mapred.job.tracker=local 吗?

在过去的几周里,我们每天都使用hadoopstreaming来计算一些报告。最近我们对我们的程序进行了更改,如果输入大小小于10MB,我们将在JobConf中设置mapred.job.tracker=local,然后作业将在本地运行。但是昨晚,许多作业都失败了,runningJob.getJobState()返回了状态3。我不知道为什么,stderr里什么也没有。我无法用谷歌搜索与此问题相关的任何内容。所以我想知道我是否应该在生产模式下使用mapred.job.tracker=local?也许它只是hadoop提供的开发中的调试解决方案。有人知道吗?任何信息,任何信息,谢谢。

windows - mapred.JobClient : Error reading task output http:. .. 在 Windows 操作系统上从 Cygwin 运行 hadoop 时

我在Windows上运行来自Cygwin的“MahoutinAction”一书中的“从文档生成向量”样本。Hadoop仅在本地计算机上启动。下面是我的运行命令:$bin/mahoutseq2sparse-ireuters-seqfiles/-oreuters-vectors-ow但是下面显示java.io.IOException,有谁知道这个问题是什么原因造成的?提前致谢!Runningonhadoop,usingHADOOP_HOME=my_hadoop_pathHADOOP_CONF_DIR=my_hadoop_conf_path13/05/1318:38:03WARNdriver

python - 使用 python 流解析从 org.apache.avro.mapred.AvroAsTextInputFormat 生成的 json 字符串

在使用python读取avro数据文件的hadoop流中,我使用的是输入格式,文档说输入键是JSON中的字符串表示。-inputformatorg.apache.avro.mapred.AvroAsTextInputFormat映射器将其作为行输入获取:line="{u'three':u'3',u'two':u'2',u'one':u'1'}"我如何解析这个字符串,以获得键值对? 最佳答案 我想这就是你需要的:>>>line="{u'three':u'3',u'two':u'2',u'one':u'1'}">>>line"{u'th

hadoop - YARN ResourceTrackerService 在 STARTED 状态下失败

我正在尝试在共享磁盘上具有HadoopDirectory的几台机器上设置hadoop集群。HDFS运行良好。但是当我尝试启动YARN时,ResourceTracker抛出BindException。ResourceTracker配置运行的节点(ahti.d.umn.edu-131.212.41.9)可以访问(我可以通过SSH连接到它)并且端口(28025)也已打开。org.apache.hadoop.yarn.server.resourcemanager.ResourceTrackerServicefailedinstateSTARTED;cause:org.apache.hadoop

hadoop - MapR 配置单元未检测到显示无效 URL 错误的 maprfs :///scheme,

我将mapRHive1.2与Hadoop2.7.0结合使用。尝试运行以下命令时:addjarmaprfs:///user/john/customSerde.jar我收到以下错误:invalidurl:maprfs:///user/john/customSerde.jar,expecting(file|hdfs|ivy)asurlscheme.Queryreturnednon-zerocode:1,cause:invalidurl:maprfs:///user/john/customSerde.jar,expecting(file|hdfs|ivy)asurlscheme.它根本无法检测