草庐IT

mapred-site

全部标签

java - 在 MAPR 中找不到 Hadoop FS API 文件问题

我在运行hadoopfsapi删除目录时遇到问题。即使我有适当的配置,程序也会抛出异常。需要帮助解决问题。我正在使用下面的maven依赖项hadoop-common2.4.1-mapr-1408hadoop-核心2.4.1-mapr-1408hadoop客户端2.7.1repo:http://repository.mapr.com/maven/packagecom.cisco.installbase.hiveconnector;importjava.io.IOException;importorg.apache.hadoop.conf.Configuration;importorg.a

hadoop - 避免用户覆盖 hadoop 2 中的默认 mapred 属性

如何避免用户在提交hive作业时覆盖hadoop配置文件的默认属性?例子:mapred-site.xml:mapreduce.job.heap.memory-mb.ratio0.8用户在配置单元作业中使用以下属性来覆盖setmapreduce.job.heap.memory-mb.ratio=0.9 最佳答案 来自Hadoopdocumentation:Configurationparametersmaybedeclaredfinal.Oncearesourcedeclaresavaluefinal,nosubsequently-l

hadoop 权限问题 (hdfs-site.xml dfs.permissions.enabled)

我最近在我的机器上安装了Hadoop。我有权限问题。我以用户rahul身份登录并尝试在HDFS中创建目录(hdfsdfs-mkdir/rahul_workspace)。但它给了我一个错误Permissiondenied:user=Rahul,access=WRITE,inode="/user":hdfs:hdfs:drwxr-xr-x。在Google上快速搜索此错误会导致许多响应建议通过将hdfs-site.xml中的dfs.permissions属性设置为false来禁用权限检查的解决方法。现在我可以在HDFS中创建目录。将上述属性设置为false后,我可以访问所有其他hadoop服

hadoop - 从SVN “no namenode to stop”通过Hadoop替换mapred/hdfs/common jar构建后

我从中checkout源代码http://svn.apache.org/repos/asf/hadoop/commonhttp://svn.apache.org/repos/asf/hadoop/hdfshttp://svn.apache.org/repos/asf/hadoop/mapreduce并得到hadoop-mapred-0.23.0-SNAPSHOT.jarhadoop-hdfs-0.23.0-SNAPSHOT.jarhadoop-common-0.23.0-SNAPSHOT.jar但是我无法使用这些jar启动all.sh...Jobtracker和tasktracker启

hadoop - 如何为 Hadoop 启动 mapred?

我在三台虚拟CentOS6.2上搭建了Hadoop测试环境。一切顺利,但start-mapred。我总是得到的是:2012-02-0319:54:17,592警告org.apache.hadoop.mapred.JobTracker:无法初始化恢复管理器。org.apache.hadoop.ipc.RemoteException:java.io.IOException:文件/home/hadoop/devx/var/tmp/mapred/system/jobtracker.info可以只被复制到0个节点,而不是1并且我检查了名称节点和数据节点上的nameSpaceID,它们是相同的。我

hadoop - 有人在 hadoop 流媒体作业中使用过 mapred.job.tracker=local 吗?

在过去的几周里,我们每天都使用hadoopstreaming来计算一些报告。最近我们对我们的程序进行了更改,如果输入大小小于10MB,我们将在JobConf中设置mapred.job.tracker=local,然后作业将在本地运行。但是昨晚,许多作业都失败了,runningJob.getJobState()返回了状态3。我不知道为什么,stderr里什么也没有。我无法用谷歌搜索与此问题相关的任何内容。所以我想知道我是否应该在生产模式下使用mapred.job.tracker=local?也许它只是hadoop提供的开发中的调试解决方案。有人知道吗?任何信息,任何信息,谢谢。

windows - mapred.JobClient : Error reading task output http:. .. 在 Windows 操作系统上从 Cygwin 运行 hadoop 时

我在Windows上运行来自Cygwin的“MahoutinAction”一书中的“从文档生成向量”样本。Hadoop仅在本地计算机上启动。下面是我的运行命令:$bin/mahoutseq2sparse-ireuters-seqfiles/-oreuters-vectors-ow但是下面显示java.io.IOException,有谁知道这个问题是什么原因造成的?提前致谢!Runningonhadoop,usingHADOOP_HOME=my_hadoop_pathHADOOP_CONF_DIR=my_hadoop_conf_path13/05/1318:38:03WARNdriver

hadoop - hive-site.xml 被 hive 忽略

我的hive-site.xml包含mysql的Metastore详细信息,我试图通过oozie将它传递给hive,但由于某种原因它忽略了它。它仍在尝试使用derby连接Metastore。我正在尝试了解如何指定我的hive-site.xml。如果我使用命令行客户端,那么mysql数据库将用作元存储,我可以在TBLS下的mysql中看到hive创建的表。如果我通过oozie将其作为工作流运行,它会尝试连接到derbyMetastore。Herearetwolinesfromlog.6649[main]INFODataNucleus.Persistence-DataNucleusPersi

hadoop - hive-site.xml 中的 hive.cli.print.current.db 停止工作

我曾经在$HIVE_HOME/conf/hive-site.xml中将hive.cli.print.current.db设置为true,以便在配置单元提示符中自动显示数据库名称。此配置最近停止工作,因此每次启动配置单元时我都必须手动设置它的值。有没有人遇到过同样的问题,你的解决方案是什么?谢谢! 最佳答案 此属性应在配置单元配置目录(/etc/hive/conf)的.hiverc文件中指定(而不是在hive-site.xml中)。创建文件/.hiverc如果不存在以下内容sethive.cli.print.current.db=tr

hadoop - 使用 cloudera 管理器部署 hdfs core-site.xml

我正在尝试使用cloudera管理器(CDH5b2)将lzo支持添加到我的配置文件中。如果我将io.compression.codecs添加到服务范围的hdfs配置中,并部署配置文件,/etc/hadoop/conf.cloudera.hdfs/core-site.xml现在包含新值。但是,/etc/hadoop/conf.cloudera.yarn/core-site.xml有更高的优先级(update-alternatives--displayhadoop-conf),当我开始MR作业时,不使用hdfscore-site.xml值。显然,我可以简单地手动修改yarncore-sit