home_dir

linux - 安装和获取当前的 dfs.name.dir 和 dfs.data.dir 值

我没有在hdfs-site.xml文件中设置dfs.name.dir和dfs.data.dir值没有设置。他们会怎样？有趣的是，他们默认接受什么值？(如何接收他们的当前值？) 最佳答案 dfs.name.dir的默认值为${hadoop.tmp.dir}/dfs/data和dfs.data.dir是${hadoop.tmp.dir}/dfs/data。如果hadoop.tmp.dir的值未使用-D选项或配置文件设置，则默认值为/tmp/hadoop-${user.name}user.name是您用来登录系统的用户名。对于所有默认值，

windows - 在 Windows 中设置 HADOOP_HOME 变量

我正在尝试在我的Windows8中将Spark与Hadoop一起使用。但是无论我的代码是什么，我都会收到此错误:15/08/2519:29:58ERRORShell:Failedtolocatethewinutilsbinaryinthehadoopbinarypathjava.io.IOException:Couldnotlocateexecutablenull\bin\winutils.exeintheHadoopbinaries.atorg.apache.hadoop.util.Shell.getQualifiedBinPath(Shell.java:355)atorg.apac

中设 HADOOP_HOME apache java hadoop windows

hadoop - hadoop.tmp.dir 到底应该设置在哪里？ core-site.xml 还是 hdfs-site.xml？

我问的是Hadoop2.x系列。互联网上对此有相互矛盾的建议。喜欢这个case他要求在core-site.xml和这个SOanswer中指定它其中提到hadoop.tmp.dir设置在hdfs-site.xml中。应该放在哪个位置？最佳答案 hadoop.tmp.dir(Abaseforothertemporarydirectories)属性，需要在core-site.xml中设置，就像exportinLinux例如:dfs.namenode.name.dirfile://${hadoop.tmp.dir}/dfs/name您可以

hadoop site code section configuration hdfs configuration-files

java - 无法构建 piggybank ->/home/build/ivy/lib 不存在

嘿，我按照这里的步骤操作:http://wiki.apache.org/pig/PiggyBank构建存钱jar，但我不断得到下面的输出。我还从源代码构建了pig项目，并在我的.bash_profile中引用了它:cloudera@cloudera-demo:~/piggybank/java$./makepiggy.shBuildfile:/home/cloudera/piggybank/java/build.xmldownload-hive-deps:init:compile:[echo]***CompilingPigUDFs***[javac]/home/cloudera/pigg

piggybank build section cloudera java hadoop apache-pig

java - 基于HADOOP_HOME自动加载HDFS Configuration？

我正在开发一个Java程序来与已经运行的hadoop集群交互。该程序已将HADOOP_HOME作为环境变量传递给它。基于这个值，我需要在开始与HDFS/MapReduce交互之前加载所有必要的配置资源。我认为我需要的文件基于apachedocumentation.我当前的解决方案如下所示:finalStringHADOOP_HOME=System.getEnv("HADOOP_HOME");Configurationconf=newConfiguration();conf.addResource(newPath(HADOOP_HOME,"src/core/core-default.xm

Configuration HADOOP_HOME HADOOP section java hdfs

hadoop - 水槽的 Spool Dir 可以在远程机器上吗？

每当新文件到达特定文件夹时，我都试图从远程机器获取文件到我的hdfs。我在flume中遇到了spooldir的概念，如果spooldir在运行flumeagent的同一台机器上，它工作正常。有什么方法可以在远程机器上配置假脱机目录吗？？请帮忙。最佳答案您可能知道flume可以产生多个实例，即您可以安装多个flume实例，这些实例在它们之间传递数据。所以回答你的问题:不，水槽不能访问远程假脱机目录。但是你可以安装两个代理，一个在有spool目录的机器上，一个在hadoop节点上。第一个将从假脱机中读取并通过avrorpc将其传递给

水槽 hadoop section flume hdfs bigdata spool

hadoop - 找不到 hadoop 安装 : $HADOOP_HOME must be set or hadoop must be in the path

所以有点背景。我一直在尝试在CentOS6机器上设置Hive。我按照这个Youtube视频的说明操作:http://www.youtube.com/watch?v=L2lSrHsRpOI就我而言，我使用的是Hadoop-1.1.2和Hive0.9.0，本视频中所有标有“mnt”的目录我都将其替换为“opt”，因为这是我所有的hadoop和hive包的位置被打开了。当我到达视频中实际上应该通过“./hive”运行Hive的部分时弹出此错误:"Cannotfindhadoopinstallation:$HADOOP_HOMEmustbesetorhadoopmustbeinthepath"

hadoop must section HADOOP_HOME installation hive

java - APACHE HADOOP 版本 2.8.0 的 HADOOP_HOME 和 PIG_CLASSPATH 的正确值是多少？

我在从PIG命令行执行Hadoop命令时遇到问题。命令和错误堆栈在下面我的导师怀疑这是因为HADDOP_HOME和PIG_CLASSPATH不正确。我使用的是HADOOP2.8.0版。所以，最初我有HADOOP_HOME作为HADOOP_HOME=/hadoop/2.8.0/然后我切换了以下设置:HADOOP_HOME=/hadoop/2.8.0/libexec/etc/hadoopPIG_CLASSPATH定义为$HADOOP_HOME我在pig中使用的命令:A=LOAD'/Users/anarinsky/Downloads/loaddata1.txt';B=MAPREDUCE'/U

HADOOP PIG_CLASSPATH apache code java apache-pig

Hadoop 将 HADOOP_HOME 正确设置为 bin/hadoop 它会给出未找到的命令

安装hadoop并将HADOOP_HOME设置为/usr/local/hadoop/bin/hadoop后，当通过在终端中键入hadoop运行hadoop时，它说我没有权限。然后我尝试用sudo运行它然后它说，sudo:commandnotfound 最佳答案 HADOOP_HOME应该指向/usr/local/hadoop。如果您只想在终端中输入hadoop，您必须将它添加到全局路径变量中。为此，在/home/hadoopuser/.bashrc中添加以下行:exportHADOOP_HOME=/usr/local/hadoope

HADOOP_HOME Hadoop code section

hadoop - 无法创建目录/home/hadoop/hadoopinfra/hdfs/namenode/current

我得到了错误Cannotcreatedirectory/home/hadoop/hadoopinfra/hdfs/namenode/current尝试在本地Mac上安装hadoop时。这可能是什么原因？仅供引用，我将我的xml文件放在下面:mapred-site.xml:mapreduce.framework.nameyarnhdfs-site.xml:dfs.replication1dfs.name.dirfile:///home/hadoop/hadoopinfra/hdfs/namenodedfs.data.dirfile:///home/hadoop/hadoopinfra/h

hadoop hadoopinfra gt lt property hdfs

19 20 212223 24 25