home_dir

java - Pydoop Java home not set 安装问题

当我回显$JAVA_HOME时，我得到了Java的路径。Hadoop也在运行，但是pydoop安装由于这个错误而失败。Traceback(mostrecentcalllast):File"setup.py",line54,inraiseRuntimeError("javahomenotfound,trysettingJAVA_HOME")RuntimeError:javahomenotfound,trysettingJAVA_HOME我使用sudopythonsetup.pyinstall--skip-build运行设置命令。作为非root用户收到此错误运行安装运行安装库创建/usr/

hadoop - 失败后hadoop namenode dirs是否同步？

在这种情况下会发生什么:Namenode正在写入两个不同驱动器上的两个目录，一个是本地的，另一个(远程)是mounted。现在，namenode失败了，我们在远程机器上启动namenode进程(它有原始namenode数据的副本，所以它是安全的)并更改所有datanodes上的namenode的ip。一段时间后，我们设法使原来的名称节点与之前的配置完全一致。我们停止远程机器上的名称节点进程。现在，本地fs.name.dir是否会与挂载的同步(我的意思是在挂载目录上累积的差异，而原始名称节点已关闭)还是名称节点数据一致性会出现问题？最佳答案

hadoop namenode section blockquote backup redundancy

windows - 映射减少错误 : Failed to setup local dir

我在Windows8上安装的hadoop上运行mapreducewordcount示例。我收到如下错误。这听起来像是一个安全许可问题。但我不太确定。我在yarn-site.xml文件中添加了一个属性yarn.nodemanager.local-dirsc:\hadoop\tmp-nm任何想法都会很有帮助!15/07/1511:01:54INFOclient.RMProxy:ConnectingtoResourceManagerat/0.0.0.0:803215/07/1511:01:55WARNmapreduce.JobResourceUploader:Hadoopcommand-li

windows Failed 1436976054610 mapreduce application hadoop

java - $HADOOP_COMMON_HOME 和 $HADOOP_HDFS_HOME 是同一个值吗？

我知道$HADOOP_COMMON_HOME应该设置为Hadoop目录的根路径，但是$HADOOP_HDFS_HOME的值是多少？同一个？它的值应该是多少？最佳答案他们不一样..hadoop发行版中有三个主要的子项目:1)hadoop-common-mapreduce和hdfs使用的通用功能，如IPC..2)hadoop-mapred-mapreduce框架jar3)hadoop-hdfs-hdfs分布式文件系统jar它们每个都在不同的目录中。所以在你提取那些子项目之后，设置$HADOOP_COMMON_HOME设置为hadoo

HADOOP HADOOP_COMMON_HOME section java apache distributed-computing hdfs

hadoop - 我可以将 pig.temp.dir 设置为/user/USERNAME/tmp/pig 吗？

Hive可以配置为hive.exec.scratchdir=/user/${user.name}/tmp/hive我可以用Pig做类似的事情吗？我已尝试修改pig.properties文件，但似乎没有任何效果。pig.temp.dir=/user/${user.name}/tmp/pig我可以用别名替换pig命令，但我希望将更改写入配置文件。pig-Dpig.temp.dir=/user/`whoami`/tmp/pig谢谢!更新:我们决定将/tmp/用于生产系统。这是一个问题的原因是因为我们正在运行MapR，它似乎试图将临时目录放入用户目录，并在Hive上成功，但在Pig上却没有。

pig USERNAME section user hadoop configuration permissions apache-pig configuration-files

scala - yarn 上的 Spark 提交没有将 jar 分发到 nm-local-dir

1、版本Spark:2.0.0标度:2.11.8java:1.8.0_91hadoop:2.7.22、问题:当我在yarn上提交scala程序到spark时，它抛出一个异常:Causedby:java.lang.IllegalStateException:Librarydirectory'/opt/hadoop/tmp/nm-local-dir/usercache/hadoop/appcache/application_1471514504287_0021/container_1471514504287_0021_01_000002/assembly/target/scala-2.11

分发 nm-local-dir INFO java 08 scala hadoop apache-spark hadoop-yarn

hadoop - "dfs.replication"和 "dfs.datanode.data.dir"配置如何在集群中工作？

我已按照Apache“单节点设置”说明在单节点上设置dfs.replication。但是后来我按照“ClusterSetup”进行操作，但它没有提到这个属性，所以我不知道这是要在Namenode上设置的属性，还是也/仅在Datanodes上设置的属性..我还读到在数据节点上的dfs.datanode.data.dir中设置多个(逗号分隔)路径将复制所有路径上的数据。所以我的问题是:dfs.replication将对哪个节点产生影响，如果dfs.datanode.data.dir的多个路径是设置，这些额外的独立复制是否仅针对每个数据节点，或者这些是否也以某种方式与dfs.replicat

中工 amp strong code replication hadoop hdfs

hadoop - yarn.log.dir 在哪里定义的？

在yarn-default.xml对于ApacheHadoop3.0.0，它将yarn.nodemanager.log-dirs的默认值显示为${yarn.log.dir}/userlogs。yarn.log.dir在哪里定义的？它有默认值吗？我没有在任何默认配置(core-default.xml、hdfs-default.xml、mapred-default.xml、yarn-default.xml)中找到它。我没有在任何环境脚本(hadoop-env.sh、httpfs-env.sh、kms-env.sh、mapred-env.sh、yarn-env.sh)中找到它。同样让我感到困

hadoop yarn default section logging hadoop-yarn

hadoop - 文件夹不是用 $HADOOP_HOME/bin/hadoop fs -mkdir/user/hive/warehouse 创建的

嘿，我正在Hadoop2.7.3单节点集群中安装HIVE，但我无法使用创建文件夹$HADOOP_HOME/bin/hadoopfs-mkdir/user/hive/warehouse16/11/1114:43:25WARNutil.NativeCodeLoader:Unabletoloadnative-hadooplibraryforyourplatform...usingbuiltin-javaclasseswhereapplicablemkdir:`/user/hive/warehouse':NosuchfileordirectoryHadoop的JPS运行良好:jps15411N

hadoop HADOOP_HOME section warehouse configuration installation hive

hadoop - 错误 spark-shell，回退到在 SPARK_HOME 下上传库

我正在尝试连接一个spark-shellamazonhadoop，但我总是出现以下错误并且不知道如何修复它或配置缺少的内容。spark.yarn.jars,spark.yarn.archivespark-shell--jars/usr/share/aws/emr/ddb/lib/emr-ddb-hadoop.jarSettingdefaultloglevelto"WARN".Toadjustlogginglevelusesc.setLogLevel(newLevel).16/08/1207:47:26WARNUtils:Service'SparkUI'couldnotbindonpor

spark-shell SPARK_HOME hadoop 34 code apache-spark pyspark apache-spark-sql amazon-emr

64 65 666768 69 70