草庐IT

home_dir

全部标签

java - Pydoop Java home not set 安装问题

当我回显$JAVA_HOME时,我得到了Java的路径。Hadoop也在运行,但是pydoop安装由于这个错误而失败。Traceback(mostrecentcalllast):File"setup.py",line54,inraiseRuntimeError("javahomenotfound,trysettingJAVA_HOME")RuntimeError:javahomenotfound,trysettingJAVA_HOME我使用sudopythonsetup.pyinstall--skip-build运行设置命令。作为非root用户收到此错误运行安装运行安装库创建/usr/

hadoop - 失败后hadoop namenode dirs是否同步?

在这种情况下会发生什么:Namenode正在写入两个不同驱动器上的两个目录,一个是本地的,另一个(远程)是mounted。现在,namenode失败了,我们在远程机器上启动namenode进程(它有原始namenode数据的副本,所以它是安全的)并更改所有datanodes上的namenode的ip。一段时间后,我们设法使原来的名称节点与之前的配置完全一致。我们停止远程机器上的名称节点进程。现在,本地fs.name.dir是否会与挂载的同步(我的意思是在挂载目录上累积的差异,而原始名称节点已关闭)还是名称节点数据一致性会出现问题? 最佳答案

windows - 映射减少错误 : Failed to setup local dir

我在Windows8上安装的hadoop上运行mapreducewordcount示例。我收到如下错误。这听起来像是一个安全许可问题。但我不太确定。我在yarn-site.xml文件中添加了一个属性yarn.nodemanager.local-dirsc:\hadoop\tmp-nm任何想法都会很有帮助!15/07/1511:01:54INFOclient.RMProxy:ConnectingtoResourceManagerat/0.0.0.0:803215/07/1511:01:55WARNmapreduce.JobResourceUploader:Hadoopcommand-li

java - $HADOOP_COMMON_HOME 和 $HADOOP_HDFS_HOME 是同一个值吗?

我知道$HADOOP_COMMON_HOME应该设置为Hadoop目录的根路径,但是$HADOOP_HDFS_HOME的值是多少?同一个?它的值应该是多少? 最佳答案 他们不一样..hadoop发行版中有三个主要的子项目:1)hadoop-common-mapreduce和hdfs使用的通用功能,如IPC..2)hadoop-mapred-mapreduce框架jar3)hadoop-hdfs-hdfs分布式文件系统jar它们每个都在不同的目录中。所以在你提取那些子项目之后,设置$HADOOP_COMMON_HOME设置为hadoo

hadoop - 我可以将 pig.temp.dir 设置为/user/USERNAME/tmp/pig 吗?

Hive可以配置为hive.exec.scratchdir=/user/${user.name}/tmp/hive我可以用Pig做类似的事情吗?我已尝试修改pig.properties文件,但似乎没有任何效果。pig.temp.dir=/user/${user.name}/tmp/pig我可以用别名替换pig命令,但我希望将更改写入配置文件。pig-Dpig.temp.dir=/user/`whoami`/tmp/pig谢谢!更新:我们决定将/tmp/用于生产系统。这是一个问题的原因是因为我们正在运行MapR,它似乎试图将临时目录放入用户目录,并在Hive上成功,但在Pig上却没有。

scala - yarn 上的 Spark 提交没有将 jar 分发到 nm-local-dir

1、版本Spark:2.0.0标度:2.11.8java:1.8.0_91hadoop:2.7.22、问题:当我在yarn上提交scala程序到spark时,它抛出一个异常:Causedby:java.lang.IllegalStateException:Librarydirectory'/opt/hadoop/tmp/nm-local-dir/usercache/hadoop/appcache/application_1471514504287_0021/container_1471514504287_0021_01_000002/assembly/target/scala-2.11

hadoop - "dfs.replication"和 "dfs.datanode.data.dir"配置如何在集群中工作?

我已按照Apache“单节点设置”说明在单节点上设置dfs.replication。但是后来我按照“ClusterSetup”进行操作,但它没有提到这个属性,所以我不知道这是要在Namenode上设置的属性,还是也/仅在Datanodes上设置的属性..我还读到在数据节点上的dfs.datanode.data.dir中设置多个(逗号分隔)路径将复制所有路径上的数据。所以我的问题是:dfs.replication将对哪个节点产生影响,如果dfs.datanode.data.dir的多个路径是设置,这些额外的独立复制是否仅针对每个数据节点,或者这些是否也以某种方式与dfs.replicat

hadoop - yarn.log.dir 在哪里定义的?

在yarn-default.xml对于ApacheHadoop3.0.0,它将yarn.nodemanager.log-dirs的默认值显示为${yarn.log.dir}/userlogs。yarn.log.dir在哪里定义的?它有默认值吗?我没有在任何默认配置(core-default.xml、hdfs-default.xml、mapred-default.xml、yarn-default.xml)中找到它。我没有在任何环境脚本(hadoop-env.sh、httpfs-env.sh、kms-env.sh、mapred-env.sh、yarn-env.sh)中找到它。同样让我感到困

hadoop - 文件夹不是用 $HADOOP_HOME/bin/hadoop fs -mkdir/user/hive/warehouse 创建的

嘿,我正在Hadoop2.7.3单节点集群中安装HIVE,但我无法使用创建文件夹$HADOOP_HOME/bin/hadoopfs-mkdir/user/hive/warehouse16/11/1114:43:25WARNutil.NativeCodeLoader:Unabletoloadnative-hadooplibraryforyourplatform...usingbuiltin-javaclasseswhereapplicablemkdir:`/user/hive/warehouse':NosuchfileordirectoryHadoop的JPS运行良好:jps15411N

hadoop - 错误 spark-shell,回退到在 SPARK_HOME 下上传库

我正在尝试连接一个spark-shellamazonhadoop,但我总是出现以下错误并且不知道如何修复它或配置缺少的内容。spark.yarn.jars,spark.yarn.archivespark-shell--jars/usr/share/aws/emr/ddb/lib/emr-ddb-hadoop.jarSettingdefaultloglevelto"WARN".Toadjustlogginglevelusesc.setLogLevel(newLevel).16/08/1207:47:26WARNUtils:Service'SparkUI'couldnotbindonpor