草庐IT

nm-local-dir

全部标签

hadoop - 失败后hadoop namenode dirs是否同步?

在这种情况下会发生什么:Namenode正在写入两个不同驱动器上的两个目录,一个是本地的,另一个(远程)是mounted。现在,namenode失败了,我们在远程机器上启动namenode进程(它有原始namenode数据的副本,所以它是安全的)并更改所有datanodes上的namenode的ip。一段时间后,我们设法使原来的名称节点与之前的配置完全一致。我们停止远程机器上的名称节点进程。现在,本地fs.name.dir是否会与挂载的同步(我的意思是在挂载目录上累积的差异,而原始名称节点已关闭)还是名称节点数据一致性会出现问题? 最佳答案

windows - 映射减少错误 : Failed to setup local dir

我在Windows8上安装的hadoop上运行mapreducewordcount示例。我收到如下错误。这听起来像是一个安全许可问题。但我不太确定。我在yarn-site.xml文件中添加了一个属性yarn.nodemanager.local-dirsc:\hadoop\tmp-nm任何想法都会很有帮助!15/07/1511:01:54INFOclient.RMProxy:ConnectingtoResourceManagerat/0.0.0.0:803215/07/1511:01:55WARNmapreduce.JobResourceUploader:Hadoopcommand-li

sql - Hive: java.lang.OutOfMemoryError: Java heap space and Job running in-process (local Hadoop)

我的设置:运行NixOSLinux的GoogleCloudPlatform中的4节点集群(1个主节点,3个工作节点)。我一直在使用TPC-DS工具包来生成数据和查询都是标准的。在较小的数据集/更简单的查询上,它们工作得很好。我从这里获取的查询:https://github.com/hortonworks/hive-testbench/tree/hdp3/sample-queries-tpcds这是第一个,query1.sql:WITHcustomer_total_returnAS(SELECTsr_customer_skASctr_customer_sk,sr_store_skASct

hadoop - 我可以将 pig.temp.dir 设置为/user/USERNAME/tmp/pig 吗?

Hive可以配置为hive.exec.scratchdir=/user/${user.name}/tmp/hive我可以用Pig做类似的事情吗?我已尝试修改pig.properties文件,但似乎没有任何效果。pig.temp.dir=/user/${user.name}/tmp/pig我可以用别名替换pig命令,但我希望将更改写入配置文件。pig-Dpig.temp.dir=/user/`whoami`/tmp/pig谢谢!更新:我们决定将/tmp/用于生产系统。这是一个问题的原因是因为我们正在运行MapR,它似乎试图将临时目录放入用户目录,并在Hive上成功,但在Pig上却没有。

java - Hadoop : java. io.IOException : Call to localhost/127. 0.0.1 :54310 failed on local exception: java. io.EOFException

我是hadoop的新手,今天才开始使用它,我想将文件写入hdfshadoop服务器,我正在使用服务器hadoop1.2.1,当我在cli中给出jps命令时,我能够看到所有节点都在运行,31895Jps29419SecondaryNameNode29745TaskTracker29257DataNode这是我将文件写入hdfs系统的示例客户端代码publicstaticvoidmain(String[]args){try{//1.GettheinstanceofCOnfigurationConfigurationconfiguration=newConfiguration();confi

scala - yarn 上的 Spark 提交没有将 jar 分发到 nm-local-dir

1、版本Spark:2.0.0标度:2.11.8java:1.8.0_91hadoop:2.7.22、问题:当我在yarn上提交scala程序到spark时,它抛出一个异常:Causedby:java.lang.IllegalStateException:Librarydirectory'/opt/hadoop/tmp/nm-local-dir/usercache/hadoop/appcache/application_1471514504287_0021/container_1471514504287_0021_01_000002/assembly/target/scala-2.11

hadoop - kadmin 不能创建 principle 但 kadmin.local 可以

我正在Cloudera5beta上启用安全模式。使用cloudera管理器并在执行来自here的安全启用文档的第8步之后clouderamanager应该触发GenerateCredential命令,但事实并非如此。所以我正在做的是手动运行GenerateCredential,但它给我错误日志。KADMIN='kadmin-k-t/etc/cloudera-scm-server/cmf.keytab-pcloudera-scm/admin@IMP.CO.IN-rIMP.CO.IN'+kadmin-k-t/etc/cloudera-scm-server/cmf.keytab-pcloud

hadoop - "dfs.replication"和 "dfs.datanode.data.dir"配置如何在集群中工作?

我已按照Apache“单节点设置”说明在单节点上设置dfs.replication。但是后来我按照“ClusterSetup”进行操作,但它没有提到这个属性,所以我不知道这是要在Namenode上设置的属性,还是也/仅在Datanodes上设置的属性..我还读到在数据节点上的dfs.datanode.data.dir中设置多个(逗号分隔)路径将复制所有路径上的数据。所以我的问题是:dfs.replication将对哪个节点产生影响,如果dfs.datanode.data.dir的多个路径是设置,这些额外的独立复制是否仅针对每个数据节点,或者这些是否也以某种方式与dfs.replicat

hadoop - yarn.log.dir 在哪里定义的?

在yarn-default.xml对于ApacheHadoop3.0.0,它将yarn.nodemanager.log-dirs的默认值显示为${yarn.log.dir}/userlogs。yarn.log.dir在哪里定义的?它有默认值吗?我没有在任何默认配置(core-default.xml、hdfs-default.xml、mapred-default.xml、yarn-default.xml)中找到它。我没有在任何环境脚本(hadoop-env.sh、httpfs-env.sh、kms-env.sh、mapred-env.sh、yarn-env.sh)中找到它。同样让我感到困

java - Hadoop使用Java递归地将fsPermission设置为dir

您好,我有一个测试程序,可以将文件加载到此路径user/user1/data/app/type/file.gz的hdfs中。现在这个测试程序由多个用户运行多次。所以我想给rwx设置文件权限,这样任何人都可以删除这个文件。我有以下代码fs.setPermission(newPath("user/user1/data"),newFsPermission(FsAction.ALL,FsAction.ALL,FsAction.ALL))上一行将drwxrwxrwx授予所有目录,但对于file.gz,它授予-rw-r--r--权限,为什么这样呢?由于这个原因,除我之外的另一个用户无法通过测试程序