log_dir

scala - yarn 上的 Spark 提交没有将 jar 分发到 nm-local-dir

1、版本Spark:2.0.0标度:2.11.8java:1.8.0_91hadoop:2.7.22、问题:当我在yarn上提交scala程序到spark时，它抛出一个异常:Causedby:java.lang.IllegalStateException:Librarydirectory'/opt/hadoop/tmp/nm-local-dir/usercache/hadoop/appcache/application_1471514504287_0021/container_1471514504287_0021_01_000002/assembly/target/scala-2.11

分发 nm-local-dir INFO java 08 scala hadoop apache-spark hadoop-yarn

hadoop - 如何在 Log4J 中启用调试级别日志记录(在 Hadoop 中)

我在Hadoop中看到很多带有以下检查的代码:if(LOG.isDebugEnabled()){...我猜这与log4j有关？如何在Hadoop中启用调试级别日志记录？我在Hadoop的conf目录中看到一个log4j属性文件，并且我看到了如下几行:#自定义日志级别hadoop.metrics.log.level=信息#log4j.logger.org.apache.hadoop.mapred.JobTracker=调试#log4j.logger.org.apache.hadoop.mapred.TaskTracker=DEBUG#log4j.logger.org.apache.had

何在级别 section hadoop stackoverflow log4j

logging - 在 hadoop 上运行 nutch，nutch 日志在哪里？

我的nutch在hadoop上运行，想查看nutch运行日志，但找不到独立的nutch日志之类的输出日志。最佳答案如果你在hadoop上运行nutch，会生成每个phase的每个mapper和reducer对应的日志。它的位置是{HADOOP_LOG_DIR}/userlogs//syslog 关于logging-在hadoop上运行nutch，nutch日志在哪里？，我们在StackOverflow上找到一个类似的问题： https://stackove

nutch 志在 section hadoop logging

hadoop - "dfs.replication"和 "dfs.datanode.data.dir"配置如何在集群中工作？

我已按照Apache“单节点设置”说明在单节点上设置dfs.replication。但是后来我按照“ClusterSetup”进行操作，但它没有提到这个属性，所以我不知道这是要在Namenode上设置的属性，还是也/仅在Datanodes上设置的属性..我还读到在数据节点上的dfs.datanode.data.dir中设置多个(逗号分隔)路径将复制所有路径上的数据。所以我的问题是:dfs.replication将对哪个节点产生影响，如果dfs.datanode.data.dir的多个路径是设置，这些额外的独立复制是否仅针对每个数据节点，或者这些是否也以某种方式与dfs.replicat

中工 amp strong code replication hadoop hdfs

hadoop - yarn.log.dir 在哪里定义的？

在yarn-default.xml对于ApacheHadoop3.0.0，它将yarn.nodemanager.log-dirs的默认值显示为${yarn.log.dir}/userlogs。yarn.log.dir在哪里定义的？它有默认值吗？我没有在任何默认配置(core-default.xml、hdfs-default.xml、mapred-default.xml、yarn-default.xml)中找到它。我没有在任何环境脚本(hadoop-env.sh、httpfs-env.sh、kms-env.sh、mapred-env.sh、yarn-env.sh)中找到它。同样让我感到困

hadoop yarn default section logging hadoop-yarn

api - 纱 API : Getting Yarn Aggregated Logs for application by API

我使用YARNjavaAPI而不是在终端中提交Hadoop应用程序。我正在寻找一种在应用程序完成后通过YarnAPI获取yarn聚合日志的方法。当然，这可以通过简单的命令来完成:“yarnlogs-applicationId{my_application_ID}”，但我想通过API来完成。有人知道如何使用API而不是命令行来获取这些日志吗？谢谢。最佳答案正如您在代码源上所做的那样https://github.com/apache/hadoop/blob/trunk/hadoop-yarn-project/hadoop-yarn/

application Aggregated hadoop yarn section api logging hadoop-yarn

java - 2个jar库如何独立使用log4j？

我做了一个使用log4j的应用程序。一切正常，但是，当我制作该应用程序的jar并将其附加到另一个应用程序时，日志记录停止工作(没有创建日志文件)。我认为问题在于最后一个应用程序还包含另一个已经使用log4j的jar(除了我的)。顺便说一句，这个另一个jar是hadoop，我认为它正在获取日志上下文。我的log4j属性文件位于类路径以及jar的根目录中:log4j.logger.a.b.c=DEBUG,A1log4j.appender.A1=org.apache.log4j.FileAppenderlog4j.appender.A1.File=my-log.loglog4j.append

log4j java log4 log logging hadoop jar

java - Hadoop使用Java递归地将fsPermission设置为dir

您好，我有一个测试程序，可以将文件加载到此路径user/user1/data/app/type/file.gz的hdfs中。现在这个测试程序由多个用户运行多次。所以我想给rwx设置文件权限，这样任何人都可以删除这个文件。我有以下代码fs.setPermission(newPath("user/user1/data"),newFsPermission(FsAction.ALL,FsAction.ALL,FsAction.ALL))上一行将drwxrwxrwx授予所有目录，但对于file.gz，它授予-rw-r--r--权限，为什么这样呢？由于这个原因，除我之外的另一个用户无法通过测试程序

fsPermission Hadoop section code 34 java hdfs

hadoop - 在 hadoop 多节点集群设置中创建从作业日志到 ${hadoop.tmp.dir} 的符号链接(symbolic link)失败

当我在3节点集群hadoop中运行简单的wordcount示例时，出现以下错误。我检查了必要文件夹的所有写/读权限。此错误不会停止mapreduce作业，但所有工作负载都转到集群中的一台机器上，其他两台机器在任务到达时给出与上述相同的错误。12/09/1309:38:37INFOmapred.JobClient:TaskId:attempt_201209121718_0006_m_000008_0,Status:FAILEDjava.lang.Throwable:ChildErroratorg.apache.hadoop.mapred.TaskRunner.run(TaskRunner

hadoop 中创 TaskRunner mapred mapreduce cluster-computing

hadoop - 使用 master 'yarn' 运行时，必须在环境中设置 HADOOP_CONF_DIR 或 YARN_CONF_DIR

我正在尝试使用yarn运行Spark，但我遇到了这个错误:线程“main”中的异常java.lang.Exception:当使用master'yarn'运行时，必须在环境中设置HADOOP_CONF_DIR或YARN_CONF_DIR。我不确定“环境”在哪里(具体是什么文件？)。我尝试使用:exportHADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoopexportYARN_CONF_DIR=$HADOOP_HOME/etc/hadoop在bash_profile中，但这似乎没有帮助。最佳答案在使用Ya

中设 CONF HADOOP section code apache-spark

198 199 200201202 203 204