草庐IT

hadoop - 运行 YARN 应用程序时获取 "User [dr.who] is not authorized to view the logs for application <AppID>"

我在HDP2.5集群中使用ApacheTwill运行自定义Yarn应用程序,但是当我转到我的容器网页时,我无法看到我自己的容器日志(syslog、stderr和stdout):当我导航到此页面时,登录名也从我的kerberos更改为“dr.who”。但是我可以看到map-reduce作业的日志。Hadoop版本为2.7.3,集群启用了yarnacl。 最佳答案 我在使用hadoopui时遇到了这个问题。我在this中找到doc,hadoop.http.staticuser.user默认设置为dr.who,您需要将其包含在相关设置文件

hadoop - 如何解决 YARN 日志中的 Log aggregation has not completed or is not enabled 错误

我正在使用EMR5.4并将spark作业提交给Yarn当我尝试使用yarnlogs-applicationIdapplication_1528461193301_0001检索日志时,出现以下错误:18/06/0812:38:01INFOclient.RMProxy:ConnectingtoResourceManageratip-10-0-182-144.eu-west-1.compute.internal/10.0.182.144:8032s3://xxx/apps/root/logs/application_1528461193301_0001doesnotexist.Logaggr

hadoop - [hdfs]如何为每个datanode配置不同的dfs.datanode.data.dir?

我使用ambari来设置hadoop集群。但是当我配置hdfs的配置时。我发现如果我修改dfs.datanode.data.dir,configure会在所有datanodes上生效...如何为每个数据节点配置不同的配置?比如机器A有两block磁盘,分别挂载到/data1、/data2但是机器B只有一个盘,挂载到/data1所以我想将机器A的dfs.datanode.data.dir配置为“/data1,/data2”。但只有机器B的“/data1” 最佳答案 不存在的HDFS目录将被忽略。都放进去,没关系。

hadoop - 传递 JVM 选项以指向 Oozie Workflow 中 Pig Action 中的 log4j.properties 文件

在我的Oozie工作流程中,有一个pigAction。运行时,它正在CDH中寻找log4j.properties文件,因为我没有在我的jars中提供该文件。现在,我有了log4j.properties文件,我只需要将它作为Pig操作中的JVM选项传递即可。有什么办法吗? 最佳答案 无法将自定义log4j属性文件传递给Oozie工作流中的Pig操作。PigMain.java文件不允许将以下参数作为参数传递。static{DISALLOWED_PIG_OPTIONS.add("-4");DISALLOWED_PIG_OPTIONS.ad

scala - oozie spark 2.0 操作给出异常 : java. lang.NoClassDefFoundError: org/apache/spark/internal/Logging

我在尝试使用oozie运行spark操作时遇到以下异常ERRORyarn.ApplicationMaster:Userclassthrewexception:java.lang.NoClassDefFoundError:org/apache/spark/internal/Loggingjava.lang.NoClassDefFoundError:org/apache/spark/internal/Loggingatjava.lang.ClassLoader.defineClass1(NativeMethod)atjava.lang.ClassLoader.defineClass(Cla

log4j - Hadoop 启用日志记录

我正在尝试在单一集群模式下使用从源代码构建的hadoop。我检查了0.22.0-alpha-1。我在日志记录方面遇到了一些问题。如何启用调试日志。我尝试添加log4j.logger.org.apache.hadoop.mapred.JobTracker=DEBUGlog4j.logger.org.apache.hadoop.mapred.TaskTracker=DEBUG在log4j.properties中。但它似乎不起作用。有人可以帮助我启用调试日志吗?另外我想知道除了Jobtracker和tasktracker以及要添加到log4j中的相应行之外是否还有其他日志我可以启用.prop

hadoop - 失败后hadoop namenode dirs是否同步?

在这种情况下会发生什么:Namenode正在写入两个不同驱动器上的两个目录,一个是本地的,另一个(远程)是mounted。现在,namenode失败了,我们在远程机器上启动namenode进程(它有原始namenode数据的副本,所以它是安全的)并更改所有datanodes上的namenode的ip。一段时间后,我们设法使原来的名称节点与之前的配置完全一致。我们停止远程机器上的名称节点进程。现在,本地fs.name.dir是否会与挂载的同步(我的意思是在挂载目录上累积的差异,而原始名称节点已关闭)还是名称节点数据一致性会出现问题? 最佳答案

java - pig 服务器 log4j :ERROR Could not instantiate class [org. apache.hadoop.log.metrics.EventCounter]

我使用嵌入在Java中的Pig。我想实例化PigServer来执行一个Pig语句。我的第一句话是:PigServerpigServer=newPigSever("local")当我执行这段代码时,出现了以下错误:log4j:ERRORCouldnotinstantiateclass[org.apache.hadoop.log.metrics.EventCounter].java.lang.ClassNotFoundException:org.apache.hadoop.log.metrics.EventCounteratjava.net.URLClassLoader$1.run(URL

windows - 映射减少错误 : Failed to setup local dir

我在Windows8上安装的hadoop上运行mapreducewordcount示例。我收到如下错误。这听起来像是一个安全许可问题。但我不太确定。我在yarn-site.xml文件中添加了一个属性yarn.nodemanager.local-dirsc:\hadoop\tmp-nm任何想法都会很有帮助!15/07/1511:01:54INFOclient.RMProxy:ConnectingtoResourceManagerat/0.0.0.0:803215/07/1511:01:55WARNmapreduce.JobResourceUploader:Hadoopcommand-li

hadoop - 我可以将 pig.temp.dir 设置为/user/USERNAME/tmp/pig 吗?

Hive可以配置为hive.exec.scratchdir=/user/${user.name}/tmp/hive我可以用Pig做类似的事情吗?我已尝试修改pig.properties文件,但似乎没有任何效果。pig.temp.dir=/user/${user.name}/tmp/pig我可以用别名替换pig命令,但我希望将更改写入配置文件。pig-Dpig.temp.dir=/user/`whoami`/tmp/pig谢谢!更新:我们决定将/tmp/用于生产系统。这是一个问题的原因是因为我们正在运行MapR,它似乎试图将临时目录放入用户目录,并在Hive上成功,但在Pig上却没有。