YARN_OPTS_草庐IT

hadoop - 找不到 yarn 应用程序日志

作业完成时。我可以从WebUI跟踪作业历史记录日志，但找不到来自数据节点(运行nodemanger服务)本地文件系统的日志，也找不到hdfs://user/who/.staging下的日志。我确认${yarn.nodemanger.log-dirs}已配置。yarn日志是不是自动删除了？或者有一些服务没有运行？最佳答案不，您可以使用命令yarnlogs-applicationIdyour_application_id检索应用程序日志。关于hadoop-找不到yarn应用程序日志，我

Hadoop YARN 集群性能调优

我想知道一些参数来加速我的YARN集群上的Spark作业。我有以下Spark/YARN配置，但我对执行速度不满意。我有很多未使用的vcores和内存。Spark配置:-spark.yarn.am.cores=2-spark.executor.memory=5g-spark.executor.cores=8yarn配置:-yarn.nodemanager.resource.memory-mb=31744-yarn.nodemanager.resource.cpu-vcores=15-yarn.scheduler.maximum-allocation-mb=31744从图片来看，在节点3和

Hadoop YARN section image code apache-spark hadoop-yarn

hadoop - M/R 作业提交失败，错误为 : Could not find Yarn tags property > (mapreduce. job.tags)

我在运行map/reduce作业时遇到以下异常。我们通过oozie提交map/reduce作业。FailingOozieLauncher,Mainclass[org.apache.oozie.action.hadoop.JavaMain],main()threwexception,CouldnotfindYarntagsproperty(mapreduce.job.tags)java.lang.RuntimeException:CouldnotfindYarntagsproperty(mapreduce.job.tags)atorg.apache.oozie.action.hadoop

tags mapreduce java hadoop apache cloudera oozie cloudera-cdh

hadoop - hadoop中local和yarn的区别

我一直在尝试按照here中的说明在单个节点上安装Hadoop.有两组指令，一组用于在本地运行MapReduce作业，另一组用于YARN。在本地运行MapReduce作业和在YARN上运行有什么区别？最佳答案如果您使用本地，则map和reduce任务在同一个jvm中运行。通常我们要调试代码的时候会用到这种模式。而如果我们使用MRV2中的yarn资源管理器，mappers和reducers将在不同的节点和不同的jvms中运行，并且在同一节点中运行(如果它是伪分布式模式)。关于hadoo

hadoop local section 中运 mapreduce

hadoop - 必须具有 core-site hdfs-site mapred-site 和 yarn-site.xml 的属性

谁能告诉我Core-site.xml、hdfs-site.xml、mapred-site.xml和yarn-site.xml必须具备的属性，没有这些属性hadoop就无法启动？最佳答案以下设置适用于Hadoop2.x.x的独立和伪节点设置。核心站点.xmlfs.default.namehdfs://localhost:9000hdfs-site.xmldfs.replication1dfs.name.dirfile:///home/hadoop/hadoopdata/hdfs/namenodedfs.data.dirfile:/

site mapred-site gt lt property hadoop hadoop-yarn hadoop2

java - Spark SASL 无法使用 yarn 在 emr 上工作

所以首先，我想说的是我所看到的解决这个问题的唯一方法是:Spark1.6.1SASL.但是，在添加spark和yarn认证的配置时，还是不行。下面是我在亚马逊emr上的yarn集群上使用spark-submit的spark配置:SparkConfsparkConf=newSparkConf().setAppName("secure-test");sparkConf.set("spark.authenticate.enableSaslEncryption","true");sparkConf.set("spark.network.sasl.serverAlwaysEncrypt","tr

上工 Spark AbstractChannelHandlerContext java hadoop apache-spark hadoop-yarn

hadoop - 在每个应用程序上重新读取哪些 YARN 配置参数？

我有一份工作比我日常工作流程中运行的其他50份左右的工作要大得多。我希望属性yarn.app.mapreduce.am.resource.mb更大一些，以便完成大工作。我运气好吗？我如何知道哪些属性需要完全重启集群中的哪些YARN片段才能更改？最佳答案无需重启YARN服务即可在作业级别更改此设置。一般很难说什么时候可以更改每个MR属性。通常可以在作业级别更新作业级别的属性，如mapper/reducer/appmaster内存设置。可以查看thishelpfulpost以更深入地了解这个主题。

hadoop YARN section 中运大工 mapreduce hadoop-yarn elastic-map-reduce

hadoop - 如何从每个节点访问 hadoop-yarn 应用程序上的 hdfs？

如何在“HADOOP(2.5.2)YARN应用”中访问HDFS并从各个节点读写文件？我通常知道YARN应用程序运行在HDFS上。我没有可以回答这些基本问题的网站或文档，所以我想问一下。最佳答案 YARN应用程序在YARN中运行(或至少请求内存空间)，而不是HDFS。HDFS只是一个用于文件存储的文件系统。您使用多种工具进行读写，例如HadoopCLI、MapReduce、ApacheSpark等。例如CLI是hadoopfs-put/local-filehdfs://remote/file这些应用程序是否由YARN管理与HDFS文

hadoop hadoop-yarn section strong HDFS

amazon-web-services - 有没有办法在运行时配置和更改 Yarn 调度程序？

目前我正在使用默认的Yarn调度器，但我想做一些类似的事情-RunYarnusingthedefaultschedulerIf(numberofjobsinqueue>X){ChangetheYarnschedulertoFIFO}这甚至可以通过代码实现吗？请注意，我正在使用Yarn作为RM在awsEMR集群上运行Spark作业。最佳答案好吧，这可以通过轮询器检查当前队列(使用RMAPI)并更新yarn-site.xml+可能重启RM来实现。但是，重新启动RM可能会影响您的队列，因为当前作业将被终止或关闭(并且可能稍后重试)。如

amazon-web-services services section scheduler hadoop hadoop-yarn job-scheduling

macos - Hadoop2.7.3 : Cannot see DataNode/ResourceManager process after starting hdfs and yarn

我使用的是mac和java版本:$java-versionjavaversion"1.8.0_111"Java(TM)SERuntimeEnvironment(build1.8.0_111-b14)JavaHotSpot(TM)64-BitServerVM(build25.111-b14,mixedmode)点击此链接:https://dtflaneur.wordpress.com/2015/10/02/installing-hadoop-on-mac-osx-el-capitan/我先brewinstallhadoop，根据需要配置ssh连接和xml文件，start-dfs.shst

ResourceManager DataNode hadoop localhost code macos process hdfs hadoop-yarn