草庐IT

yarn-daemon

全部标签

java - 如何在 java 中使用 yarn api 提交 mapreduce 作业

我想使用YARNjavaAPI提交我的MR作业,我尝试像WritingYarnApplications那样做,但我不知道要添加什么amContainer,下面是我写的代码:packageorg.apache.hadoop.examples;importorg.apache.hadoop.conf.Configuration;importorg.apache.hadoop.yarn.api.protocolrecords.GetNewApplicationResponse;importorg.apache.hadoop.yarn.api.records.ApplicationId;imp

hadoop - 将 yarn 节点管理器置于维护状态

我是运行hadoopcloudera5.13实现的团队的一员。我想知道是否有办法在维护中设置yarnnodemanagers,从而运行它重命名容器但不接受任何新容器?我没有cloudera企业解决方案。尝试使用cli工具yarnrmadmin找到一些有用的东西,但无法做到。或者我唯一能做的就是关闭节点管理器并让我的用户容器死掉? 最佳答案 您正在寻找的是Gracefuldecommissioning。在YARN(MR2Included)PropertiesinCDH5.9.0属性yarn.resourcemanager.nodema

hadoop - 在 Yarn 集群上运行时 Spark 批处理未完成

设置场景我正在努力使Spark流应用程序(Spark2.2.1withScala)在Yarn集群(Hadoop2.7.4)上运行。到目前为止,我已经成功地使用spark-submit将应用程序提交到Yarn集群。我可以看到接收器任务正确启动并从数据库(CouchbaseServer5.0)中获取大量记录,我还可以看到记录被分成批处理。问题当我查看SparkWebUI上的流统计信息时,我可以看到我的批处理从未被处理过。我看到有0条记录的批处理处理并完成,但是当有记录的批处理开始处理时,它永远不会完成。有一次它甚至卡在了0条记录的批处理上。我什至尝试尽可能简化SteamingContext

hadoop - Spark 的 Yarn 集群优化

我正在尝试为我的4节点集群配置Yarn和Spark。每个节点都有以下规范:24核23.5GB内存换掉到目前为止,我配置了Yarn和Spark,Spark可以执行SparkPi示例计算,但这仅在yarn-site.xml的以下配置下有效:yarn.acl.enable0yarn.resourcemanager.hostnameds11yarn.nodemanager.resource.memory-mb20480yarn.scheduler.maximum-allocation-mb20480yarn.scheduler.minimum-allocation-mb1536yarn.nod

java - 通过java列出hadoop集群中所有yarn应用

关于运行命令yarnapplication-list在我的hadoop集群上,它返回正在运行的应用程序列表。我想使用Java获取此列表。目前我正在使用yarnClientAPIorg.apache.hadoophadoop-common2.7.3org.apache.hadoophadoop-yarn-client2.7.0我的代码如下:YarnConfigurationconf=newYarnConfiguration();YarnClientyarnClient=YarnClient.createYarnClient();yarnClient.init(conf);yarnClie

hadoop - 普通身份验证失败 : User yarn is not configured for any impersonation. impersonationUser:alluxio mapreduce 中的 root

Causedby:org.apache.thrift.transport.TTransportException:Plainauthenticationfailed:Useryarnisnotconfiguredforanyimpersonation.模拟用户:root当我使用alluxio在本地运行wordcount程序时它工作正常。我也通过了集成测试,但是当我使用alluxio客户端jar运行相同的Hadoop程序时它给我一个错误bin/hadoopjar/usr/lib/hadoop-mapreduce/hadoop-mapreduce-examples.jarwordcount

azure - 如何查询azure hdinsight hadoop cluster yarn timeline server

如何查询AzureHDInsightHadoop集群中的时间线服务器以获取作业指标?连接到Azure集群:curl-uadmin-sS-G"https://$CLUSTERNAME.azurehdinsight.net/api/v1/clusters/$CLUSTERNAME"连接到时间线服务器:GET/ws/v1/timeline/我需要一个连接这两个的查询来获取AzureHDInsightHadoop集群的作业指标。提前致谢。 最佳答案 查询Yarn时间线服务器:sshuser@clustername:~$curl-uadmin

hadoop - YARN 提示 java.net.NoRouteToHostException : No route to host (Host unreachable)

尝试在HDP3.1集群上运行h2o并遇到似乎与YARN资源容量有关的错误...[ml1user@HW04h2o-3.26.0.1-hdp3.1]$hadoopjarh2odriver.jar-nodes3-mapperXmx10gDeterminingdriverhostinterfaceformapper->drivercallback...[PossiblecallbackIPaddress:192.168.122.1][PossiblecallbackIPaddress:172.18.4.49][PossiblecallbackIPaddress:127.0.0.1]Usingm

hadoop - yarn 组件

什么是节点经理容器应用大师在YARN(MapReduce2.0)中?https://hadoop.apache.org/docs/current2/hadoop-yarn/hadoop-yarn-site/YARN.html也想知道为什么上面链接的图底框里没有applicationmaster?我不是在寻找它的作用,而是在寻找它是什么!!(喜欢=>不确定容器是否意味着像spring容器(这意味着jar文件列表?)或者它的服务器像web服务器?应用程序主机是否意味着简单的Java类?) 最佳答案 节点管理器是每台机器的框架代理,负责启

Hadoop Yarn 守护进程停止运行

运行start-dfs.sh和start-yarn.sh后跟jps给出以下输出:8227ResourceManager8328NodeManager7804NameNode8366Jps8077SecondaryNameNode7901DataNode如果我在大约5秒后运行jps,输出是:7804NameNode8473Jps8077SecondaryNameNode7901DataNode两个yarn守护进程(ResourceManager和NodeManager)由于某些原因停止工作。知道为什么会发生这种情况吗? 最佳答案 这通