yarn-site

java - 无法在 ambari 中重启 yarn 节点管理器

我是ambari和yarn的新手，我的新flashambari机器没有任何其他配置。ambari版本是最新的，这里是yarn.py地址:ambari-server/src/main/resources/common-services/YARN/2.1.0.2.0/package/scripts/yarn.py我发现了一些潜在的解决方案，例如https://community.hortonworks.com/questions/11907/nodemanager-fails-to-start-io-error-lock.html和https://reviews.apache.org/r/

hadoop - Flink 在 YARN : Amazon S3 wrongly used instead of HDFS 上

我关注了FlinkonYARN'ssetupdocumentation.但是，当我使用./bin/yarn-session.sh-n2-jm1024-tm2048运行时，在向Kerberos进行身份验证时，出现以下错误:2016-06-1617:46:47,760WARNorg.apache.hadoop.util.NativeCodeLoader-Unabletoloadnative-hadooplibraryforyourplatform...usingbuiltin-javaclasseswhereapplicable2016-06-1617:46:48,518INFOorg.a

wrongly instead java apache FileSystem hadoop amazon-s3 hadoop-yarn apache-flink flink-cep

scala - 限制 yarn 容器一次只能执行一个任务

我正在使用hadoop集群运行Spark程序，它使用yarn调度程序来运行任务。但是，我注意到一个奇怪的行为。yarn有时会杀死提示内存不足错误的任务，而如果我轮流执行任务，即执行与容器/执行程序相同数量的任务，让它们完成，然后执行下一组任务，它运行良好，这意味着任务使用的内存不会超过容器中允许的内存。所以，我怀疑yarn试图在容器中并行运行多个任务，这就是容器内存不足的原因。有没有办法限制这种行为并告诉yarn在容器中一次只运行一个任务。最佳答案一般来说，Spark请求的每个YARN容器直接对应一个“执行器”，即使YARN可能

容器 scala code section hadoop apache-spark hadoop-yarn bigdata

hadoop - 如何知道 Yarn 公平份额调度程序是否发生抢占？

有什么办法可以确定YARN是否触发了抢占机制？可能在YARN资源管理器或日志中？最佳答案如果您的日志级别设置为info，您应该会在YARN资源管理器日志中看到它。//Warnapplicationaboutcontainerstobekilledfor(RMContainercontainer:containers){FSAppAttemptapp=scheduler.getSchedulerApp(container.getApplicationAttemptId());LOG.info("Preemptingcontaine

抢占 hadoop section yarn hive hadoop-yarn

hadoop - yarn 上的 Apache Hive

根据我对博客的理解，Yarn(mapred2)比hadoop的mapreduce更快或更智能。如果它是真的，有没有办法配置Hive以使用Yarn/Mapred2而没有任何复杂性来提高性能或增加资源利用率？最佳答案 Hive在Yarn的开箱即用映射上运行。但是在Yarn上运行一个旧的Hive不会是惊天动地的体验，你可能会测量相同的时间。您想要的是获得最新的Hive开发和改进(例如ORCandVectorization)，也许尝试运行HiveonTez.我建议阅读Stinger并检查这个deploymentguide.

hadoop Apache section noreferrer noopener hive hadoop-yarn

hadoop - 如何在hadoop2(yarn)中使用JobClient

(已解决)我想联系hadoop集群并获取一些工作/任务信息。在hadoop1中，我可以使用JobClient(本地伪分布式模式，使用Eclipse):JobClientjobClient=newJobClient(newInetSocketAddress("127.0.0.1",9001),newJobConf(config));JobIDjob_id=JobID.forName("job_xxxxxx");RunningJobjob=jobClient.getJob(job_id);.....今天我搭建了一个伪分布式hadoop2YARN集群，但是上面的代码并没有运行。我使用资源管理

hadoop 何在 JobClient section hadoop-yarn hadoop2

java - 从 Java 应用程序在 hadoop 2.2 (Yarn) 上启动 mapreduce 作业

我正在尝试从Java应用程序调用mapreduce作业。在以前的hadoop版本(1.x)中，我创建了一个Configuration对象和一个Job对象，在Configuration中设置mapred.job.tracker和fs.default.name并运行Job。现在，在hadoop2.x中，作业跟踪器不再存在，也不存在任何关于如何以编程方式运行MR作业的文档。有什么想法吗？我正在寻找的是此处给出的解释:callmapreducefromajavaprogram 最佳答案你需要三样东西://thisshouldbeliked

mapreduce hadoop section java hadoop-yarn resourcemanager

hadoop - yarn : what subsystem connecting to port 44874

我正在尝试在YARN上运行我的MR作业。节点3上的其中一个用户日志中存在此错误:2014-10-1000:57:16,965INFO[main]org.apache.hadoop.mapred.YarnChild:Executingwithtokens:2014-10-1000:57:16,965INFO[main]org.apache.hadoop.mapred.YarnChild:Kind:mapreduce.job,Service:job_1412895371072_0001,Ident:(org.apache.hadoop.mapreduce.security.token.Jo

connecting subsystem hadoop apache java mapreduce hadoop-yarn

java.io.IOException : Cannot initialize Cluster in Hadoop2 with YARN 异常

这是我第一次在stackoverflow上发帖，所以如果我做错了什么，我深表歉意。我最近建立了一个新的hadoop集群，这是我第一次尝试使用Hadoop2和YARN。我目前在提交作业时遇到以下错误。java.io.IOException:CannotinitializeCluster.Pleasecheckyourconfigurationformapreduce.framework.nameandthecorrespondserveraddresses.atorg.apache.hadoop.mapreduce.Cluster.initialize(Cluster.java:120)

IOException initialize hadoop jar 01 java hadoop-yarn hadoop2

hadoop - $SPARK_HOME 中包含的 hive-site.xml 是什么样的？

我是hive的初学者，当我启动spark作业并从hive读取数据时发生了一些事情(找不到表)。我没有在$SPARK_HOME/conf中设置hive-site.xml吗？提交spark作业命令在这里bin/spark-submit--masterlocal[*]--driver-memory8g--executor-memory8g--classcom.ctrip.ml.client.Client/root/GitLab/di-ml-tool/target/di-ml-tool-1.0-SNAPSHOT.jar 最佳答案在您的Hi

中包 SPARK_HOME section hive AdminManualConfiguration-hive-sit hadoop apache-spark

15 16 171819 20 21