YARN_OPTS

java - 如何使用 MVN 构建 hortonworks/simple-yarn-app

我是Hadoop新手。最近我在研究Hadoop2.6.0(Yarn)。现在，我想研究一个简单的yarn应用程序。我找到了thissimpleyarnapp.但遗憾的是，当我运行mvnpackage时，它显示如下错误:[ERROR]Failedtoexecutegoalorg.apache.maven.plugins:maven-compiler-plugin:2.0.2:compile(default-compile)onprojectsimple-yarn-app:Compilationfailure:Compilationfailure:[ERROR]/home/user/simp

simple-yarn-app hortonworks gt lt java maven hadoop hadoop-yarn build-error

hadoop - 哪种方法阻止 reducer 在 hadoop yarn 中启动实际的 reduce 阶段？

我是hadoopyarn的新手，希望reducers在完成所有映射之前开始实际的缩减过程。我试图找出调用reducer但找不到的类。任何人都可以在这方面帮助我吗？最佳答案在所有映射器完成之前，reducer只能开始收集映射器的输出。这称为shuffle阶段。但是，它们无法启动sorting和reduce阶段，因为它们需要在开始工作之前拥有ALLmap输出记录在他们。原因很简单:想象一下wordcount示例，您想要计算一个词的出现频率。在reduce阶段，如果您在获取所有映射器的输出(即一些计数是缺少这个词)，那么，你可能会给出

hadoop reducer 射器 section code mapreduce hadoop-yarn

java - hadoop 和 yarn 的 Maven 依赖项

为什么某些Maven依赖项给我jdk.tools.1.8.jar错误而其他人没有？例如，下面的依赖不会导致任何问题org.apache.hadoophadoop-hdfs2.7.1然后是下面的org.apache.hadoophadoop-yarn-common2.7.1原因Missingartifactjdk.tools:jdk.tools:jar:1.8我使用的是java1.7，它是jdk1.7.0_71而不是JRE。我的执行环境是这样设置的我知道还有其他类似的线程，但我无法正常工作。最佳答案我设法通过包含以下依赖项来解决这

hadoop Maven gt lt section java eclipse hadoop-yarn

hadoop - YARN-Cgroups : Failed to initialize container executor in non-secure cluster

我正在尝试在非安全模式下将cgroups与YARN2.6.0结合使用。有用如果我使用DefaultContainerExecutor就好了。但是，当我尝试使用LinuxContainerExecutor时出现错误。现在，当我执行-->$yarnnodemanager时，它失败了ExitCodeExceptionexitCode=24:File/home/hduser2/hadoop/hadoop-2.6.0/etc/hadoopmustbeownedbyroot,butisownedby1001atorg.apache.hadoop.util.Shell.runCommand(Shel

YARN-Cgroups initialize hadoop NodeManager mapreduce hadoop-yarn cgroups

hadoop - 从 yarn 边缘读取字节时出现 OutOfMemory 错误

我在yarn中做一个BFS算法，我为我的顶点上的数据(顶点数据)创建了一个自定义值。但是，在我这样做之后，读取边缘的过程出了点问题。我将错误跟踪到以下代码行:在ByteArrayEdges中，变量serializedEdgesBytesUsed获取值1987015248并在分配新数组时给出OutOfMemory错误(java限制据我所知是64K)@OverridepublicvoidreadFields(DataInputin)throwsIOException{serializedEdgesBytesUsed=in.readInt();if(serializedEdgesBytesU

时出 OutOfMemory java ProgressableUtils apache hadoop hadoop-yarn giraph

hadoop - Spark on Yarn 作业失败，退出代码为 :1 and stderr says "Can' t find main class"

我们尝试将一个简单的SparkPI示例提交到SparkonYarn。bat写法如下:./bin/spark-submit--classorg.apache.spark.examples.SparkPi--masteryarn-cluster--num-executors3--driver-memory4g--executor-memory1g--executor-cores1.\examples\target\spark-examples_2.10-1.4.0.jar10pause我们的HDFS和Yarn运行良好。我们正在使用Hadoop2.7.0和Spark1.4.1。我们只有1个节

amp hadoop 1440062075415 application 2015 apache-spark hadoop-yarn

bash - Hadoop Yarn 上的 Spark 安装

请有人帮助我，我正在尝试在HaoopYarn上安装spark，但出现此错误:org.apache.spark.SparkException:Yarnapplicationhasalreadyended!Itmighthavebeenkilledorunabletolaunchapplicationmaster.atorg.apache.spark.scheduler.cluster.YarnClientSchedulerBackend.waitForApplication(YarnClientSchedulerBackend.scala:113)atorg.apache.spark.s

Hadoop Spark HADOOP_INSTALL export bash apache-spark hadoop-yarn

hadoop - Yarn Application master 和容器分配

在YARN中，应用程序主机向资源管理器请求资源，以便可以启动该应用程序的容器。applicationmaster是在启动第一个容器之前等待所有资源分配完毕，还是请求每个容器，当它获得容器的资源时，它开始启动特定的容器？即只有部分资源可用时的情况呢？它是否等待资源被释放？还是根据可用资源继续？MR应用程序主机如何决定MR作业的资源需求？是YARNMR客户端确定这个并将它发送给AM还是AM找到它？如果是这样，这是基于什么？我相信这是可配置的，但我可能在谈论未提供内存和CPU时的默认情况。最佳答案不，AM不会等待所有资源分配完毕。相反

Application 容器 mapreduce section hadoop resources admin hadoop-yarn

hadoop - 如何杀死所有处于 "ACCEPTED"状态的 yarn 应用程序

如何杀死所有处于“已接受”状态的yarn应用程序。我有超过1K个处于接受状态的进程，我如何才能将它们全部杀死。目前我正在使用这个shell脚本来终止所有已接受的作业:forappin`yarnapplication-list|awk'$6=="ACCEPTED"{print$1}'`;doyarnapplication-kill"$app";done有没有更好的方法呢？最佳答案据我所知，创建小脚本是目前正确的方法，您已经这样做了。由于“-Appstates”选项仅适用于-list子命令，因此没有其他内置shell选项可用于执行此

杀死 amp section 处于 hadoop hadoop-yarn

java - 在集群模式下将 Spark 从 eclipse 部署到 YARN 时出错

我正在尝试将ApacheSparkPi示例从Eclipse部署到HadoopYARN。我正在使用3个带有Linux的虚拟机运行自己的集群。集群中的Hadoop版本为2.7.2，Spark为1.6.0，并预构建了Hadoop2.6.0及更高版本。我能够从节点运行Pi示例，但是当我想从Windows上的eclipse(yarn集群模式)运行javaPi示例时，出现如下所示的错误。我发现有几个线程出现此错误，但其中大部分是针对带有一些额外变量的cloudera或hortonwork，或者没有解决我的问题。我还尝试了YARN客户端模式，结果相同。有人可以帮助我吗？Eclipse控制台输出:16

时出 eclipse application hadoop 1456222391080 java apache-spark hadoop-yarn

47 48 495051 52 53