草庐IT

hadoop - yarn 容量调度程序中的队列内抢占

我在yarn中使用hadoop2.9.2进行内部队列抢占。我的队列间抢占工作正常,我设置了以下两个参数:https://docs.hortonworks.com/HDPDocuments/HDP3/HDP-3.1.0/data-operating-system/content/properties_for_configuring_intra-queue_preemption.html但队列内抢占仍然不起作用。任何线索都会有所帮助。 最佳答案 根据您的意见,您应该使用较低的数字来表示较高的优先级,因为第1个优先级总是比第20个优先级更

hadoop - 使用 yarn 客户端连接到 HDP 2.0 (Hortonworks Hadoop)

我在VirtualBox中下载并启动了HDP2.0,然后尝试使用YarnClient从Java进行连接YarnClientclient=YarnClient.createYarnClient();client.init(newConfiguration());client.start();client.createApplication();但是遇到了以下错误:1311[IPCClient(1943692956)connectionto/192.168.0.31:8050fromlordorient]DEBUGorg.apache.hadoop.ipc.Client.runnull–I

hadoop - ContainerLaunchContext.setResource() 缺少 hadoop yarn

http://hadoop.apache.org/docs/r2.1.0-beta/hadoop-yarn/hadoop-yarn-site/WritingYarnApplications.html我试图通过上面的链接使示例运行良好。但是我无法编译下面的代码Resourcecapability=Records.newRecord(Resource.class);capability.setMemory(512);amContainer.setResource(capability);//Setthecontainerlaunchcontentintothe//ApplicationSu

hadoop - 如何知道 yarn cluster 中可用的 reducer 插槽容量

我正在从Hadoop1.0迁移到支持YARN的集群。在1.0中运行临时作业时,我们过去常常根据作业跟踪器中报告的可用性指定reducer的数量,以加快处理速度。现在,在YARN的“所有应用程序”Web链接中,我们看不到任何此类有关可用性的列/信息。是否有任何配置文件或在网络链接中我们可以获得此信息? 最佳答案 Yarn中没有更多的插槽。相反,一切都取决于使用/需求的内存量。您可以配置yarn.nodemanager.resource.memory-mb和yarn.nodemanager.resource.cpu-vcores来控制任

hadoop - 在托管模式下运行 Yarn

我正在尝试在https://github.com/hortonworks/simple-yarn-app运行simple-yarn-app在托管模式下。我已经把jar从本地复制到hdfs了$hadoopfs-copyFromLocalsimple-yarn-app-1.0-SNAPSHOT.jar/simple-yarn-app-1.0-SNAPSHOT.jar当我尝试运行它时hadoopjarsimple-yarn-app-1.0-SNAPSHOT.jarcom.hortonworks.simpleyarnapp.Client/bin/date2/simple-yarn-app-1.

hadoop - YARN JobHistory 错误 : Failed redirect for container

我们最近用CDH5(2.3.0-cdh5.1.3)部署了YARN,集群正在运行文件,作业也在运行。但是如果作业完成(成功/失败),我们无法从资源管理器UI访问日志,我们会收到以下错误Failedredirectforcontainer_1412716537481_0322_01_000001Failedwhiletryingtoconstructtheredirecturltothelogserver.LogServerurlmaynotbeconfiguredContainerdoesnotexist.还有一些运行作业的异常:Causedby:org.apache.hadoop.ip

java - 如何使用 MVN 构建 hortonworks/simple-yarn-app

我是Hadoop新手。最近我在研究Hadoop2.6.0(Yarn)。现在,我想研究一个简单的yarn应用程序。我找到了thissimpleyarnapp.但遗憾的是,当我运行mvnpackage时,它显示如下错误:[ERROR]Failedtoexecutegoalorg.apache.maven.plugins:maven-compiler-plugin:2.0.2:compile(default-compile)onprojectsimple-yarn-app:Compilationfailure:Compilationfailure:[ERROR]/home/user/simp

hadoop - 哪种方法阻止 reducer 在 hadoop yarn 中启动实际的 reduce 阶段?

我是hadoopyarn的新手,希望reducers在完成所有映射之前开始实际的缩减过程。我试图找出调用reducer但找不到的类。任何人都可以在这方面帮助我吗? 最佳答案 在所有映射器完成之前,reducer只能开始收集映射器的输出。这称为shuffle阶段。但是,它们无法启动sorting和reduce阶段,因为它们需要在开始工作之前拥有ALLmap输出记录在他们。原因很简单:想象一下wordcount示例,您想要计算一个词的出现频率。在reduce阶段,如果您在获取所有映射器的输出(即一些计数是缺少这个词),那么,你可能会给出

java - hadoop 和 yarn 的 Maven 依赖项

为什么某些Maven依赖项给我jdk.tools.1.8.jar错误而其他人没有?例如,下面的依赖不会导致任何问题org.apache.hadoophadoop-hdfs2.7.1然后是下面的org.apache.hadoophadoop-yarn-common2.7.1原因Missingartifactjdk.tools:jdk.tools:jar:1.8我使用的是java1.7,它是jdk1.7.0_71而不是JRE。我的执行环境是这样设置的我知道还有其他类似的线程,但我无法正常工作。 最佳答案 我设法通过包含以下依赖项来解决这

hadoop - YARN-Cgroups : Failed to initialize container executor in non-secure cluster

我正在尝试在非安全模式下将cgroups与YARN2.6.0结合使用。有用如果我使用DefaultContainerExecutor就好了。但是,当我尝试使用LinuxContainerExecutor时出现错误。现在,当我执行-->$yarnnodemanager时,它失败了ExitCodeExceptionexitCode=24:File/home/hduser2/hadoop/hadoop-2.6.0/etc/hadoopmustbeownedbyroot,butisownedby1001atorg.apache.hadoop.util.Shell.runCommand(Shel