草庐IT

YARN_OPTS

全部标签

hadoop - 没有 yarn map-reduce 工作?

我正在研究centos6.5和hadoop2.7.2上的hadoopmap-reduce。我了解到hdfs只是分布式文件系统,而Yarn管理map-reduce工作,所以我认为如果我不打开Yarn(资源管理器、节点管理器),map-reduce将不起作用。因此,我认为,wordcount不应该在仅使用hdfs而不是yarn的系统中执行map-reduce过程。(关于伪分发模式)但是当我打开hdfs而不是Yarn时,如下所示,并执行wordcount示例时,它显示“map-reduceframework”。这是什么意思?有没有可能只有hdfsprocessmap-reduce没有Yarn

hadoop - yarn模式提交spark应用时出现异常

异常:java.lang.NoSuchMethodError:org.apache.http.client.utils.URLEncodedUtils.parse(Ljava/lang/String;Ljava/nio/charset/Charset;)Ljava/util/List; 最佳答案 这是库版本冲突的情况。你应该检查几件事:你的运行时类路径是什么,特别是检查来自hadoop安装的库。如果有的话,你的fat-jar带来了哪些图书馆。您使用--jar选项添加的库。您还应该检查spark依赖于哪些库。一切都应该是一致的,但你的

linux - yarn -env.sh : command not found

我在Ubuntu16.04上安装了Hadoop2.7.2。当我运行命令时:start-yarn.sh它给出了以下输出:startingyarndaemons/usr/local/hadoop-2.7.2/etc/hadoop/yarn-env.sh:line122:rt:commandnotfoundstartingresourcemanager,loggingto/usr/local/hadoop-2.7.2/logs/yarn-hduser-resourcemanager-brij-Compaq-15-Notebook-PC.out/usr/local/hadoop-2.7.2/e

hadoop - 我想知道(公式)如何计算 namenode、yarn 和 Resource Manager 的 RAM、CPU 和磁盘内存

我正在尝试构建不同大小的集群,这就是为什么我需要可以从中计算namenode、yarn和资源管理器的RAM、CPU和磁盘内存的公式。还想知道RAM、CPU和磁盘之间的关系。 最佳答案 您可以使用Cloudera指南Download 关于hadoop-我想知道(公式)如何计算namenode、yarn和ResourceManager的RAM、CPU和磁盘内存,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.co

hadoop - 如何在远程 Yarn 资源管理器上部署 samza 作业

我们在hadoopyarn上运行samza作业。到目前为止,我们都是通过在ResourceManager主机上调用run-job.sh来手动部署作业。run-job.sh--config-factory=org.apache.samza.config.factories.PropertiesConfigFactory--config-path=file:///usr/share/promo-rules-consumer/config/config.propertiesSamza部署脚本和samza分发tar"samza-dist.tar.gz"都放在资源管理器本地文件系统上。但现在我想

hadoop - 在集群上找到 yarn 日志

这个问题在这里已经有了答案:WheredoesHadoopstorethelogsofYARNapplications?(2个答案)关闭6年前。我用yarnlogs-applicationId"id"要在命令行上显示日志,但我需要在集群上找到文件。我想知道日志保存在集群上的什么位置?

hadoop - Spark YARN 配置问题 : Container keep failing

我正在尝试将数据框保存为文本文件,但即使是小数据也需要很多时间。我相信我的配置有问题。有人可以告诉我我在这里做错了什么吗?spark.default.parallelism640spark.hadoop.fs.s3.cse.plaintextLength.enabledfalsespark.hadoop.fs.s3n.filestatuscache.enabletruespark.hadoop.mapreduce.input.fileinputformat.split.maxsize33554432spark.executor.iddriverspark.executor.instan

hadoop - 我可以强制 YARN 使用 Application Master 容器的主节点吗?

在我的Hadoop/Spark运行期间,我的大主节点硬件几乎什么都不做,因为YARN在每个任务上为其AM使用随机从节点。我更喜欢旧的Hadoop1;当出现问题时,通过这种方式可以避免大量的日志追踪和ssh痛苦。这可能吗? 最佳答案 Spark和YARN节点标签是可能的。标记你的节点使用spark.yarn.am.nodeLabelExpression属性好读:https://developer.ibm.com/hadoop/2017/03/10/yarn-node-labels/ 关于h

hadoop - yarn 动态重新分配剩余的计算能力

我想知道如何为yarn配置动态队列:假设有2个队列A(高性能,集群的70%)B(正常,其余=集群的30%)我注意到B项目只会坚持分配给它们的资源,即使其他70%是空的。我如何重新分配这些资源(如果没有A作业)以更快地完成B作业? 最佳答案 容量调度程序文档https://hadoop.apache.org/docs/current/hadoop-yarn/hadoop-yarn-site/CapacityScheduler.html对队列间的弹性和资源抢占提出了一些观点。Elasticity-Freeresourcescanbeal

hadoop - YARN 容器启动失败

我无法在配置单元上运行查询。查询在启动mapreduce操作后立即失败(MAP0%REDUCE0%)。在nodemanager日志中发现如下错误。2017-03-1611:53:03,581ERROR[ContainerLauncher#0]org.apache.hadoop.mapreduce.v2.app.launcher.ContainerLauncherImpl:Containerlaunchfailedforcontainer_1489041811986_0005_01_000002:java.lang.IllegalArgumentException:Doesnotcont