yarn的常用命令

hadoop - 在单节点上运行 Spark on YARN

我正在学习一些数据科学，我正在尝试发现和理解与之相关的各种工具。到目前为止，我已经在MacOS上成功安装了Hadoop2.8.0，现在我想让Spark2.1.1也能正常工作。我知道Spark不一定需要Hadoop环境才能工作，但我也知道让它在YARN上运行对于与其他应用程序共享数据很有用。在网上阅读了不同的指南和建议后，这就是我所做的:在Hadoop配置文件中，我在yarn-site.xml中添加:yarn.nodemanager.aux-servicesmapreduce_shuffleyarn.nodemanager.aux-services.mapreduce.shuffle.c

hadoop - 如何在 Hadoop yarn 上设置 apache shark？

我已经在hadoopyarn上设置了一个spark集群，现在我想在spark上设置shark。但是没有文章在yarn上设置spark上设置shark。有什么方法可以做到这一点，或者我应该将我的Spark集群设置为独立集群。最佳答案这是我实现的工作模型之一https://github.com/amplab/shark/wiki/Running-Shark-on-a-Cluster 关于hadoop-如何在Hadoopyarn上设置apacheshark？，我们在StackOverflo

何在 hadoop section shark Running-Shark-on-a-Cluster apache-spark hadoop-yarn

【Hadoop】集群配置之主要配置文件（hadoop-env.sh、yarn-env.sh、core-site.xml、hdfs-site.xml、mapred-site.xml...）

Hadoop配置文件模板core-site.xmlhadoop-env.shhdfs-site.xmlyarn-env-shyarn-site.xmlmapred-site.xmlslavesHadoop配置文件模板参考官方配置文档：https://hadoop.apache.org/docs/stable/hadoop-project-dist/hadoop-common/ClusterSetup.html#Configuring_Environment_of_Hadoop_DaemonsHadoop的配置文件都在$HADOOP_HOME/etc/hadoop下面。比如我这里是：Hadoop

site 配置 span class token hadoop xml hdfs

Hadoop/Yarn (v0.23.3) 伪分布式模式设置::无作业节点

我刚刚在伪分布式模式下设置了Hadoop/Yarn2.x(特别是v0.23.3)。我遵循了一些博客和网站的说明，它们或多或少提供了设置它的相同处方。我也关注了O'reilly的第3版Hadoop书(具有讽刺意味的是，它是最没有帮助的)。问题:Afterrunning"start-dfs.sh"andthen"start-yarn.sh",whileallofthedaemonsdostart(asindicatedbyjps(1)),theResourceManagerwebportal(Here:http://localhost:8088/cluster/nodes)indicate

Hadoop 23.3 gt lt mapreduce hadoop-yarn mrv2

hadoop - 是否可以在 Hadoop 1(没有 YARN)中使用 Impala？

我在Hadoop1的限制中看到我们唯一可以使用的范例是mapreduce。如果您想使用其他范例(例如spark)，则必须使用Hadoop2.0和YARN。但我有一个与Impala相关的问题。是否可以在没有YARN的情况下使用Impala？谢谢。最佳答案是的，Impala可以独立于YARN使用。关于hadoop-是否可以在Hadoop1(没有YARN)中使用Impala？，我们在StackOverflow上找到一个类似的问题： https://stacko

hadoop section Impala YARN bigdata hadoop-yarn

hadoop - 向 YARN 提交 wordcount 示例(SchedulerUtils.validateResourceRequest 的异常)

我得到以下异常:java.lang.NullPointerException:java.lang.NullPointerExceptionatorg.apache.hadoop.yarn.server.resourcemanager.scheduler.SchedulerUtils.validateResourceRequest(SchedulerUtils.java:196)atorg.apache.hadoop.yarn.server.resourcemanager.RMAppManager.submitApplication(RMAppManager.java:253)atorg

validateResourceRequest SchedulerUtils java hadoop apache hadoop-yarn

hadoop - 在没有 YARN 的情况下安装 HDFS 以与 SHARK 一起使用

我正在尝试安装ApacheShark。其中一项要求是安装HDFS。我不想使用YARN或MESOS。我只想要HDFS。我的问题是:这是否意味着我只能安装2.x之前的hadoop发行版？如果有，是哪一个？或者我可以使用Hadoop2.4并以某种方式禁用YARN吗？我不太确定该怎么做。我能找到的所有教程似乎都使用YARN。有人对如何仅在2.x中使用HDFS有任何建议吗？如果只想安装HDFS，我需要哪个hadoop发行版？最佳答案要使用shark，您需要安装:HDFS存储数据hive用于内存中使用的Sparkyarn不是强制性的

hadoop SHARK section HDFS YARN apache-spark shark-sql

java - YARN hadoop错误java堆空间

我在hadoop2.6.0上使用YARN。当我运行mapreduce作业时，出现如下错误:15/03/1222:22:59INFOmapreduce.Job:TaskId:attempt_1426132548565_0003_m_000002_1,Status:FAILEDError:Javaheapspace15/03/1222:22:59INFOmapreduce.Job:TaskId:attempt_1426132548565_0003_m_000000_1,Status:FAILEDError:Javaheapspace15/03/1222:23:20INFOmapreduce

java hadoop section mapreduce 1426132548565 memory heap-memory hadoop-yarn

hadoop - 为什么 hadoop yarn mapreduce 作业不工作并停止运行作业？

我有一个mapreduce作业，我用YARN模式运行它。但是为什么我的mapreduce作业在运行作业步骤时停止而不继续？是这样的:15/04/0417:18:21INFOimpl.YarnClientImpl:Submittedapplicationapplication_1428142358448_000215/04/0417:18:21INFOmapreduce.Job:Theurltotrackthejob:http://master:8088/proxy/application_1428142358448_0002/15/04/0417:18:21INFOmapreduce.

hadoop mapreduce section 1428142358448 memory jobs hadoop-yarn

hadoop - 长期运行的 yarn 应用程序的设计问题

我正在尝试编写一个yarn应用程序，并希望就我想到的几个设计问题获得一些建议。我已经了解了更简单的示例应用程序，如分布式shell及其一些变体，因此我熟悉基本的API。我想做的是创建一个具有Web界面的应用程序，用户可以与之交互并可能提供某种任务(任务的性质无关紧要)。基于这项工作，UI请求容器进行处理。我想到的理想安排是我的应用程序主管提供此WebUI，并且在有人来到AM网站并请求一些工作之前不会分配任何容器。此时，AM应该可以注册新容器并为其分配工作。如果AM提供WebUI，我的理解是每次向RM提交申请时，AM都由RM选择。这意味着AM可以有不同的IP，因此在应用程序重新启动时有不

hadoop yarn 容器 section 的 hadoop-yarn hadoop2

16 17 181920 21 22