草庐IT

YARN_OPTS

全部标签

hadoop - Spark on yarn 概念理解

我想了解spark如何在YARN集群/客户端上运行。我心中有以下问题。yarncluster的所有节点都必须安装spark吗?我认为这应该是因为集群中的工作节点执行任务并且应该能够解码驱动程序发送到集群的spark应用程序中的代码(sparkAPI)?文档中说“确保HADOOP_CONF_DIR或YARN_CONF_DIR指向包含Hadoop集群(客户端)配置文件的目录”。为什么client节点在向集群发送作业时必须安装Hadoop? 最佳答案 添加到其他答案。Isitnecessarythatsparkisinstalledona

hadoop - YARN 上的 Spark 中的日志在哪里?

我是新手。现在我可以在yarn(2.0.0-cdh4.2.1)上运行spark0.9.1。但是执行后没有log。以下命令用于运行spark示例。但是在正常的MapReduce作业中,在历史服务器中找不到日志。SPARK_JAR=./assembly/target/scala-2.10/spark-assembly-0.9.1-hadoop2.0.0-cdh4.2.1.jar\./bin/spark-classorg.apache.spark.deploy.yarn.Client--jar./spark-example-1.0.0.jar\--classSimpleApp--argsya

apache - Apache Hadoop YARN 中的 'mapreduce.map.memory.mb' 和 'mapred.map.child.java.opts' 是什么关系?

我想知道mapreduce.map.memory.mb和mapred.map.child.java.opts参数之间的关系。mapreduce.map.memory.mb>mapred.map.child.java.opts? 最佳答案 ma​​preduce.map.memory.mb是Hadoop允许分配给映射器的内存上限,以兆字节为单位。默认值为512。如果超过此限制,Hadoop将终止映射器并显示如下错误:Container[pid=container_1406552545451_0009_01_000002,contain

【大数据】yarn 任务中的几种状态变化详细过程

一、概述在YARN中,应用程序和Container的状态变化会影响任务的执行和资源分配。下面是YARN中应用程序和Container的状态详细过程:1)Application状态是指YARN应用程序的状态。每个应用程序都有一个唯一的ApplicationID,并且可以通过ResourceManagerAPI或YARNWebUI来获取应用程序的当前状态。在YARN中,应用程序状态可以有以下状态:NEW:应用程序刚创建时的状态。应用程序会被分配一个唯一的ApplicationID,但还没有分配资源,也没有进入资源队列。NEW_SAVING:应用程序等待资源保存。这个状态只存在于开启了Applica

javascript - 如何以本地用户身份安装和运行 Yarn(没有管理员权限)?

这个问题在这里已经有了答案:HowtoinstallNodeJSLTSonWindowsasalocaluser(withoutadminrights)(12个答案)关闭4年前。我以普通用户身份使用Windows(我没有任何管理员权限),想安装Yarn并使用YarnInstall、YarnAdd和YarnStart等命令。我在Stackoverflow上找到了关于如何以本地用户身份安装Node.JS的内容,但我无法让它在该文件夹之外工作:installNodeJSLTSonWindowsasalocaluser(withoutadminrights)我现在将Node解压到文件夹中:C:

java - 在 Windows 上全局设置 "JAVA_OPTS"

我需要在Windows机器上全局设置-Dfile.encoding=UTF8。我尝试在MyComputer->Properties->EnvironmentVariables中以及通过ControlPanel->Java->JavaRuntimeEnvironmentSettings设置JAVA_OPTS环境变量,但这些都没有效果.如何在Windows中全局设置JAVA_OPTS(特别是file.encoding属性)?谢谢 最佳答案 您是否尝试设置环境变量JAVA_TOOL_OPTIONS?将它设置为"-Dfile.encodin

windows - 如果我通过 Windows 安装程序安装,如何更新 yarn?

我已经通过windowsinstaller安装了yarn有时回来。现在我想将它更新到最新版本。我该怎么做? 最佳答案 以下对我有用:npmi-gyarn 关于windows-如果我通过Windows安装程序安装,如何更新yarn?,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/45953681/

【深入浅出 Yarn 架构与实现】6-3 NodeManager 分布式缓存

不要跳过这部分知识,对了解NodeManager本地目录结构,和熟悉Container启动流程有帮助。一、分布式缓存介绍主要作用就是将用户应用程序执行时,所需的外部文件资源下载缓存到各个节点。YARN分布式缓存工作流程如下:客户端将应用程序所需的文件资源(外部字典、JAR包、二进制文件)提交到HDFS上。客户端将应用程序提交到RM上。RM将与某个NM进行通信,启动应用程序AM,NM收到命令后,首先从HDFS上下载文件(缓存),然后启动AM。AM与RM通信,以请求和获取计算资源。AM收到新分配到的计算资源后,与对应的NM通信,以启动任务。如果应用程序第一次在该节点上启动任务,NM首先从HDFS上

tcp - 发送消息后客户端关闭,为什么gen_tcp with opts {active, false}接受两次

我只是用gen_tcp做了一个测试。一个简单的回显服务器和一个客户端。但客户端启动和关闭,服务器接受两个连接,一个是好的,另一个是坏的。我的演示脚本有任何问题,如何解释?服务器-module(echo).-export([listen/1]).-define(TCP_OPTIONS,[binary,{packet,0},{active,false},{reuseaddr,true}]).listen(Port)->{ok,LSocket}=gen_tcp:listen(Port,?TCP_OPTIONS),accept(LSocket).accept(LSocket)->{ok,Soc

java - JAVA_OPTS 和 JAVA_TOOL_OPTIONS 之间的区别?

什么时候应该使用这些环境变量? 最佳答案 JAVA_TOOL_OPTIONS被一些JDK工具读取,但适用性有限。JAVA_OPTS是ApacheTomcat和其他一些应用程序使用的约定,但不是由Sun/Oracle、AFAIK发布的任何JDK工具直接读取。来自:https://forums.oracle.com/forums/thread.jspa?messageID=6438415JAVA_OPTSisnotanenvironmentvariablethatthejavaexecutablewillrecognizeonit'so