草庐IT

yarn-error

全部标签

scala - yarn 上的 Spark ;如何将指标发送到 Graphite 水槽?

我是spark的新手,我们正在运行sparkonyarn。我可以很好地运行我的测试应用程序。我正在尝试收集Graphite中的Spark指标。我知道要对metrics.properties文件进行哪些更改。但是我的spark应用程序将如何看到这个conf文件?/xxx/spark/spark-0.9.0-incubating-bin-hadoop2/bin/spark-classorg.apache.spark.deploy.yarn.Client--jar/xxx/spark/spark-0.9.0-incubating-bin-hadoop2/examples/target/sca

apache-spark - spark over kubernetes vs yarn/hadoop 生态系统

关闭。这个问题是opinion-based.它目前不接受答案。想要改进这个问题?更新问题,以便editingthispost可以用事实和引用来回答它.关闭4年前。Improvethisquestion我看到spark比kubernetes有很大的吸引力。它比在Hadoop上运行spark更好吗?这两种方法都以分布式方法运行。有人可以帮助我了解在kubernetes上运行spark与在Hadoop生态系统上运行之间的区别/比较吗?谢谢

Hadoop YARN如何确定容器数量

我已将Hadoop2.3部署为单节点集群。由于YARN将资源分配为一个称为容器的单元,我如何知道我的单节点集群中正在运行多少个容器(通过查看日志、控制台等)?.我找不到任何方法来确定这一点,有人可以指导我查看正在使用的容器数量或JVM总数吗?提前致谢! 最佳答案 如果集群已启动并正在运行,您可以在集群的Web应用程序上看到它http://:8088/cluster可以在yarn-site中配置端口号,属性如下yarn.resourcemanager.webapp.address容器的数量取决于资源(cpu、内存)的可用性。以下文件可

hadoop - YARN中如何配置垄断FIFO申请队列?

我需要在hadoop集群中禁用YARN应用程序的并行执行。现在,YARN具有默认设置,因此多个作业可以并行运行。我看不出这样做有什么好处,因为这两个作业运行得都比较慢。我发现此设置yarn.scheduler.capacity.maximum-applications限制了最大应用程序数量,但它会影响已提交和正在运行的应用程序(如文档中所述)。我想将提交的应用程序保持在队列中,直到当前正在运行的应用程序未完成。如何做到这一点? 最佳答案 1)将调度程序更改为FairSchedulerHadoop发行版默认使用CapacitySche

hadoop - httpfs error Operation category READ is not supported in state standby 状态备用

我正在使用hadoopapache2.7.1,我有一个由3个节点组成的集群nn1nn2DN1nn1是dfs.default.name,所以它是主名称节点。我已经安装了httpfs并在重新启动所有服务后当然启动了它。当nn1处于事件状态且nn2处于待机状态时,我可以发送此请求http://nn1:14000/webhdfs/v1/aloosh/oula.txt?op=open&user.name=root从我的浏览器中出现打开或保存此文件的对话框,但是当我终止在nn1上运行的名称节点并正常重新启动它时,由于高可用性,nn1变为待机状态并且nn2激活。所以这里httpfs应该可以工作,即使

hadoop - Sqoop - 绑定(bind)到 YARN 队列

因此,对于mapreducev2,您可以使用绑定(bind)到某些YARN队列来管理资源和优先级。基本上通过使用“hadoopjar/xyz.jar-Dmapreduce.job.queuename=QUEUE1/input/output”完美运行。运行sqoop查询时如何将Yarn队列绑定(bind)与Sqoop集成?即。sqoopimport\--connect'jdbc://server'\--target-dir\还有什么? 最佳答案 对Sqoop也使用相同的方法,即sqoopimport-Dmapreduce.job.qu

hadoop - 现有 MapReduce 与 YARN (MRv2) 的区别

谁能告诉我,现有的MapReduce和YARN之间有哪些区别,因为我没有发现这两者之间所有明显的区别?P.S:我要求对这些进行比较。谢谢! 最佳答案 MRv1使用JobTracker创建任务并将其分配给数据节点,当集群扩展到足够大(通常大约4,000个节点)时,这可能成为资源瓶颈。MRv2(又名YARN,“YetAnotherResourceNegotiator”)每个集群都有一个资源管理器,每个数据节点都运行一个节点管理器。对于每个作业,一个从节点将充当ApplicationMaster,监控资源/任务等。

解决mac的navicat 16版本保存密码报错问题--Failed to save password Error code: -34018

先安装下面组件: ​​​​​​​NavicatPremium16.2.9Crack-Minorpatch.com|MacAppsFreeShare按照说明安装后(解压密码:http://minorpatch.com),一样会提示不安全,然后我在截图位置点击navicat.app仍然打开,(被我点掉了,现在没有了,如果你没有出现又打不开,请输入sudospctl--master-disable)。如果提示你安装包已经损坏了,请使用安装包用的工具。安装完成,打开-输入地址和密码,保存,成功!希望对大家有用,如果你没办法翻墙去原地址下载,我的百度又过期了,请私信我,可以私发给你。链接:https:/

hadoop - YARN UNHEALTHY 节点

在我们80%满的YARN集群中,我们看到一些yarnnodemanager被标记为不健康。在深入研究日志后,我发现它是因为数据目录的磁盘空间已满90%。出现以下错误2015-02-2108:33:51,590INFOorg.apache.hadoop.yarn.server.resourcemanager.rmnode.RMNodeImpl:Nodehdp009.abc.com:8041reportedUNHEALTHYwithdetails:4/4local-dirsarebad:/data3/yarn/nm,/data2/yarn/nm,/data4/yarn/nm,/data1/

hadoop - 从节点不在 Yarn ResourceManager 中

我设置了一个3节点ApacheHadoop集群。在主节点上,我可以看到[hadoop-conf]$jps16856DataNode17051SecondaryNameNode16701NameNode21601ResourceManager21742NodeManager18335JobHistoryServer在从属节点上,我看到了[fedora20-templatedfs]$jps28677Jps28510NodeManager27449DataNode我可以看到来自master:50070的三个事件节点。但是,在ResourceManagerWebUI(http://master