Yarn

hadoop - 无法在 yarn 模式下启动 Spark Shell

无法在yarn模式下启动SparkShell。当我运行此./spark-shell--masteryarn--deploy-modeclient它永远卡在这里打印相同的消息。18/03/1420:11:38INFOClient:clienttoken:N/Adiagnostics:N/AApplicationMasterhost:N/AApplicationMasterRPCport:-1queue:defaultstarttime:1521058297214finalstatus:UNDEFINEDtrackingURL:http://ip-172-31-0-54:8088/prox

hadoop Spark gt lt property apache-spark

hadoop - 如何更改在 yarn 上运行的 spark 作业的 java.io.tmpdir

如何为在YARN上运行的Hadoop3集群更改java.io.tmpdir文件夹？默认情况下，它会得到类似于/tmp/***的内容，但我的/tmp文件系统对于YARN作业将写入的所有内容来说都太小了。有办法改变吗？我也在core-site.xml中设置了hadoop.tmp.dir，不过貌似，并没有真正用到。最佳答案也许它是Whatshouldbehadoop.tmp.dir?的副本.此外，遍历/etc/hadoop/conf中的所有.conf并搜索tmp，看看是否有任何内容是硬编码的。还要指定:您是否看到(任何)文件在您指定的

hadoop tmpdir section code apache-spark hadoop-yarn

apache-spark - 在 yarn 下的 spark 作业中连接 Kerberos + 启用 SSL 的 solr

我有启用了Kerberos和SSL的SOLR6集群。当我使用带有CloudSolrClient的测试客户端连接到它时，它工作正常。但是在spark作业驱动程序中运行相同的代码时，我得到以下校验和失败错误。我检查了所有提到的与校验和相关的问题，例如反向dns查找和添加javaunlimitedjar，所有yarn节点中的一切看起来都是正确的。我还可以验证它们是否正确，因为我的普通Java客户端能够从所有服务器进行查询。Causedby:org.apache.solr.client.solrj.impl.HttpSolrClient$RemoteSolrException:Errorfro

spark apache-spark DEBUG lt 34 hadoop ssl hadoop-yarn kerberos

apache-spark - 无法通过 YARN 访问 Spark UI

我正在构建一个docker镜像，以针对使用YARN的生产Hadoop集群在本地运行zeppelin或spark-shell。编辑:环境是macOS我可以很好地执行作业或spark-shell，但是当我尝试访问YARN上的TrackingURL时，作业正在运行，它会挂起YARN-UI整整10分钟。YARN仍在工作，如果我通过ssh连接，我可以执行yarn命令。如果我不访问SparkUI(直接或通过YARN)，什么也不会发生。作业已执行且YARN-UI未挂起。更多信息:本地，在Docker上:Spark2.1.2、Hadoop2.6.0-cdh5.4.3生产环境:Spark2.1.0、Ha

apache-spark apache docker section spark hadoop hadoop-yarn spark-ui

hadoop - 运行 yarn jar 命令时更改 tmp 目录

我正在使用yarnjar命令运行MR作业，它会在/tmp文件夹中创建一个临时jar，它会填满整个磁盘空间。我想将这个jar的路径重定向到我有更多磁盘空间的其他文件夹。关于这个link，我开始知道我们可以通过为hadoop版本1.x设置属性mapred.local.dir来更改路径。我正在使用以下命令来运行jaryarnjarmyjar.jarMyClassmyyml.ymlarg1-Dmapred.local.dir="/grid/1/uie/facts"上面的参数mapred.local.dir没有改变路径，它仍然在tmp文件夹中创建jar。最佳答案

hadoop yarn section strong jar mapreduce hadoop-yarn

hadoop - NoSuchMethodException org.apache.hadoop.yarn.api.records.URL.fromURI

我正在尝试从hbase表中读取数据，对其进行一些处理并使用以下代码将其存储在另一个表中packageanalysis;importjava.io.IOException;importorg.apache.hadoop.io.Text;importorg.apache.hadoop.conf.Configuration;importorg.apache.hadoop.hbase.HBaseConfiguration;importorg.apache.hadoop.hbase.client.Put;importorg.apache.hadoop.hbase.io.ImmutableByte

hadoop NoSuchMethodException apache org hbase

apache-spark - 我们在yarn cluster中运行时在哪里可以看到spark输出控制台

我是Spark、Hadoop和Yarn的初学者。我用以下命令安装Spark:https://spark.apache.org/docs/2.3.0/和Hadoop/yarn:https://hadoop.apache.org/docs/stable/hadoop-project-dist/hadoop-common/SingleCluster.html.我的目标是在yarncluster上运行spark应用程序，但我遇到了问题。我们怎么知道我们的设置何时工作？我会告诉你我的例子。完成设置后，我尝试运行测试jar:examples/jars/spark-examples*.jar。当我在

中运行时 spark section cluster apache-spark hadoop hadoop-yarn

apache-spark - 使用的 YARN vCores : Spark on YARN

我正在使用以下配置在YARN上提交spark应用程序conf.set("spark.executor.cores","3")conf.set("spark.executor.memory","14g")conf.set("spark.executor.instances","4")conf.set("spark.driver.cores","5")conf.set("spark.driver.memory","1g")但是，在YARN资源管理器UI上，它显示vCoresused=5，我预计vCores曾经是17((4x3)+5=17)即12执行人和5驱动程序。但它总是显示等于execu

YARN apache-spark spark section 34 hadoop pyspark hadoop-yarn

rest - 通过 REST API [MapR 6.1/Hadoop-2.7] 从 Yarn 查询节点标签拓扑

有一个Java和CLI接口(interface)可以查询YarnRM的节点到节点标签(和反向)映射。有没有办法通过REST-API来做到这一点？最初的RM-API搜索显示只有基于节点标签的作业提交是一个选项。遗憾的是，这实际上在MapR-Hadoop(截至6/6/19的6.1)中被破坏了，所以我的代码必须通过实现正确的调度本身来解决这个问题。这可以使用YarnClientJavaAPI(几乎没有-这里还有更多损坏的API)。但由于我想同时针对不同的资源管理器安排作业，在防火墙后面，REST-API是实现此目的最引人注目的选择，而YarnClientAPI的RPC后端不容易传输。我目前最

Hadoop rest code section apache hadoop-yarn mapr

hadoop - 直线中 Tez 作业的作业名称并在 YARN 中查看

我正在使用Beeline并喜欢为TEZ作业设置一个特定的名称，就像我使用mapreduce.job.name对于MapReduce作业。我试过hive.query.name,但它对yarnapplication-list没有任何影响.有人说我们只能在TEZUI中查看名称，但我只能访问YARN。请帮助我。我在Beeline中有一个加载脚本，现在正在运行TEZ作为执行引擎，当我尝试使用yarnapplication-list查看YARN中的事件应用程序时命令，我得到类似HIVE-的信息作为工作名称。我想将其更改为更具可读性。如果执行引擎是SETmapreduce.job.name=myJo

hadoop YARN code section myJobName hiveql hadoop-yarn beeline apache-tez

45 46 474849 50 51