YARN_OPTS

hadoop - 普通身份验证失败 : User yarn is not configured for any impersonation. impersonationUser:alluxio mapreduce 中的 root

Causedby:org.apache.thrift.transport.TTransportException:Plainauthenticationfailed:Useryarnisnotconfiguredforanyimpersonation.模拟用户:root当我使用alluxio在本地运行wordcount程序时它工作正常。我也通过了集成测试，但是当我使用alluxio客户端jar运行相同的Hadoop程序时它给我一个错误bin/hadoopjar/usr/lib/hadoop-mapreduce/hadoop-mapreduce-examples.jarwordcount

azure - 如何查询azure hdinsight hadoop cluster yarn timeline server

如何查询AzureHDInsightHadoop集群中的时间线服务器以获取作业指标？连接到Azure集群:curl-uadmin-sS-G"https://$CLUSTERNAME.azurehdinsight.net/api/v1/clusters/$CLUSTERNAME"连接到时间线服务器:GET/ws/v1/timeline/我需要一个连接这两个的查询来获取AzureHDInsightHadoop集群的作业指标。提前致谢。最佳答案查询Yarn时间线服务器:sshuser@clustername:~$curl-uadmin

azure hdinsight clustername strong section hadoop cluster-computing hadoop-yarn

hadoop - YARN 提示 java.net.NoRouteToHostException : No route to host (Host unreachable)

尝试在HDP3.1集群上运行h2o并遇到似乎与YARN资源容量有关的错误...[ml1user@HW04h2o-3.26.0.1-hdp3.1]$hadoopjarh2odriver.jar-nodes3-mapperXmx10gDeterminingdriverhostinterfaceformapper->drivercallback...[PossiblecallbackIPaddress:192.168.122.1][PossiblecallbackIPaddress:172.18.4.49][PossiblecallbackIPaddress:127.0.0.1]Usingm

NoRouteToHostException unreachable 1564020515809 application hadoop hadoop-yarn h2o

hadoop - yarn 组件

什么是节点经理容器应用大师在YARN(MapReduce2.0)中？https://hadoop.apache.org/docs/current2/hadoop-yarn/hadoop-yarn-site/YARN.html也想知道为什么上面链接的图底框里没有applicationmaster？我不是在寻找它的作用，而是在寻找它是什么!!(喜欢=>不确定容器是否意味着像spring容器(这意味着jar文件列表？)或者它的服务器像web服务器？应用程序主机是否意味着简单的Java类？) 最佳答案节点管理器是每台机器的框架代理，负责启

hadoop yarn section optional mapreduce hdfs hadoop-yarn

Hadoop Yarn 守护进程停止运行

运行start-dfs.sh和start-yarn.sh后跟jps给出以下输出:8227ResourceManager8328NodeManager7804NameNode8366Jps8077SecondaryNameNode7901DataNode如果我在大约5秒后运行jps，输出是:7804NameNode8473Jps8077SecondaryNameNode7901DataNode两个yarn守护进程(ResourceManager和NodeManager)由于某些原因停止工作。知道为什么会发生这种情况吗？最佳答案这通

Hadoop Yarn section ResourceManager NodeManager daemon

hadoop - YARN 中的分布式缓存功能

目前我正在使用MAP-REDUCEYARN框架。并以伪分布式模式使用hadoop。我想在这里使用“分布式缓存”功能将一些文件添加到缓存中并在我的map功能中使用它。我怎样才能做到这一点。最佳答案如何将文件添加到分布式缓存:使用hadoop选项.hadoopjar-files使用分布式缓存API:.job.addCacheFile(uri);hadoop-files选项或分布式缓存API将缓存文件复制到所有任务节点，并使其在执行期间可供mapper/reducer使用。如何访问分布式缓存:覆盖Mapper/reducer中的设置方

hadoop YARN section strong code

hadoop - 我需要在 Hadoop 之外进行 YARN

我在想是否可以在没有HDFS的情况下使用YARN。是否可以从Hadoop外部使用YARN？用于集群管理目的。谢谢最佳答案您可以在没有HDFS的情况下使用YARN。您只是不配置或启动HDFS服务，并且在不使用HDFSAPI的情况下运行应用程序。但是，YARN是Hadoop的一部分，如果不下载和配置Hadoop，就无法运行YARN。因此，安装和配置Hadoop通常是安装和配置HDFS和YARN(以及其他组件，如果需要的话)。关于hadoop-我需要在Hadoop之外进行YARN，我们在

hadoop section YARN hadoop-yarn

hadoop - yarn 模式下的 Spark RDD map 不允许访问变量？

我在mapr集群上安装了全新的spark1.2.1，在测试它时我发现它在本地模式下运行良好，但在yarn模式下它似乎无法访问变量，如果广播也是如此。准确的说是下面的测试代码importorg.apache.spark.SparkContextimportorg.apache.spark.SparkContext._importorg.apache.spark.SparkConfobjectJustSparkextendsApp{valconf=neworg.apache.spark.SparkConf().setAppName("SimpleApplication")valsc=new

hadoop Spark code section apache-spark mapr

hadoop - Yarn 和 MapReduce 资源配置

我目前正在运行一个伪分布式Hadoop系统。该机器有8个内核(16个虚拟内核)，32GBRam。我的输入文件在几MB到~68MB之间(gzip日志文件，一旦达到>60MB就会上传到我的服务器，因此没有修复最大大小)。我想对其中大约500-600个文件运行一些Hive作业。由于输入文件大小不一致，到目前为止我还没有更改Hadoop中的block大小。据我所知，最好的情况是blocksize=输入文件大小，但是如果文件小于blocksize，Hadoop会填充该block直到它填满吗？输入文件的大小和数量如何影响性能，而不是说一个大约40GB的大文件？我对此设置的最佳配置会是什么样子？根据

MapReduce hadoop code pre section hadoop-yarn

hadoop - yarn : Do we need nodemanager on namenode?

我们是否需要在名称节点节点上启动节点管理器，即我不会将其设为数据节点？我将在一台机器上启动namenode和resourcemanager。由于我不会在这台机器上启动datanode，我想我也不需要启动nodemanager？感谢最佳答案这取决于你。您可以选择在未安装Datanode服务的节点上保留Nodemanager，在这种情况下，如果由该Nodemanager执行，数据将通过网络传输以执行任务。但是如果你想减少主节点的负载，那么你应该避免在它上面安装如此繁重的进程(Datanode和NodeManager)。在许多情况下，

nodemanager namenode section stackoverflow hadoop hdfs hadoop-yarn cloudera-cdh

50 51 525354 55 56