草庐IT

YARN_OPTS

全部标签

hadoop - 普通身份验证失败 : User yarn is not configured for any impersonation. impersonationUser:alluxio mapreduce 中的 root

Causedby:org.apache.thrift.transport.TTransportException:Plainauthenticationfailed:Useryarnisnotconfiguredforanyimpersonation.模拟用户:root当我使用alluxio在本地运行wordcount程序时它工作正常。我也通过了集成测试,但是当我使用alluxio客户端jar运行相同的Hadoop程序时它给我一个错误bin/hadoopjar/usr/lib/hadoop-mapreduce/hadoop-mapreduce-examples.jarwordcount

azure - 如何查询azure hdinsight hadoop cluster yarn timeline server

如何查询AzureHDInsightHadoop集群中的时间线服务器以获取作业指标?连接到Azure集群:curl-uadmin-sS-G"https://$CLUSTERNAME.azurehdinsight.net/api/v1/clusters/$CLUSTERNAME"连接到时间线服务器:GET/ws/v1/timeline/我需要一个连接这两个的查询来获取AzureHDInsightHadoop集群的作业指标。提前致谢。 最佳答案 查询Yarn时间线服务器:sshuser@clustername:~$curl-uadmin

hadoop - YARN 提示 java.net.NoRouteToHostException : No route to host (Host unreachable)

尝试在HDP3.1集群上运行h2o并遇到似乎与YARN资源容量有关的错误...[ml1user@HW04h2o-3.26.0.1-hdp3.1]$hadoopjarh2odriver.jar-nodes3-mapperXmx10gDeterminingdriverhostinterfaceformapper->drivercallback...[PossiblecallbackIPaddress:192.168.122.1][PossiblecallbackIPaddress:172.18.4.49][PossiblecallbackIPaddress:127.0.0.1]Usingm

hadoop - yarn 组件

什么是节点经理容器应用大师在YARN(MapReduce2.0)中?https://hadoop.apache.org/docs/current2/hadoop-yarn/hadoop-yarn-site/YARN.html也想知道为什么上面链接的图底框里没有applicationmaster?我不是在寻找它的作用,而是在寻找它是什么!!(喜欢=>不确定容器是否意味着像spring容器(这意味着jar文件列表?)或者它的服务器像web服务器?应用程序主机是否意味着简单的Java类?) 最佳答案 节点管理器是每台机器的框架代理,负责启

Hadoop Yarn 守护进程停止运行

运行start-dfs.sh和start-yarn.sh后跟jps给出以下输出:8227ResourceManager8328NodeManager7804NameNode8366Jps8077SecondaryNameNode7901DataNode如果我在大约5秒后运行jps,输出是:7804NameNode8473Jps8077SecondaryNameNode7901DataNode两个yarn守护进程(ResourceManager和NodeManager)由于某些原因停止工作。知道为什么会发生这种情况吗? 最佳答案 这通

hadoop - YARN 中的分布式缓存功能

目前我正在使用MAP-REDUCEYARN框架。并以伪分布式模式使用hadoop。我想在这里使用“分布式缓存”功能将一些文件添加到缓存中并在我的map功能中使用它。我怎样才能做到这一点。 最佳答案 如何将文件添加到分布式缓存:使用hadoop选项.hadoopjar-files使用分布式缓存API:.job.addCacheFile(uri);hadoop-files选项或分布式缓存API将缓存文件复制到所有任务节点,并使其在执行期间可供mapper/reducer使用。如何访问分布式缓存:覆盖Mapper/reducer中的设置方

hadoop - 我需要在 Hadoop 之外进行 YARN

我在想是否可以在没有HDFS的情况下使用YARN。是否可以从Hadoop外部使用YARN?用于集群管理目的。谢谢 最佳答案 您可以在没有HDFS的情况下使用YARN。您只是不配置或启动HDFS服务,并且在不使用HDFSAPI的情况下运行应用程序。但是,YARN是Hadoop的一部分,如果不下载和配置Hadoop,就无法运行YARN。因此,安装和配置Hadoop通常是安装和配置HDFS和YARN(以及其他组件,如果需要的话)。 关于hadoop-我需要在Hadoop之外进行YARN,我们在

hadoop - yarn 模式下的 Spark RDD map 不允许访问变量?

我在mapr集群上安装了全新的spark1.2.1,在测试它时我发现它在本地模式下运行良好,但在yarn模式下它似乎无法访问变量,如果广播也是如此。准确的说是下面的测试代码importorg.apache.spark.SparkContextimportorg.apache.spark.SparkContext._importorg.apache.spark.SparkConfobjectJustSparkextendsApp{valconf=neworg.apache.spark.SparkConf().setAppName("SimpleApplication")valsc=new

hadoop - Yarn 和 MapReduce 资源配置

我目前正在运行一个伪分布式Hadoop系统。该机器有8个内核(16个虚拟内核),32GBRam。我的输入文件在几MB到~68MB之间(gzip日志文件,一旦达到>60MB就会上传到我的服务器,因此没有修复最大大小)。我想对其中大约500-600个文件运行一些Hive作业。由于输入文件大小不一致,到目前为止我还没有更改Hadoop中的block大小。据我所知,最好的情况是blocksize=输入文件大小,但是如果文件小于blocksize,Hadoop会填充该block直到它填满吗?输入文件的大小和数量如何影响性能,而不是说一个大约40GB的大文件?我对此设置的最佳配置会是什么样子?根据

hadoop - yarn : Do we need nodemanager on namenode?

我们是否需要在名称节点节点上启动节点管理器,即我不会将其设为数据节点?我将在一台机器上启动namenode和resourcemanager。由于我不会在这台机器上启动datanode,我想我也不需要启动nodemanager?感谢 最佳答案 这取决于你。您可以选择在未安装Datanode服务的节点上保留Nodemanager,在这种情况下,如果由该Nodemanager执行,数据将通过网络传输以执行任务。但是如果你想减少主节点的负载,那么你应该避免在它上面安装如此繁重的进程(Datanode和NodeManager)。在许多情况下,