container1_草庐IT

java - Hadoop 内存使用 : reduce container is running beyond physical memory limits

我有简单的映射器和简单的缩减器(它通过一个字段连接两个大表):protectedvoidreduce(StringLongCompositeKeykey,Iterablevalues,Contextcontext)throwsIOException,InterruptedException{}foreach(Texttext:values){//dosomeoperationswithonerecordandthenemititusingcontext.write//sonothingisstoringinmemory,onetextrecordissmall(momorethen10

hadoop - Spark 1.6.2 & yarn : diagnostics: Application failed 2 times due to AM Container for exited with exitCode: -1

我有一个由2台机器组成的集群，我正在尝试使用YARN集群管理器提交一个spark作业。基于hadoop2.6.2构建的vanillaSpark1.6.2普通Hadoop2.7.2我可以使用独立的集群管理器成功运行map-reduce作业和spark作业。但是当我用YARN运行它时，我得到了一个错误。对如何让它发挥作用有什么建议吗？如何启用更详细的日志记录？错误信息绝对不清楚为什么在hadoop/logs/userlogs/applicationXXX下没有创建日志文件？反问:IMO:hadoop日志记录和诊断不是很好。这是为什么？Hadoop似乎是一个成熟的产品。下面是输出:mike@

Application diagnostics 1468043888852 Client hadoop apache-spark hadoop-yarn

hadoop - Flume 与 SLF4J : Class path contains multiple SLF4J bindings 冲突 hadoop

每次启动Flume时，我都会在Flume、Hive和Hadoop之间收到此消息。避免这种情况的最佳方法是什么？我正在考虑从flumelib目录中删除一个jar，但不确定这是否会影响其他(hive、hadoop)。Info:Sourcingenvironmentconfigurationscript/usr/local/flume/conf/flume-env.shInfo:IncludingHadooplibrariesfoundvia(/usr/local/hadoop/bin/hadoop)forHDFSaccess+exec/usr/java/jdk1.7.0_79/bin/ja

hadoop SLF4J local usr flume

hadoop - 如何减少 Hadoop Yarn Container 生成的日志量？

我正在使用Hadoop2.7.3，使用Yarn进行一些mapreduce。每个容器生成的日志都是天文数字。明显使用的级别是DEBUG。我想将日志级别提高到INFO。我的安装或多或少是默认安装。我尝试修改hadoop-yarn-server-nodemanager-*.jar中的container-log4j.properties，如https://community.hortonworks.com/questions/98259/hdp-250-how-to-override-default-container-log4j-in.html中所述但这没有帮助。我的每个容器的标准输出文件都

志量 Container hadoop metrics apache logging containers hadoop-yarn

hadoop - SAS Hive (Hadoop) 中是否有 Contains 函数？

我又需要帮助了是否有与SASHadoop中的Contains函数等效的函数(显式SQL直通)？例如替代版本:WHENa.DESCRIPTIONNOTCONTAINS"XXX"我尝试使用:When(array_contains(a.DESCRIPTION,'XXX')=FALSE)但这不起作用。欢迎任何帮助! 最佳答案感谢Kiran建议使用instr函数....看起来它满足了我的需要所以我曾经得到我想要的:Wheninstr(a.DESCRIPTION,'XXX')=0Then1Mayank....谢谢你的建议，我稍后会研究这个功能

Contains hadoop section code DESCRIPTION hive sas hiveql

hadoop - 为什么 mapreduce 尝试由于 "Container preempted by scheduler"而被终止？

我刚刚注意到Hadoop上的许多Pig作业由于以下原因而被杀死:Containerpreemptedbyscheduler有人可以向我解释是什么原因造成的，我是否应该(并且能够)对此做些什么？谢谢! 最佳答案如果您有公平的调度程序并启用了多个不同的队列，那么更高优先级的应用程序可以终止您的作业(以抢占方式)。Hortonworks有一个很好的解释和更多的细节https://docs.hortonworks.com/HDPDocuments/HDP2/HDP-2.3.2/bk_yarn_resource_mgt/content/pr

amp Container section https bk_yarn_resource_mgt hadoop apache-pig

hadoop - Yarn Resource Manager UI 中的 Num Off Switch Containers 是什么意思？

我有一个ETL作业占用大量CPU和内存并运行了很长时间。我在调试时观察到的第一件事如下(来自资源管理器GUI上的作业)NumNodeLocalContainers(满足)=6NumRackLocalContainers(满足)=00NumOffSwitchContainers(满足)=11367我们只有两个架子。我需要帮助回答以下三个问题NumOffSwitchContainer的含义是什么？我如何识别这些“关闭开关”容器以及它们在哪些节点上运行？关闭开关容器是否会导致作业处理时间变慢？最佳答案 1.NumOffSwitchCon

Containers Resource 容器 section strong hadoop mapreduce hadoop-yarn hortonworks-data-platform

hadoop - 无法启动 TaskTracker.Says 无法启动任务跟踪器，因为 java.lang.IllegalArgumentException : Does not contain a valid host:port authority:

编辑了mapred-site.xml、core-site.xml、hadoop-env.sh、hdfs-site.xml、masters和slaves。我有1个DataNode和2个Namenode。它们都成功启动，我可以在浏览器中看到它们。启动了start-mapred.sh并在Namenode上启动了JobTracker和TaskTracker，但无法在datanaode上启动Tasktracker。启动Tasktracker，输出如下。->hadooptasktrackerWarning:$HADOOP_HOMEisdeprecated.13/10/1703:21:55INFOm

跟踪器 IllegalArgumentException TaskTracker mapred hadoop ubuntu-12.04

hadoop - Storm 纱 : Application container fails to launch

我正在运行一个Storm(三叉戟)拓扑，它从kafka读取avro并将记录写入hbase。拓扑在Localcluster模式下按预期运行，但在使用Stormsubmitter时我遇到了以下问题。在分布式Hadoop模式下，我在启动YARN应用程序时收到以下错误[1]。在Hadoop中(本地模式，只有1个盒子)Yarn正在生成nimbus服务器和storm-ui。但是没有主管运行拓扑中的spout/bolt。我猜原因可能是内存不足(4G来运行拓扑+hbase、hdfs、kafka、zookeeper等...)。你能帮我理解这个容器失败的原因吗？应用程序日志中没有错误/信息。[1]YARN

Application container java 容器 hadoop apache-storm hadoop-yarn

azure - SLF4J : Class path contains multiple SLF4J bindings on azure hdinsight

我已经创建了一个配置单元外部表来访问hbase表，方法是遵循HBase-HiveIntegrationanswer.下面是我创建外部表的配置单元查询:CREATEEXTERNALTABLEhive_tweets_by_message_words_key(keyINT,dSTRING)STOREDBY'org.apache.hadoop.hive.hbase.HBaseStorageHandler'WITHSERDEPROPERTIES("hbase.columns.mapping"=":key,d:d")TBLPROPERTIES("hbase.table.name"="tweets_

azure SLF4J SLF4 section hadoop hive hbase azure-hdinsight