草庐IT

nvidia-container-cli

全部标签

hadoop - Storm 纱 : Application container fails to launch

我正在运行一个Storm(三叉戟)拓扑,它从kafka读取avro并将记录写入hbase。拓扑在Localcluster模式下按预期运行,但在使用Stormsubmitter时我遇到了以下问题。在分布式Hadoop模式下,我在启动YARN应用程序时收到以下错误[1]。在Hadoop中(本地模式,只有1个盒子)Yarn正在生成nimbus服务器和storm-ui。但是没有主管运行拓扑中的spout/bolt。我猜原因可能是内存不足(4G来运行拓扑+hbase、hdfs、kafka、zookeeper等...)。你能帮我理解这个容器失败的原因吗?应用程序日志中没有错误/信息。[1]YARN

azure - SLF4J : Class path contains multiple SLF4J bindings on azure hdinsight

我已经创建了一个配置单元外部表来访问hbase表,方法是遵循HBase-HiveIntegrationanswer.下面是我创建外部表的配置单元查询:CREATEEXTERNALTABLEhive_tweets_by_message_words_key(keyINT,dSTRING)STOREDBY'org.apache.hadoop.hive.hbase.HBaseStorageHandler'WITHSERDEPROPERTIES("hbase.columns.mapping"=":key,d:d")TBLPROPERTIES("hbase.table.name"="tweets_

hadoop - 即使删除了数据库,Hive CLI 也会显示数据库使用情况

1)创建一个数据库并使用它。hive>createdatabasetestdb;hive>usetestdb;2)设置hive.cli.print.current.db=true以显示正在使用哪个数据库。hive>sethive.cli.print.current.db=true;hive(testdb)>3)删除数据库。hive(testdb)>dropdatabasetestdb;4)设置hive.cli.print.current.db=false,然后将其设置回true。hive(testdb)>sethive.cli.print.current.db=false;hive>s

java - hadoop mapreduce teragen FAIL_CONTAINER_CLEANUP

我的hadoop集群遇到了一些问题。我试着用它做一些基准测试来检查它的性能,看看mapreduce是否工作正常,但我得到了一些奇怪的行为。事实上,mapreduce正在启动并处理其映射阶段,但我从中得到了一些错误:我首先使用teragen来创建数据:$hadoopjar/usr/local/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-*.jarteragen500random-data然后工作开始了,我在没有停止进程的情况下遇到了一些失败:17/02/2312:29:27INFOclient.RMProxy:Conne

hadoop - 在配置单元 "Unable to retrieve URL for Hadoop Task logs. Does not contain a valid host:port authority: local"上出现错误

在涉及mapreduce的hive上执行任何查询时,我收到此错误。“UnabletoretrieveURLforHadoopTasklogs.Doesnotcontainavalidhost:portauthority:local” 最佳答案 报告的异常出现在旧版本的Hadoop中(即YARN之前)。大多数情况下,您使用的是旧版本的Hadoop。当mapred.job.tracker的值出现异常参数在local中设置为“mapred-site.xml”相反,它应该是:. 关于hadoop

java - HashSet<POJO>.contains 不当行为

作为Hadoop的一部分Mapper,我有一个HashSet它包含一个非常简单的类的实例,只有两个整数属性。作为一个应该,我定制了hashCode()和equals():publicclassMySimpleObject{privateinti1,i2;publicset(inti1,inti2){this.i1=i1;this.i2=i2;}@OverridepublicinthashCode(){finalintprime=31;intresult=1;result=prime*result+i1;result=prime*result+i2;returnresult;}@Over

apache-spark - Hadoop CLI 命令获取使用的总内存等,如 8088 上的 Hadoop Web UI 所示

是否有CLI命令可用于获取此图片中显示的指标,因为它们出现在8088上的HadoopWebUI中? 最佳答案 yarntop会显示这个。它的工作方式类似于UNIX/Linux命令top。源代码位于https://github.com/apache/hadoop/blob/trunk/hadoop-yarn-project/hadoop-yarn/hadoop-yarn-client/src/main/java/org/apache/hadoop/yarn/client/cli/TopCLI.java:

hadoop - 配置单元 cli 中的 "Add <directory>"

我想要类似的东西$hive>ADDFILE;添加一个目录到hive的工作目录。我正在使用配置单元0.7。我需要这个来添加python包以供mapper/reducer脚本使用。我有哪些选择? 最佳答案 对于0.7.1,您可以使用shell转义符(!)来运行!hadoopfs-mkdir或“dfs”命令dfs-mkdir.查看cliwikipage获取更多信息。不确定这些是否在0.7中。 关于hadoop-配置单元cli中的"Add",我们在StackOverflow上找到一个类似的问题:

hadoop - 如何在cloudera上通过CLI连接到hive

我们从HUE运行CDH4.1.1/BeeswaxHive运行良好,/beeswax/tables显示所有表。我想使用hiveCLI列出所有表:overlord@overlord-datanode1:~$hiveLogginginitializedusingconfigurationinfile:/etc/hive/conf.dist/hive-log4j.propertiesHivehistoryfile=/tmp/overlord/hive_job_log_overlord_201211280646_1426149164.txthive>SHOWTABLES;OKTimetaken:

hadoop - 从不同目录调用 hive cli 时找不到表

我遇到了Hive表的一个奇怪问题。我在环境中设置了HIVE_HOME,它也在我的搜索路径中,因此我可以直接调用hive。现在我从一个目录调用hive让我们说/a/b/c并创建一些表。我可以看到表格。现在我切换到一个目录,例如/a/b并从那里调用hive。这是问题部分。要么我看不到表格,要么我得到这个错误hive>showtables;FAILED:Errorinmetadata:javax.jdo.JDOFatalDataStoreException:Failedtostartdatabase'metastore_db',seethenextexceptionfordetails.Ne