我有一个在Hue中成功运行的查询CREATETABLEfoobarASSELECT...(返回的状态是Inserted986571row(s))并需要几个秒完成。然而,在ClouderaManager中,它的状态-超过10分钟后-仍然显示Executing。这是ClouderaManager中的错误还是此查询实际上仍在运行? 最佳答案 当Hue执行查询时,它会使查询保持打开状态,以便用户可以按照自己的节奏对结果进行分页。(当然,这种行为对DDL语句不是很有用。)这意味着Impala仍然认为查询正在执行,即使它没有主动使用CPU周期(
我无法理解ClouderaQuickstartVM的某些内容。让我尝试通过概述到目前为止的步骤来进行解释。我想使用Kafka编写一些东西来连接到网络服务并获取数据源。我将使用Cloudera5.5quickstartVM作为我的Playground。我需要从包裹中安装CDH,然后才能获得Kafka。通过https://community.cloudera.com/t5/Apache-Hadoop-Concepts-and/cloudera-manager-5-4-0-installing-kafka-parcel-fails/td-p/30615我在ClouderaVM的桌面上看到一个
我用clouderaCDH5.8.0做了一个主节点和三个从节点的集群。经过一些配置工作后,我的所有服务都正常运行,但只有一个:HBase。重新启动后几分钟,它的健康状况不佳。ClouderaManager显示的错误是:“错误:Master摘要:此健康测试错误,因为服务监视器未找到事件的Master”。我检查了服务监视器日志,发现了这个警告:(7skipped)ExceptionindoWorkfortask:hbase_HBASE_SERVICE_STATE_TASKorg.apache.hadoop.hbase.client.RetriesExhaustedException:Fai
我熟悉Cloudera的基础设施或架构:Master节点包括NameNode、SecondaryNameNode、JobTracker、HMaster。从节点包括DataNode、TaskTracker、HRegionServer。Master节点应该都在自己的节点上(除非它是一个小集群,而不是SecondaryNameNode,JobTracker和HMaster可以组合,如果它是一个非常小的集群甚至是NameNode)。从节点应始终位于同一节点上。从节点越多越好。SecondaryNameNode用词不当,除非您为高可用性启用它。MapR是否维护此设置?它有何相似之处和不同之处?
我在Virtualbox上有一个带有3个从节点的Spark独立集群。我的代码在Java上,它可以很好地处理我的小输入数据集,它们的输入总共大约100MB。我将我的虚拟机RAM设置为16GB,但是当我在大输入文件(大约2GB)上运行我的代码时,在我的reduce部分处理数小时后出现此错误:Jobabortedduetostagefailure:Totalsizeofserializedresultsof4tasks(4.3GB)isbiggerthanspark.driver.maxResultSize`我编辑了spark-defaults.conf并为spark.driver.maxR
最近我的组织正在考虑使用Docker。我们组使用的是clouderaCDH5.1.2。1)cloudera是否与Docker容器兼容?2)docker和cloudera组合是否存在已知问题?我在这个论坛上找不到任何关于docker的话题。任何指针都会有所帮助。谢谢,阿米特 最佳答案 已发布Cloudera的官方答复here:Ireadthroughwhatdockeris,yesterday.Idonotthinkthishasbeentested,thereareanumberofplatformvirtualizationpro
我尝试在Ubuntu12.04.1LTS上安装使用标准版本的cloudera管理器,当我想添加新主机时,出现下一个错误:Installationfailed.Failedtoreceiveheartbeatfromagent.Ensurethatthehost'shostnameisconfiguredproperly.Ensurethatport7182isaccesibleontheClouderaManagerserver(checkfirewallrules).Ensurethatports9000an9001arefreeonthehostbeingadded.Checkag
我已经启动并运行了6个节点的cloudera5.0beta集群但是我无法使用命令查看hadoopHDFS的文件和文件夹sudo-uhdfshadoopfs-ls/在输出中它显示了linux目录的文件和文件夹。尽管namenodeUI正在显示文件和文件夹。在HDFS上创建文件夹时出现错误sudo-uhdfshadoopfs-mkdir/testmkdir:`/test':Input/outputerror由于此错误,hbase未启动并关闭并出现以下错误:Unhandledexception.Startingshutdown.java.io.IOException:Exceptioninm
由于Spring-Data-Hadoop尚未发布,因此很难找到与cloudera一起使用的运行示例配置。我需要选择哪些依赖项才能与CDH4(Hadoop2.0.0-cdh4.1.3)一起运行Spring-Data-Hadoop?通过选择不同的应用程序,我得到了这个异常(exception):空指针Exceptioninthread"SimpleAsyncTaskExecutor-1"java.lang.ExceptionInInitializerErroratorg.springframework.data.hadoop.mapreduce.JobExecutor$2.run(JobE
当我尝试在ClouderaImpala中使用拆分功能时,我不断收到“拆分未知”的AnalysisException。它似乎是内置函数页面上列出的有效函数。作为引用,我使用Hue与Impala进行交互。有谁知道这个问题的原因吗? 最佳答案 Impala中的以下作品:split_part(stringsource,stringdelimiter,bigintn)文档在这里:https://www.cloudera.com/documentation/enterprise/5-9-x/topics/impala_string_functi