cloudera-manager

hadoop - Impala 查询停留在执行状态

我有一个在Hue中成功运行的查询CREATETABLEfoobarASSELECT...(返回的状态是Inserted986571row(s))并需要几个秒完成。然而，在ClouderaManager中，它的状态-超过10分钟后-仍然显示Executing。这是ClouderaManager中的错误还是此查询实际上仍在运行？最佳答案当Hue执行查询时，它会使查询保持打开状态，以便用户可以按照自己的节奏对结果进行分页。(当然，这种行为对DDL语句不是很有用。)这意味着Impala仍然认为查询正在执行，即使它没有主动使用CPU周期(

hadoop - Quickstart VM Cloudera parcel 无法启动

我无法理解ClouderaQuickstartVM的某些内容。让我尝试通过概述到目前为止的步骤来进行解释。我想使用Kafka编写一些东西来连接到网络服务并获取数据源。我将使用Cloudera5.5quickstartVM作为我的Playground。我需要从包裹中安装CDH，然后才能获得Kafka。通过https://community.cloudera.com/t5/Apache-Hadoop-Concepts-and/cloudera-manager-5-4-0-installing-kafka-parcel-fails/td-p/30615我在ClouderaVM的桌面上看到一个

Quickstart Cloudera service unrecognized information hadoop cloudera-cdh cloudera-manager cloudera-quickstart-vm

hadoop - Service Monitor 在 HBase 服务中没有找到活跃的 Master

我用clouderaCDH5.8.0做了一个主节点和三个从节点的集群。经过一些配置工作后，我的所有服务都正常运行，但只有一个:HBase。重新启动后几分钟，它的健康状况不佳。ClouderaManager显示的错误是:“错误:Master摘要:此健康测试错误，因为服务监视器未找到事件的Master”。我检查了服务监视器日志，发现了这个警告:(7skipped)ExceptionindoWorkfortask:hbase_HBASE_SERVICE_STATE_TASKorg.apache.hadoop.hbase.client.RetriesExhaustedException:Fai

Service Monitor java hadoop hbase cloudera cloudera-cdh cloudera-manager

hadoop - MapR 架构与 Cloudera 架构

我熟悉Cloudera的基础设施或架构:Master节点包括NameNode、SecondaryNameNode、JobTracker、HMaster。从节点包括DataNode、TaskTracker、HRegionServer。Master节点应该都在自己的节点上(除非它是一个小集群，而不是SecondaryNameNode，JobTracker和HMaster可以组合，如果它是一个非常小的集群甚至是NameNode)。从节点应始终位于同一节点上。从节点越多越好。SecondaryNameNode用词不当，除非您为高可用性启用它。MapR是否维护此设置？它有何相似之处和不同之处？

Cloudera hadoop section MapR SecondaryNameNode architecture infrastructure

java - Apache Spark : TaskResultLost (result lost from block manager) Error On cluster

我在Virtualbox上有一个带有3个从节点的Spark独立集群。我的代码在Java上，它可以很好地处理我的小输入数据集，它们的输入总共大约100MB。我将我的虚拟机RAM设置为16GB，但是当我在大输入文件(大约2GB)上运行我的代码时，在我的reduce部分处理数小时后出现此错误:Jobabortedduetostagefailure:Totalsizeofserializedresultsof4tasks(4.3GB)isbiggerthanspark.driver.maxResultSize`我编辑了spark-defaults.conf并为spark.driver.maxR

TaskResultLost cluster code Boolean section java hadoop apache-spark mapreduce

hadoop - Cloudera 支持 docker 容器或 Docker 支持 CM 5 图像

最近我的组织正在考虑使用Docker。我们组使用的是clouderaCDH5.1.2。1)cloudera是否与Docker容器兼容？2)docker和cloudera组合是否存在已知问题？我在这个论坛上找不到任何关于docker的话题。任何指针都会有所帮助。谢谢，阿米特最佳答案已发布Cloudera的官方答复here:Ireadthroughwhatdockeris,yesterday.Idonotthinkthishasbeentested,thereareanumberofplatformvirtualizationpro

容器 Cloudera section hadoop docker cloudera-cdh

hadoop - Cloudera Manager 安装无法从代理接收心跳 - 将新主机添加到集群

我尝试在Ubuntu12.04.1LTS上安装使用标准版本的cloudera管理器，当我想添加新主机时，出现下一个错误:Installationfailed.Failedtoreceiveheartbeatfromagent.Ensurethatthehost'shostnameisconfiguredproperly.Ensurethatport7182isaccesibleontheClouderaManagerserver(checkfirewallrules).Ensurethatports9000an9001arefreeonthehostbeingadded.Checkag

Cloudera Manager agent section python2 hadoop cloudera-manager

hadoop - Cloudera hadoop : not able to run Hadoop fs command and at same time HBase is not able to create directory on HDFS?

我已经启动并运行了6个节点的cloudera5.0beta集群但是我无法使用命令查看hadoopHDFS的文件和文件夹sudo-uhdfshadoopfs-ls/在输出中它显示了linux目录的文件和文件夹。尽管namenodeUI正在显示文件和文件夹。在HDFS上创建文件夹时出现错误sudo-uhdfshadoopfs-mkdir/testmkdir:`/test':Input/outputerror由于此错误，hbase未启动并关闭并出现以下错误:Unhandledexception.Startingshutdown.java.io.IOException:Exceptioninm

hadoop able apache java hdfs cloudera

java - 如何使用 Cloudera CDH4 和 Maven 获取正在运行的 Spring-Data-Hadoop 项目

由于Spring-Data-Hadoop尚未发布，因此很难找到与cloudera一起使用的运行示例配置。我需要选择哪些依赖项才能与CDH4(Hadoop2.0.0-cdh4.1.3)一起运行Spring-Data-Hadoop？通过选择不同的应用程序，我得到了这个异常(exception):空指针Exceptioninthread"SimpleAsyncTaskExecutor-1"java.lang.ExceptionInInitializerErroratorg.springframework.data.hadoop.mapreduce.JobExecutor$2.run(JobE

Spring-Data-Hadoop Cloudera gt lt hadoop java spring-data

hadoop - 拆分功能在 Cloudera Impala 中不起作用

当我尝试在ClouderaImpala中使用拆分功能时，我不断收到“拆分未知”的AnalysisException。它似乎是内置函数页面上列出的有效函数。作为引用，我使用Hue与Impala进行交互。有谁知道这个问题的原因吗？最佳答案 Impala中的以下作品:split_part(stringsource,stringdelimiter,bigintn)文档在这里:https://www.cloudera.com/documentation/enterprise/5-9-x/topics/impala_string_functi

Cloudera hadoop section Impala string hive