我正在尝试在clouderaVM(5.5)中查询HBase但出现以下异常:ErrorconnectingHBase:org.apache.hadoop.hbase.MasterNotRunningException:com.google.protobuf.ServiceException:org.apache.hadoop.net.ConnectTimeoutException:20000millistimeoutwhilewaitingforchanneltobereadyforconnect.ch:java.nio.channels.SocketChannel[connection
我有cloudera5.14开发环境。我想在cloudera发行版中安装apachehadoop-tools(link)。具体来说,我需要hadoop-resourceestimator(link)。没有可用的文档说明如何安装相同的.我们将不胜感激任何潜在客户。 最佳答案 AFAIKcdh5.14.x基于旧的hadoop版本2.6.0,它没有resourceestimator工具。它可用但在CDH6中不受支持(“不支持”与“不可用”不同)。你可以在CDH6.x发行版中找到resourceestimator,-rw-r--r--1ro
有点二元问题(好吧,不是很奇怪)-但想知道是否能够配置cloudera/hadoop在节点上运行而无需rootshell访问节点计算机(尽管我可以设置ssh无密码登录)?从他们的说明中可以看出需要root访问权限,但我发现一个hadoopwiki表明可能不需要root访问权限?http://wiki.apache.org/nutch/NutchHadoopTutorial 最佳答案 你可以,是的。您只需要从源代码而不是RPM或DEB安装。访问http://archive.cloudera.com/docs/然后单击右上角的“Tarb
我需要在我的clouderaCDH4集群设置上运行简单的基准测试。我的cloudera集群设置(CDH4)有4个节点,A、B、C和D我正在使用clouderamanager免费版来管理cloudera服务。每个节点都配置为执行如下所述的多个角色。A:NameNode,JobTrackerNode,regionserver,SecondaryNameNode,DataNode,TaskTrackerNodeB:数据节点、任务跟踪器节点C:数据节点、任务跟踪器节点D:DataNode,TaskTrackerNode我的第一个问题是,一个节点可以是NameNode和DataNode吗?这样设
我是Linux和Hadoop的新手。我想学习Pig、MapReduce和Hive的基础知识,我正在尝试在Ubuntu上安装Cloudera的Hadoop解决方案。This是我正在关注的教程。我停留在第1步。我没有使用代理,所以我跳过了代理配置步骤。转到步骤1.6,然后我收到以下错误消息。有什么想法我应该尝试吗?Refreshingrepositorymetadatafailed.See/var/log/cloudera-manager-installer/2.refresh-repo.logfordetails.ClickOKtorevertthisinstallation.这是日志文
我正在clouderacdh4上运行一个canopy集群作业(使用mahout)。待聚类的内容大约有1m条记录(每条记录大小小于1k)。整个hadoop环境(包括所有节点)运行在一个4G内存的虚拟机中。默认情况下安装cdh4。运行作业时出现以下异常。根据异常情况,作业客户端似乎需要更大的jvm堆大小。但是clouderamanager中jvmheapsize的配置选项还是挺多的。我将“客户端Java堆大小(以字节为单位)”从256MiB更改为512MiB。然而,它并没有改善。关于设置这些堆大小选项的任何提示/技巧?13/07/0317:12:45INFOinput.FileInputF
使用ClouderaManager时,我可以通过以下方式访问hdfs-site.xml文件:ClouderaManager>Cluster>HDFS>Instances>(NameNode,例如)>Processes配置文件>hdfs-site.xml然后URL指向:http://quickstart.cloudera:7180/cmf/process/8/config?filename=hdfs-site.xml这个文件是否可以通过文件系统直接访问,如果可以,它位于何处 最佳答案 ClouderaManager中设置的配置存储在C
关闭。这个问题不符合StackOverflowguidelines.它目前不接受答案。这个问题似乎不是关于aspecificprogrammingproblem,asoftwarealgorithm,orsoftwaretoolsprimarilyusedbyprogrammers的.如果您认为这个问题是关于anotherStackExchangesite的主题,您可以发表评论,说明问题可能在哪里得到解答。关闭5年前。Improvethisquestion我无法阐明OpenStack和Cloudera之间的区别。据我了解,两者都是您可以安装在自己的集群中以对其进行管理的软件。但我想两者
我有一个在Ubuntu服务器上运行的现有CDH5.3集群。我想在相同的节点上安装Cassandra并将其与现有的Cloudera集群集成。我知道Cassandra现在允许BYOH,但我找不到任何在线指南来帮助我完成它。有没有人这样做过?你有什么我可以遵循的指示吗?谢谢 最佳答案 这是BYOH的Datastax文档 关于hadoop-在cloudera集群上安装datastaxcassandra,我们在StackOverflow上找到一个类似的问题: https
我需要知道cloudera是否提供任何可视化工具。我发现我们可以连接到tableau或zoomdata进行可视化,但他们是否提供自己的可视化工具? 最佳答案 您还有一些其他选项,例如:ApacheZeppelin-http://zeppelin.apache.org/jupyter-http://jupyter.org/烧杯笔记本-https://github.com/twosigma/beaker-notebook牛仔竞技-https://github.com/yhat/rodeoRStudio-https://www.rstud