关闭。这个问题是opinion-based.它目前不接受答案。想要改进这个问题?更新问题,以便editingthispost可以用事实和引用来回答它.关闭7年前。Improvethisquestion为什么我们使用CDH(cloudera)而不是使用Apache-Hadoop或Apache-Sparkets。独自?它有什么优势?如果我想用Apache-Spark做数据分析,单独使用CDH好还是Apache-Spark框架好?谢谢
我已经停止了ntpd并重新启动了它。已经做了一个ntpdatepool.ntp.org。错误出现一次,主机很健康,但一段时间后再次出现时钟偏移错误。我还观察到,在执行ntpdate后,cloudera的Web界面停止工作。它说潜在的不匹配配置修复并重新启动色调。我在VMware上安装了带有centos的cloudera快速启动虚拟机。 最佳答案 检查/etc/ntp.conf文件是否在所有节点/主节点上都相同重启ntp使用chkconfig添加守护进程并将其设置为开启 关于hadoop-
我正在尝试在我的CDH5.7.5集群中安装SPARK2.0。这样做时我遇到了以下错误CDH(lowerthan5.12)parcelrequiredforSPARK2(2.0.0.cloudera1-1.cdh5.7.0.p0.113931)isnotavailableP.S:已关注documentation 最佳答案 取消选中Parcel配置中的ValidateParcelRelations 关于hadoop-无法在CDH5.7.5中安装Spark2.0,我们在StackOverflo
关闭。这个问题是off-topic.它目前不接受答案。想改进这个问题吗?Updatethequestion所以它是on-topic用于堆栈溢出。关闭9年前。ImprovethisquestionUbuntu12.04服务器AMD64有什么建议吗?InitializationfailedforblockpoolBlockpoolBP-1276073141-127.0.1.1-1357815963565(storageidDS-1319948814-127.0.1.1-50010-1357815971500)servicetobpct-server-01/127.0.1.1:8020org
我已经成功安装了Cloudera管理器。它显示Currentlymanagedhosts为127.0.0.1并且它是事件的。当我在加载后使用cloudera管理器搜索和安装集群时,它显示以下错误。Installationfailed.Failedtoreceiveheartbeatfromagent.Ensurethatthehost'shostnameisconfiguredproperly.Ensurethatport7182isaccessibleontheClouderaManagerserver(checkfirewallrules).Ensurethatports9000a
我有一个最近从CDH3升级到CDH4的集群。Hive目前运行良好。然而,我似乎无法让它运行简单的MRStreaming作业(版本1)。Yarn已安装但未使用。下面是命令行输入输出$/usr/lib/hadoop/bin/hadoopjar/usr/lib/hadoop-0.20-mapreduce/contrib/streaming/hadoop-streaming-2.0.0-mr1-cdh4.0.0.jargrep-input/input-output/output/'dfs[a-z.]+'检查日志显示:packageJobJar:[/tmp/hadoop-hdfs/hadoop-
我正在运行CDH4.5。我试图将distcp用于s3n,但自升级到4.5后出现问题。我正在尝试启动并运行s3distcp,但遇到了问题。我下载了它,并正在运行这个命令:hadoopjar/usr/lib/hadoop/lib/s3distcp.jar--srchdfs://NN:8020/path/to/destination/folder--dests3n://acceseKeyId:secretaccesskey@mybucket/destination/但我收到以下错误:INFOmapred.JobClient:map100%reduce0%INFOmapred.JobClien
如何从命令行CDH4--启动/停止服务。我是Hadoop的新手。从Cloudera安装的VM。找不到start-all.sh和stop-all.sh。如果需要,如何停止或启动任务跟踪器或数据节点。这是我在Centos上使用的单节点集群。我没有做任何修改。除此之外,我还看到所有版本的目录结构都发生了变化。我无法在安装的VM上找到这些sh文件。[cloudera@localhost~]$stop-all.shbash:stop-all.sh:commandnotfound非常感谢您的支持。 最佳答案 使用Sudosuhdfs启动和停
我在亚马逊上启动了一个EC2集群来安装cloudera...我安装并配置了它,并将一些Wiki页面View公共(public)快照加载到HDFS中。文件结构如下:projectcode,pagename,pageviews,bytes文件是这样命名的:pagecounts-20090430-230000.gzdatetime当从HDFS加载数据到Impala时,我是这样做的:CREATEEXTERNALTABLEwikiPgvws(project_codevarchar(100),page_namevarchar(1000),page_viewsint,page_bytesint)RO
我在一个运行Cloudera5.3的集群上工作,我已经按照所有说明创建了一个NFS网关并且它运行良好。我的问题是我仍然无法将HDFS目录视为Linux文件系统的一部分(这是RHEL6)。我不是UNIX管理员,所以我没有挂载目录的经验,而且我在网上找到的文档对解决这个特定问题没有帮助。我试过简单的mount/在作为NFS网关的机器上,但这没有用。当我尝试从另一台集群机器使用挂载时mount://我在网关服务器和HDFS中都看不到任何文件(尽管我可以使用hdfsdfs-ls轻松查看这些文件)。既然已经设置了NFS,我该如何实际将HDFS挂载为目录? 最佳答案