CLOUDERA

java - Java 库路径 Cloudera 中没有 Hadoop。提交 Java 作业时

我正在尝试运行一个Java程序。Java程序用于记录Hbase中的数据。当我运行代码时，我遇到了javalib路径中没有hadoop的问题。错误如下org.apache.hadoop.util.NativeCodeLoader-Failedtoloadnative-hadoopwitherror:java.lang.UnsatisfiedLinkError:nohadoopinjava.library.path它还会抛出关于kebrorsathuentication的错误org.apache.hadoop.security.authentication.util.KerberosUti

hadoop - cloudera BDR HDFS复制和快照有什么区别

测试Cloudera5.15.1BDR，对HDFS复制与HDFS快照有点混淆。使用BDR，它将HDFS数据和快照复制到DR站点。HDFS复制与快照之间到底有什么区别？具有BDR的HDFS复制在内部如何工作？最佳答案 snapshotsallowyoutocreatepoint-in-timebackupsofdirectoriesortheentirefilesystemwithoutactuallycloningthedata另一方面，副本是数据副本。关于它们的工作原理，快照对我来说就像是一个Namenode备份——某个时间点的

cloudera hadoop section HDFS strong

hadoop - 在 cloudera 5.13.0 服务没有启动

我错误地删除了/var/log/*文件夹，因为服务没有在安装在该特定节点中的Cloudera中启动。并且没有生成日志文件。在clouderamanager中没有明确的错误信息。有人可以建议我如何进一步进行。请找到下图以供您理解。提前致谢。最佳答案你需要像这样创建空文件夹sudomkdir-p/var/log/cloudera-scm-agentsudomkdir-p/var/log/hadoop-hdfssudomkdir-p/var/log/cloudera-scm-serversudomkdir-p/var/log/hado

cloudera hadoop section code

docker - 使用数据初始化 Cloudera Hive Docker 容器

我正在使用此处描述的图像在Docker容器中运行Cloudera套件:https://hub.docker.com/r/cloudera/quickstart/我有以下配置:DockerfileFROMcloudera/quickstart:latestDocker组合文件version:'3.1'services:db-hive:container_name:mobydq-test-db-hiveimage:mobydq-test-db-hiverestart:alwaysbuild:context:.dockerfile:./db-hive/Dockerfileexpose:-10

容器 Cloudera code section quickstart docker hadoop hive docker-compose

hadoop - 使用 Cloudera Manager 安装 CDH : No such file or directory

使用CM安装并成功下载和分发所有包裹。但是，所有代理都不会在分发100%完成时解压包裹。检查日志，它说:[21/Nov/201809:53:04+0000]30292MainThreadparcelINFOExecutingcommand['chown','root:yarn',u'/opt/cloudera/parcels/CDH-6.0.1-1.cdh6.0.1.p0.590678/lib/hadoop-yarn/bin/container-executor'][21/Nov/201809:53:04+0000]30292MainThreadparcelINFOchmod:/opt

directory Cloudera section parcel hadoop cloudera-cdh cloudera-manager

hadoop - 用于cloudera cdh3u2的LZO

带着一些困惑，我阅读了cloudera'sblogpostonlzooncloudera.由于一些许可bs，lzo压缩不是标准hadoop的一部分，好的。但是，是什么阻止了cloudera将其作为其发行版的一部分？还是这件事发生了？简而言之，如何在clouderacdh3u2上进行lzo压缩？最佳答案 Butwhat'sstoppingclouderafrommakingitpartoftheirdistribution?Orhasthishappened?ApacheHadoop和ClouderaCDH都是released在相同

cloudera hadoop section blockquote

ubuntu - 权限被拒绝 : u'/opt/cloudera/parcel-cache/CDH-5. 3.3-1.cdh5.3.3.p0.5-precise.parcel.part'

我正在尝试安装具有3个节点的hadoopcloudera集群，所有这些节点都是ubuntu12.04机器。为此，我做了以下事情。我已经在所有机器上创建了hduser，并通过以下命令授予它root权限。sudoaddgrouphadoopsudoadduser--ingrouphadoophdusersudoadduserhdusersudosudosuhduser然后在所有机器上通过以下命令为无密码ssh生成无密码key。机器详细信息:master-1ip:192.168.0.101slave-1ip:192.168.0.102slave-2ip:192.168.0.103命令:ssh

parcel parcel-cache cloudera section hduser ubuntu hadoop cloudera-cdh cloudera-manager

hadoop - Cloudera 管理器 "Memory Overcommit Validation Threshold"

我目前有一个由3台机器组成的集群，它们都在运行Ubuntu，并且已经使用ClouderaManager进行了配置。查看集群后，我发现其中两台机器出现错误“MemoryOvercommitValidationThreshold”。一种是在机器只有3.8GB的物理内存时使用6.3GB的内存，另一种是在机器只有7.8GB的物理内存时使用11.6GB的内存。我认为这是因为这两个都被设置为数据节点和名称节点，但我不确定如何使它只使用可用的内存而不交换。我已经在sysctl.conf文件中将swappiness设置为0。我无法为名称节点使用另一台机器或向机器添加任何内存。知道如何降低内存使用量，以

Overcommit Validation section strong 务使 hadoop memory memory-management cloudera

hadoop - Cloudera 5.4.4 Cluster - 获取聚合使用指标

我想从Cloudera5.4.4Hadoop集群收集汇总使用指标。我心目中的一些指标如下:集群每天/每周的平均CPU利用率Hadoop上运行时间最长的n个作业/查询最常使用集群的前n个用户(按利用率、提交的作业数)集群磁盘使用率与磁盘容量集群磁盘使用量随时间增长是否有任何API/资源/工具等我可以用来开始这个？我不认为我完全确定从哪里开始。任何起点将不胜感激。另外，请分享您在集群使用指标方面的经验(如果有的话)。提前致谢! 最佳答案 Ganglia是一个用于大型集群的开源、可扩展的分布式监控系统。它收集、汇总并提供数十个与机器相关的

Cloudera Cluster section Ganglia Hadoop cloudera-cdh cloudera-manager

apache - cloudera 管理器 vs Apache

clouderadistribution使用clouderamanager在集群中进行自动安装和维护事件，就像Hortonworksdistribution在Windows中使用Ambari用于相同目的，任何人都可以告诉Apachedistribution使用什么工具来简化集群安装和维护？最佳答案正如您提到的ClouderaManager和Ambari提供两种类型的服务，安装和监控。Ambari是开源apache项目。Hortonworks使用其发行版提供支持和服务。也可以使用puppet/chef进行安装，使用Ganglia进

cloudera apache section distribution Ambari hadoop cloudera-manager

35 36 373839 40 41