Cloudera-CDH

hadoop - 定位 Cloudera Manager HDFS 配置文件

我已经通过ClouderaManager安装了一个集群，现在我需要手动启动集群。我一直在使用以下命令:$sudo-uhdfshadoopnamenode/datanode/jobtracker但是dfs.name.dir被设置为/tmp。我似乎找不到cloudera管理器在哪里有HDFS配置文件。/usr/lib/hadoop-02*/conf中的那些似乎是最小的。他们缺少dfs.name.dir，这是我特别要找的。顺便说一下，我在RHLE6系统上。由于懒惰，我虽然可以只复制cloudera管理器的HDFS配置文件，所以我不必手动创建它们，将它们复制到6个节点:)谢谢

hadoop - HDFS 作为 cloudera quickstart docker 中的卷

我对hadoop和docker都很陌生。我一直致力于扩展cloudera/quickstartdocker镜像docker文件，并希望从主机挂载一个目录并将其映射到hdfs位置，以便提高性能并在本地持久保存数据。当我使用-v/localdir:/someDir在任何地方安装卷时，一切正常，但这不是我的目标。但是当我执行-v/localdir:/var/lib/hadoop-hdfs时，datanode和namenode都无法启动，我得到:“cd/var/lib/hadoop-hdfs:权限被拒绝”。当我执行-v/localdir:/var/lib/hadoop-hdfs/cache时，

quickstart cloudera code docker hadoop hdfs bigdata

hadoop - Cloudera 管理器 : Where do I put Java ClassPath for MapReduce jobs?

我已经让Hadoop-Lzo在我的本地伪集群上愉快地工作，但是第二次我在生产中尝试相同的jar文件时，我得到:java.lang.RuntimeException:native-lzolibrarynotavailable库已验证在DataNode上，所以我的问题是:我在什么屏幕/设置中指定native-lzo库的位置？最佳答案对于MapReduce，您需要将条目添加到MapReduce客户端环境安全阀。您可以通过转到配置下的查看和编辑选项卡找到MapReduceClientSafety。然后在那边添加这些行:HADOOP_CL

ClassPath MapReduce strong cloudera section hadoop lzo

java - Hadoop CDH5 中的垃圾收集持续时间

我们有一个运行CDH5.0.2的四数据节点集群，通过ClouderaManager包裹安装。为了将13M用户的行导入HBase，我们编写了一个简单的Python脚本并使用了hadoop-streamingjar。它按预期工作高达100k行。然后......然后，一个接一个，所有数据节点崩溃并显示相同的消息:ThehealthtestresultforREGION_SERVER_GC_DURATIONhasbecomebad:Averagetimespentingarbagecollectionwas44.8second(s)(74.60%)perminuteoverthepreviou

Hadoop java 39 的 section garbage-collection hbase cloudera-cdh

hadoop - 附加到 HDFS 中的文件 (CDH 5.4.5)

这里是HDFS的全新内容。我有一小段代码来测试附加到文件:valpath:Path=newPath("/tmp","myFile")valconfig=newConfiguration()valfileSystem:FileSystem=FileSystem.get(config)valoutputStream=fileSystem.append(path)outputStream.writeChars("what'sup")outputStream.close()失败并显示此消息:Notsupportedjava.io.IOException:Notsupportedatorg.ap

hadoop HDFS section ChecksumFileSystem FileSystem cloudera-cdh

java - 如何让 WordCount.java 在 Cloudera 4 上编译？

我正在尝试在Cloudera4的Linux(CentOS)安装上编译一个简单的WordCount.javamap-reduce示例。当我引用任何hadoop类时，我总是遇到编译器错误，但我无法弄清楚/usr/lib/hadoop下的数百个jar中的哪些我需要添加到我的类路径中才能编译。任何帮助将不胜感激!我最想要的是一个用于字数统计的Java文件(以防万一我发现的文件由于某种原因不好)以及用于编译和运行它的相关命令。我正在尝试仅使用javac而不是Eclipse来执行此操作。无论哪种方式，我的主要问题是Cloudera4安装中的Hadoop库到底是什么，我需要包含这些库才能编译经典的W

上编 java hadoop section program javac cloudera word-count

eclipse-plugin - Hadoop CDH4 和 Eclipse Juno

有没有人成功地针对CDH4安装为Juno构建了一个eclipse插件？我在网上看到了CDH3。寻找CDH4。非常感谢。最佳答案我不确定您指的是HadoopEclipse插件还是针对CDH4开发代码的插件。我会回答这两个问题。在Juno中针对CDH4进行开发:到目前为止，在Eclipse(任何版本)中针对CDH4组件编写应用程序的最简单方法是使用m2eclipse[1]并将ClouderaMaven存储库添加到您的pom.xml。事实上，Cloudera的很大一部分人(包括我自己)经常这样做。最近，我们的一位工程师(Natty)写

eclipse-plugin eclipse section CDH4 CDH hadoop

hadoop - 从 quickstart.cloudera/172.17.0.2 调用 quickstart.cloudera :8020 failed on connection exception: java.net.ConnectException: Connection refused

我是Docker和Hadoop系统的新手。我已经在Ubuntu16.04中安装了Docker，并在一个新的Docker容器中运行来自Cloudera的Hadoop镜像。但是当我尝试在hdfs中运行任何命令时，错误消息显示为:CallFromquickstart.cloudera/172.17.0.2toquickstart.cloudera:8020failedonconnectionexception:java.net.ConnectException:Connectionrefused;我不知道如何解决这个问题。我期待您的帮助。最佳答案

quickstart cloudera section 中运 code hadoop docker dockerfile

configuration - 如何使用 CDH4 和 Yarn 查看我的 Hadoop 作业历史记录和日志？

我用Yarn下载了Hadoop的CDH4tar，作业运行良好，但我不知道从哪里查看我的作业日志。在MRv1中，我只是访问了JobTracker网络应用程序，它具有工作历史记录。也可以从这里访问单个作业的日志，或者转到logs/userlogs目录。在我的新Yarn设置中(仅在单台计算机上运行)，我有日志目录，但没有日志/用户日志文件夹。当我转到ResourceManager网页localhost:8088时，有一个“所有应用程序”部分，但此处没有显示任何条目。当我转到JobHistory网页时，localhost:19888，没有列出任何工作。我想知道是否存在配置问题。这是我的yarn

configuration Hadoop gt lt property cloudera hadoop-yarn

hadoop - CDH(Cloudera Distribution for hadoop) 是开源的吗？

CDH(ClouderaDistributionforhadoop)是开源的还是商业的？非常感谢对此的任何意见。最佳答案 "AllsoftwaredevelopedbyClouderaforCDHisreleasedwithanApache2.0license".换句话说，它是开源的。关于hadoop-CDH(ClouderaDistributionforhadoop)是开源的吗？，我们在StackOverflow上找到一个类似的问题： https://s

hadoop Distribution section Cloudera

40 41 424344 45 46