Cloudera-CDH_草庐IT

hadoop - HDFS 在私有(private)云中使用 Cloudera Manager

这让我发疯。我已经为此工作了好几天，但似乎无法解决这个问题。我有一个在桉树上运行的私有(private)云用于测试，还有4个运行Ubuntu12.04的虚拟机。我试图让cloudera运行HDFS和map-reduce但是当我尝试启动它时，数据节点似乎永远无法与名称节点通信。它安装良好并通过了所有启动前检查。主机文件全部设置为127.0.0.1本地主机和其他虚拟机的ip和主机名，防火墙全部禁用，安全组设置为允许一切。我可以使用名称节点上的telnet和netstat连接到从数据节点到名称节点的8022端口，如下所示:tcp00172.31.254.119:90000.0.0.0:*听6

私有 Cloudera section strong tcp hadoop hdfs

hadoop - cloudera 中的默认 Oozie 选项

我正在使用最新的Clouderacdh4。默认情况下oozie的所有默认参数都在/etc/oozie/conf/oozie-default.xml我已将oozie.service.CoordMaterializeTriggerService.lookup.interval更改为30:oozie.service.CoordMaterializeTriggerService.lookup.interval30下一个群集已重新启动。但是在oozie配置的HueUI中，我看到了oozie.service.CoordMaterializeTriggerService.lookup.interva

cloudera hadoop section oozie CoordMaterializeTriggerService

hadoop - Cloudera CDH4 上的 Accumulo - 启动组件时拒绝访问

我有一个使用ClouderaCDH4Hadoop和MapReducev1启动并运行的小型集群。Namenode/SecondaryNamenode/Jobtracker都在不同的机器上。我的三台服务器也充当Zookeeper服务器。我正在尝试在此集群上安装Accumulo1.4.4。我在Accumulo1.5.0中得到了相同的行为。我能够bin/accumuloinit并初始化Accumulo，但启动各个组件失败。我正在尝试让我的Namenode成为Accumulo主机。bin/start-server.shlocalhostmonitor吐出一个非常令人鼓舞的Startingmoni

Cloudera Accumulo java apache hadoop

hadoop - 画面 : Error while using Impala to connect to Cloudera Hadoop

我正在研究如何使用Tableau连接到ClouderaHadoop。我提供服务器和端口详细信息并使用“Impala”进行连接。我能够成功连接，选择默认模式并选择所需的表。在此之后，当我将维度或度量拖放到“网格”上的行/列时，出现以下错误:[Cloudera][Hardy](22)来自ThriftHiveClient的错误:查询返回非零代码:10025，原因:失败:SemanticException[错误10025]:第1:7行表达式不在GROUPBY键中''.但是，如果我尝试使用与“HiveServer”(而不是“Impala”)相同的连接类型，它工作正常。我们不确定哪里出错了。非常感

Cloudera 画面 section Impala hadoop tableau-api

hadoop - CDH5 Hue Hive — 蜂蜡服务器 : Error opening session: Failed to validate proxy privilage of hue for admin

我通过Kerberos设置了一个具有安全性的Hadoop集群，Hive已经启用了Sentry。我对Hue-Hive(Beeswax)Editor有疑问。Hue无法在hive-server2日志中加载来自hive的数据和信息:2014-04-0311:36:39,814WARNthrift.ThriftCLIService(ThriftCLIService.java:GetSchemas(364))-Errorgettingcatalogs:org.apache.hive.service.cli.HiveSQLException:InvalidSessionHandle:SessionH

privilage validate java ThriftCLIService apache hadoop hive hue apache-sentry

hadoop - Cloudera Manager 安装失败

我正在尝试使用ClouderaManager5在EC2上创建一个用于测试目的的小型集群。这些是我遵循的方向，http://www.cloudera.com/content/cloudera-content/cloudera-docs/CM4Ent/4.7.1/Cloudera-Manager-Installation-Guide/cmig_install_on_EC2.html.它正在执行“在服务spark上执行命令SparkUploadJarServiceCommand”，但它失败了。错误是“在spark_master上上传SparkJar失败”。出了什么问题，我该如何解决？感谢您的

Cloudera Manager hadoop amazon-ec2 cloudera-manager cloudera-cdh

ubuntu - 我应该把 Cloudera Manager Server 放在哪里

我有一个由4个ubuntu12.04LTS组成的集群，准备利用ClouderaManager(带有CDH5)安装Hadoop。但是我对ClouderaManagerServer放在哪里感到困惑。是否要添加一台新的ubuntu机器来托管ClouderaManagerServer，然后让它管理由1主3从组成的Hadoop集群？或者我应该将ClouderaManagerServer与Hadoopmaster放在一起吗？因此Hadoopmaster和ClouderaManagerServer在一台(虚拟)机器上。这个问题可能会重复here.但是看了之后还是一头雾水。期待任何专业知识。

Cloudera Manager section ubuntu hadoop cloudera-manager

hadoop - 在 ubuntu 12.04 LTS 中使用 cloudera manager 安装 Cloudera CDH5

我正在尝试在Ubuntu12.04LTS(64位)中使用ClouderaManager安装CDH5。我正在按照Clouderalink中提到的步骤进行操作.我无法为安装CDH5指定正确的主机名。除了/etc/hosts文件中的127.0.0.1和127.0.1.1之外，我没有任何其他条目。我正在使用USB加密狗访问互联网，但我现在没有任何以太网连接。请告诉我是否需要以太网连接才能在我的PC中安装CDH5。附言我目前是一名大型机开发人员，没有任何Linux或开源背景。我花了将近40个小时的时间试图在我的机器上安装CDH5，以便我可以进行Udacity'sIntroductiontoHad

Cloudera section CDH5 hadoop ubuntu-12.04 cloudera-cdh cloudera-manager

来自 Cloudera Manager 的电子邮件警报

我们需要设置一个流程，使我们能够从ClouderaManager接收基于Hadoop指标的电子邮件警报。例如。某项服务出现故障，超过10个数据节点被列入黑名单等。在CM5.1版中实现此目标的最佳方法是什么？最佳答案您是否尝试在管理->警报下查看Cloudera管理器？那里有相当多的内置监控和警报配置选项。关于您的示例，在HDFS警报下有一个针对“DataNode健康”的特定设置。关于来自ClouderaManager的电子邮件警报，我们在StackOverflow上找到一个类似的问

警报 Cloudera section email hadoop alert cloudera-manager

postgresql - 有人在 cloudera 5.2.0 上使用 hadoop_fdw 吗？

将hadoop_fdw安装到我们正在运行的pgsql9.3.4后，我尝试将它连接到clouderacluster5.2.0，但没有成功。有没有调试fdw的方法？创建外部表并从中选择后，我收到一个错误-错误:无法连接到Hive:没有更多数据可读取。顺便说一句:一些旧版本的hadoop_fdw能够使用url(jdbc://server:port/args)，但最新版本不行，只有地址和端口。最佳答案 Hadoop_fdw没有成功。hive.c中可能有错误/旧的/过时的东西。但是通过更多的努力，我们设法使jdbc_fdw与cloudera

postgresql hadoop_fdw section cloudera jdbc hadoop hive cloudera-cdh foreign-data-wrapper