草庐IT

Cloudera-CDH

全部标签

hadoop - 将 HUE 界面语言设置/强制为英语(Hadoop/Cloudera)

由于某种原因,当我从我的机器访问它时,hue界面语言是德语。(德语语言设置,但英语浏览器和操作系统)如何强制hue始终显示英文? 最佳答案 Hue正在采用您的浏览器发送的首选语言环境。您浏览器中的德语语言环境可能设置为比英语语言环境更高的优先级。Thisarticle说明您可以在哪里更改它。 关于hadoop-将HUE界面语言设置/强制为英语(Hadoop/Cloudera),我们在StackOverflow上找到一个类似的问题: https://stacko

hadoop - Cloudera安装疑惑?

我是cloudera的新手,我在我的系统中成功安装了cloudera我有两个疑问,考虑一台机器的一些节点已经使用hadoop处理一些数据,我们可以安装Cloudera以使用现有的Hadoop而不对现有hadoop存储的数据进行任何更改或修改。我在我的机器上安装了Cloudera,我还有另外三台机器可以将它们添加为集群,我想知道,在将这些机器添加为集群之前,我是否要在这三台机器上安装cloudera?,或者我们可以添加一个节点作为集群而不在那个特定节点上安装cloudera?。在此先感谢任何人,请提供有关上述问题的一些信息。 最佳答案

xml - 可以将 HCatalog 与 XML 一起使用吗? -- 在 Cloudera VM 上执行 ETL

我正在处理一个大数据类的项目,我已经在本地安装了ClouderaQuickstartVM以在我的数据集上运行一些基本任务并熟悉一些工具。我正在学习一个教程,其中涉及将数据集移动到HDFS,基于数据集文件创建一个HCatalog表,然后在该表上运行Hive和/或Pig命令。问题是我的数据是一个大的XML文件,HCatalog中的标准分隔符选项不适用。有没有办法将XML导入HCatalog?如果不是,在我的XML数据集上使用Hive或Pig的最佳方法是什么?编辑:我的文件来自公共(public)StackOverflow数据集。我正在使用posts.xml文件。它非常大(25GB),我无法

hadoop - "Doesn' t 存在于 RM"Pig 后端错误

我在从http://www.cloudera.com/content/cloudera-content/cloudera-docs/DemoVMs/Cloudera-QuickStart-VM/cloudera_quickstart_vm.html下载的ClouderaQuickStartVM中遇到错误.我正在尝试TomWhite的Hadoop:权威指南中的玩具示例,名为map_temp.pig,它“按年份查找最高温度”。我创建了一个名为temps.txt的文件,其中每一行都包含(年份、温度、质量)条目:19500119502211950-11119491111使用书中的示例代码,我在

hadoop - 在 hadoop 2.3.0-cdh-5.0 上的 Giraph1.1.0 上执行示例显示以下错误

root@pseudo-hadoop:/usr/lib/hadoop#bin/hadoopjar$GIRAPH_HOME/giraph-examples/target/giraph-examples-1.1.0-SNAPSHOT-for-hadoop-1.2.1-jar-with-dependencies.jarorg.apache.giraph.GiraphRunnerorg.apache.giraph.examples.SimpleShortestPathsComputation-viforg.apache.giraph.io.formats.JsonLongDoubleFloat

hadoop - 如何在 Cloudera 的 Cassandra 中启用节俭?

enterimagedescriptionhere我是Cassandra和cloudera编程的新手。我有错误“没有按要求启动RPC服务器,使用JMX(存储服务->启动rpc或nodetool(enablethrift)来启动它”。我从几个小时开始就在尝试启用盗窃使用nodetool但徒劳无功。我在Cassandra位置找到了一个文件“Enablethrift.html”,但我不知道该怎么做。请帮忙 最佳答案 更改cassandra.yaml:start_rpc:false到start_rpc:true

hadoop - 从表名中删除 Cloudera Impala

我是Impala的新手,我正在尝试了解如何从表中删除记录...我试过寻找删除命令,但没有找到完全可以理解的说明...这是我的表结构:createtableInstalls(BrandIDINT,PublisherIDINT,InstallDateSTRING,HourNumINT,CountrySTRING,InstallsINT)PARTITIONEDBY(dayINT,monthINT,yearINT)STOREDASPARQUET在Hadoop中可以删除吗?语法是如何工作的?任何帮助对我来说都是一个很大的帮助...谢谢:) 最佳答案

hadoop - Cloudera 包版本含义

我正在浏览cloudera包组件的详细信息。在版本详细信息中,我无​​法理解cloudera添加到版本信息中的最后一个数字是什么。示例:LINK组件包版本ApacheAvroavro-1.7.6+cdh5.5.4+118 最佳答案 包版本中的最后一个数字是提交数。您可以在表中的更改文件部分找到提交。 关于hadoop-Cloudera包版本含义,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/ques

hadoop - "No common protection layer between client and server"尝试与 Kerberized Hadoop 集群通信时

我正在尝试以编程方式与Kerberized(CDH5.3/HDFS2.5.0)的Hadoop集群进行通信。我在客户端有一个有效的Kerberostoken。但是我收到如下错误,“客户端和服务器之间没有公共(public)保护层”。这个错误是什么意思,有什么方法可以修复或解决它吗?这与HDFS-5688有关吗??该票似乎暗示必须设置属性“hadoop.rpc.protection”,大概是“身份验证”(也根据例如this)。这是否需要在集群中的所有服务器上设置,然后集群反弹?我无法轻松访问集群,因此我需要了解“hadoop.rpc.protection”是否是真正的原因。看起来'auth

java.lang.UnsatisfiedLinkError : org. apache.hadoop.io.nativeio.NativeIO$Windows.createDirectoryWithMode0 问题

我无法解决这个异常,我已经阅读了hadoop文档和我能找到的所有相关的stackoverflow问题。我的fileSystem.mkdirs(***)抛出:Exceptioninthread"main"java.lang.UnsatisfiedLinkError:org.apache.hadoop.io.nativeio.NativeIO$Windows.createDirectoryWithMode0(Ljava/lang/String;I)Vatorg.apache.hadoop.io.nativeio.NativeIO$Windows.createDirectoryWithMod