草庐IT

CLOUDERA

全部标签

database - HBase 错误 - 分配 -ROOT- 失败

我刚刚从cloudera(3)安装了hadoop和hbase,但是当我尝试转到http://localhost:60010时它只是坐在那里不断加载。我可以正常访问区域服务器-http://localhost:60030...查看主hbase服务器日志,我可以看到以下内容。看起来像是根区域的问题。所有这些都安装在运行Ubuntu(Natty)11的ext41TB分区上。没有集群/其他盒子。任何帮助都会很棒!11/05/1519:58:27WARNmaster.AssignmentManager:Failedassignmentof-ROOT-,,0.70236052toserverNam

security - 如何在 apache ranger 和 sentry 之间进行选择

从这两个项目提供的wiki中,我发现他们似乎做了类似的工作。但必须有一些区别,否则不需要2。那么它们之间有什么区别,相互选择的实用建议是什么。非常感谢! 最佳答案 上面的答案很好。去年与Cloudera+Hortonworks合并快速更新。这些公司已决定对Ranger进行标准化。CDH5和CDH6仍将使用Sentry,直到CDH产品线在约2-3年后退役。Ranger将用于Cloudera+Hortonworks的组合“Unity”平台/CDP产品。Cloudera告诉我们,Ranger是一个更“成熟”的产品。由于Unity尚未发布(

hadoop - yarn 不尊重 yarn.nodemanager.resource.cpu-vcores

我正在使用Hadoop-2.4.0,我的系统配置是24个内核,96GBRAM。我正在使用以下配置mapreduce.map.cpu.vcores=1yarn.nodemanager.resource.cpu-vcores=10yarn.scheduler.minimum-allocation-vcores=1yarn.scheduler.maximum-allocation-vcores=4yarn.app.mapreduce.am.resource.cpu-vcores=1yarn.nodemanager.resource.memory-mb=88064mapreduce.map.m

scala - Spark : check your cluster UI to ensure that workers are registered

我在Spark中有一个简单的程序:/*SimpleApp.scala*/importorg.apache.spark.SparkContextimportorg.apache.spark.SparkContext._importorg.apache.spark.SparkConfobjectSimpleApp{defmain(args:Array[String]){valconf=newSparkConf().setMaster("spark://10.250.7.117:7077").setAppName("SimpleApplication").set("spark.cores.m

hadoop - 为什么 "hadoop fs -mkdir"会因权限被拒绝而失败?

我在我正在玩的VM机器上使用Cloudera。不幸的是,我在将数据复制到HDFS时遇到问题,我得到以下信息:[cloudera@localhost~]$hadoopfs-mkdirinputmkdir:Permissiondenied:user=cloudera,access=WRITE,inode="/user":hdfs:supergroup:drwxr-xr-x我不太关心此VM的安全性,无论如何我可以在HDFS上打开更多安全性吗? 最佳答案 在hadoop中使用mkdir需要“hadoop文件权限”。从您的示例中,您可以看到h

hadoop - 执行字数统计 mapreduce 作业时出现 InterruptedException

我已经在我的机器上安装了ClouderaVM5.8版。当我执行字数统计mapreduce作业时,它抛出以下异常。`16/09/0606:55:49WARNhdfs.DFSClient:Caughtexceptionjava.lang.InterruptedExceptionatjava.lang.Object.wait(NativeMethod)atjava.lang.Thread.join(Thread.java:1281)atjava.lang.Thread.join(Thread.java:1355)atorg.apache.hadoop.hdfs.DFSOutputStream

hadoop - 如何找到cdh版本的hadoop

当连接到Hadoop集群时,如何知道这个集群运行的是哪个版本的Hadoop?在使用Maven编译和打包HadoopJava作业时,这对于正确配置库尤其重要。 最佳答案 如果您可以通过ssh访问hadoop节点,最简单的方法是运行命令$hadoopversion 关于hadoop-如何找到cdh版本的hadoop,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/24601105/

hadoop - 在 Yarn 集群上运行 Spark 作业

我想在HadoopYARN集群模式下运行我的spark作业,我正在使用以下命令:spark-submit--masteryarn-cluster--driver-memory1g--executor-memory1g--executor-cores1--classcom.dc.analysis.jobs.AggregationJobsparkanalitic.jarparam1param2param3我在下面收到错误,请提示出了什么问题,命令是否正确。我正在使用CDH5.3.1。Diagnostics:Applicationapplication_1424284032717_0066f

hadoop - Impala 无法访问所有配置单元表

我尝试通过hive查询hbase数据(我使用的是cloudera)。我做了一个指向hbase的fiew配置单元外部表,但问题是Cloudera的Impala无法访问所有这些表。所有配置单元外部表都出现在Metastore管理器中,但是当我在Impala中执行简单的“显示表”时,我发现缺少3个表。会不会是权限问题?我在Metastore管理器中看到每个人都可以读取缺少的3个表,所以... 最佳答案 在Impala中运行查询“使元数据无效”,您的表将显示出来。 关于hadoop-Impala

Hadoop发行版 Cloudera CDH 6.3.2及CM 安装包下载(阿里云盘 不限速)

CDH(全称Cloudera’sDistribution,includingApacheHadoop)是由Cloudera公司构建的Hadoop稳定发行版,不仅含有ApacheHadoop,还整合了Hive、Spark等组件。由于CDH已停止维护,且Cloudera不再为CDH提供免费的下载服务,因此网上很难直接下载到CDH和管理工具CM的安装包。百度云盘上的资源下载速度极慢,开了会员才下载下来。现已上传至不限速的阿里云盘:Cloudera-CDH-6.3.2阿里云盘分享提取码:2m7a