vm-cdh-cluster

hadoop - 安装hadoop-cdh后/etc/init.d/下缺少初始化脚本

在Cloudera的文档中——“在集群上部署HDFS(使用命令行)”据说，要启动名称节点服务，请键入以下命令:forxin`cd/etc/init.d;lshadoop-hdfs-*`;dosudoservice$xstart;done问题是，/etc/init.d/目录下没有匹配hadoop-hdfs-*名称模式的项。我认为应该有一个hadoop-hdfs-namenode，不是吗？有人能告诉我为什么hadoop-hdfs-namenode不见了吗？我错过了任何部署步骤吗？非常感谢! 最佳答案您在安装时缺少可选服务包。尝试安装h

java - 如何在 CDH 上查看 Avro 版本？

CDH上是否有检查Avro库版本的机制？我知道Avro库依赖于项目中的依赖项，但我看到在我们的Hadoop集群的节点上有一些地方默认驻留库。有没有办法检查默认包含在CDH发行版中的avro版本？即使我们将Avro与hive一起使用，Avro版本也是CDH自己使用的，无需单独配置(在CDH中)。我想知道如何检查Avro版本。最佳答案您可以运行avro-tools，它会告诉您所使用的Avro版本。$avro-toolsVersion1.7.6-cdh5.14.0-SNAPSHOTofApacheAvro....

何在 java section Avro code hadoop version cloudera

hadoop - 从 Oozie (CDH) 运行 Spark2

我正在尝试从Oozie运行一个spark作业(使用spark2-submit)，所以这个作业可以按计划运行。当运行我们从命令行在我们的服务帐户(不是Yarn)下运行shell脚本时，作业运行得很好。当我们将它作为Oozie工作流运行时，会发生以下情况:17/11/1612:03:55ERRORspark.SparkContext:ErrorinitializingSparkContext.org.apache.hadoop.security.AccessControlException:Permissiondenied:user=yarn,access=WRITE,inode="/us

hadoop Spark2 code section gt apache-spark cloudera oozie cloudera-cdh

hadoop - 无法在 ubuntu 机器上卸载通过 CDH5 安装的 sqoop

我从ClouderaManager中卸载了sqoop，但我仍然可以通过终端看到sqoop版本:chaithu@localhost:~$sqoopversionWarning:/opt/cloudera/parcels/CDH-5.13.1-1.cdh5.13.1.p0.2/bin/../lib/sqoop/../accumulodoesnotexist!Accumuloimportswillfail.Pleaseset$ACCUMULO_HOMEtotherootofyourAccumuloinstallation.17/12/2418:49:28INFOsqoop.Sqoop:Run

hadoop ubuntu section sqoop cloudera cloudera-manager sqoop2

hadoop - Cloudera VM，压缩编解码器

我正在准备CLOUDERA认证，有时很难记住Sqoop导入过程中使用的压缩编解码器。例如:org.apache.hadoop.io.compress.SnappyCodec.考试期间不允许我使用谷歌。在考试的时候，有没有办法检索这些信息？目前我使用的是ClouderaQuickstartVM，在Mapred-site.xml中没有找到这个信息。我在哪里可以找到相同的？最佳答案我相当确定您可以访问Cloudera文档https://www.cloudera.com/documentation/enterprise/5-14-x/t

Cloudera hadoop section https introduction_compression compression

java - 在 CDH4 示例上运行 map reduce 作业

我是CDH4和Hadoop的新手。我正在尝试运行wordcountexample并收到以下错误。你能纠正我并让我知道问题是什么吗:WordCount.java:25:interfaceexpectedherepublicstaticclassMapextendsMapReduceBaseimplementsMapper{^WordCount.java:39:interfaceexpectedherepublicstaticclassReduceextendsMapReduceBaseimplementsReducer{^WordCount.java:56:setMapperClass(

reduce java hadoop apache WordCount mapreduce

java - 如何在预配置hadoop的VM镜像中加载我们自己的java文件

我是Hadoop环境的新手。为了试用示例并了解它，我已经安装了一个预配置的VM，其中包含来自Here的Hadoop环境。我可以运行hadoop中提供的示例。我需要在VM中加载我的数据，并且必须使用hadoop运行它。但我不知道该怎么做，因为VM没有GUI，只有命令行选项。我正在使用Windows7。如果有人帮助我解决这个问题，我将不胜感激。最佳答案由于您已经安装了HadoopVM，因此您必须拥有该VM的IP。由于您使用的是Windows，因此请安装软件WinSCP并使用其IP连接到您的VM。然后将您想要的文件从您的Windows

中加 java section hadoop virtual-machine

CDH4 中的 Hadoop 和 Hive 主页

我正在尝试在CDH4环境中配置RHive。在R中读取包“RHive”时，返回了以下错误。我猜这是由于错误的家庭。如果是这样，什么是正确的？或者，如果这不是原因，那有什么问题？如有任何帮助，我们将不胜感激。谢谢。>Sys.setenv(HIVE_HOME="/etc/hive")>Sys.setenv(HADOOP_HOME="/etc/hadoop")>library(RHive)Loadingrequiredpackage:rJavaLoadingrequiredpackage:RserveThisisRHive0.0-7.Foroverviewtype'?RHive'.HIVE_H

Hadoop CDH4 RHive section 39 hive

hadoop - CDH4.4 : Restarting HDFS and MapReduce from shell

我正在尝试使用bash脚本在ClouderaHadoop4.4集群上自动停止、格式化和启动HDFS和MapReduce服务。使用“pkill-Uhdfs&&pkill-Umapred”可以很容易地终止HDFS和MapReduce进程，但是如何在不使用ClouderaManagerGUI的情况下再次启动这些进程？最佳答案好吧，显然CM有一个非常棒的API在这里查看http://cloudera.github.io/cm_api/ 关于hadoop-CDH4.4:Restarting

Restarting MapReduce section stackoverflow hadoop hdfs cloudera

hadoop - hadoop、mahout、CDH版本匹配

我需要使用最新的mahout版本0.9(因为我需要使用所有分布式推荐算法)。为此，我应该使用哪个版本的hadoop？在某些地方，已经提到hadoop2.20不能很好地与mahout0.9一起工作。因此，我可以使用mahout0.9的最低hadoop版本是多少。如果我使用的是cloudera(CDH)，我应该使用什么版本来处理mahout0.9。最佳答案 CDH4.x包含Mahout0.7CDH5.0.x包含Mahout0.8CDH5.1.x发布后，可能会包含Mahout0.9，但不要引用我的话所有这些Mahout版本的默认构建都是

hadoop mahout section cloudera mahout-recommender

68 69 707172 73 74