草庐IT

vm-cdh-cluster

全部标签

java - 如何使用hadoop api在vm上运行的hadoop机器上创建目录

我有一个创建目录的java客户端程序,但是当在我的本地机器上执行它创建目录的程序时,即使我已经将fs.defaultFS配置为与core-site.xml匹配的vmurl。这里是创建目录的示例程序。importjava.io.IOException;importorg.apache.hadoop.conf.Configuration;importorg.apache.hadoop.fs.FileSystem;importorg.apache.hadoop.fs.Path;publicclassMkdir{publicstaticvoidmain(Stringar[])throwsIOE

hadoop - 在支持 64 位架构的 Windows 32 中安装 Cloudera VM

我有一个32位Windows操作系统。但是我的系统支持64位架构,我可以这么说,因为当我从VMware网站下载并运行VMWare处理器检查64位兼容性工具时,它显示“此主机能够在此VMWare产品下运行64位guest操作系统”'.那么,使用这个64位架构,我是否能够安装和使用ClouderaVM,然后安装和使用hadoop? 最佳答案 根据评论,您可以继续使用64位,没有任何问题,hadoop将启动并运行。但是,您始终可以返回并下载32位并导入您的VMWare,然后同时导入64位和32位。如果万一您遇到64位的任何问题,那么您可以

hadoop - Spark : yarn cluster mode can't read hdfs path (No such file or directory)

我在yarn模式下使用spark提交,但我收到了这个错误:显然我的输入路径hdfs://缺少一个'/'我正在通过hdfs://master:8020/usr/jimmy/Test/,但是日志输出是日志文件中的hdfs:/master:8020/usr/jimmy/Test/Personal1(Personal1在我的代码中指定)缺少的'/'显然是问题所在我能做什么?请帮帮我我的命令:./bin/spark-submit--masteryarn-cluster--classMovie.Movies/usr/jimmy/Move.jarhdfs://master:8020/usr/jimm

hadoop - Cloudera CDH 无法为 tez-ui 启动 yarn timeline server

当我通过在ClouderaManager高级配置选项中将配置添加到yarn-site.xml来启用yarn时间服务器时:yarn.timeline-service.hostnameyarn-hostnameyarn.timeline-service.enabledtrueyarn.timeline-service.generic-application-history.enabledtrueyarn.timeline-service.enabledtrueyarn.timeline-service.ttl-enabletrueyarn.resourcemanager.system-me

hadoop - cluster.getJob 在 hadoop 中返回 null

publicvoidsetup(Contextcontext)throwsIOException,InterruptedException{Configurationconf=context.getConfiguration();org.apache.hadoop.mapreduce.Clustercluster=neworg.apache.hadoop.mapreduce.Cluster(conf);JobcurrentJob=cluster.getJob(context.getJobID());mapperCounter=currentJob.getCounters().findC

Hadoop CDH。文件只能复制到 0 个节点而不是 minReplication (=1)

我对72台机器的集群有疑问。其中60个是热存储,12个是冷存储。当我尝试将数据放入COLDHive表时,有时出现错误:Causedby:org.apache.hadoop.hive.ql.metadata.HiveException:org.apache.hadoop.ipc.RemoteException(java.io.IOException):File/user/hive/warehouse/test.db/rawlogs/dt=2016-01-31/.hive-staging_hive_2016-06-29_12-54-09_949_6553181118480369018-1/

hadoop - Oozie Job(Cloudera VM)在抛出错误时执行 shell 脚本——错误=2,没有这样的文件或目录

我在尝试执行shell脚本时出现以下错误。如果我在这里做错了,请告诉我。我已将所有文件复制到Hdfs中。Oozie文件夹包含脚本文件夹,我在该文件夹中有sample.sh。Cannotrunprogram"sample.sh"(indirectory"/var/lib/hadoop-yarn/cache/yarn/nm-local-dir/usercache/cloudera/appcache/application_1468541187565_0011/container_1468541187565_0011_01_000002"):error=2,Nosuchfileordirec

windows - 在 yarn cluster (linux) : Error no sheme for Filesystem "C" 上从客户端 (windows) 执行 spark

我想将一个spark应用程序(只是一个简单的HelloWorld应用程序)部署到我的hadoop集群。在我的Windows机器上使用spark提交,我使用--masteryarn在客户端模式下执行应用程序。连接到hadoop集群是成功的,在集群上的日志文件中可以看到。(hadoopconf文件已经从集群下载下来,保存在客户端windows机器上,环境变量已经设置好)。使用hadoop2.7和spark1.6这是使用的spark-submit命令:>spark-submit--masteryarn--class"SimpleApp"..\..\SimpleApp\target\scala

hadoop - 在启用 kerberos 的 CDH 集群中添加 Hbase 服务

我有一个CDH集群已经在使用kerberos身份验证运行。我需要将HBase服务添加到正在运行的集群。自启用kerberos以来,正在寻找启用hbase服务的文档。欢迎使用命令行和GUI选项。还有,如果有像这样的小建表步骤那样的测试方法就好了。提前致谢! 最佳答案 如果您通过ClouderaManager-AddService向导添加它,CDH会自动处理(创建/分发Kerberoskey表并添加服务) 关于hadoop-在启用kerberos的CDH集群中添加Hbase服务,我们在Sta

hadoop - Spark-SQL 在 yarn-cluster 上的错误 hdfs 权限

我有一个简单的工作,就是通过sparksql在hdfs中读取hive。我首先在yarn-client模式下运行它,我没有遇到任何问题。几次之后,我开始通过yarn-cluster模式启动它,但我遇到了这个问题:我有这个hdfs权限错误:Causedby:MetaException(message:org.apache.hadoop.security.AccessControlException:Permissiondenied:user=yarn,access=EXECUTE,inode="/Projects/SNB/directory/Private/table/table_ORC"