vm-cdh-cluster

java - 如何使用hadoop api在vm上运行的hadoop机器上创建目录

我有一个创建目录的java客户端程序，但是当在我的本地机器上执行它创建目录的程序时，即使我已经将fs.defaultFS配置为与core-site.xml匹配的vmurl。这里是创建目录的示例程序。importjava.io.IOException;importorg.apache.hadoop.conf.Configuration;importorg.apache.hadoop.fs.FileSystem;importorg.apache.hadoop.fs.Path;publicclassMkdir{publicstaticvoidmain(Stringar[])throwsIOE

hadoop - 在支持 64 位架构的 Windows 32 中安装 Cloudera VM

我有一个32位Windows操作系统。但是我的系统支持64位架构，我可以这么说，因为当我从VMware网站下载并运行VMWare处理器检查64位兼容性工具时，它显示“此主机能够在此VMWare产品下运行64位guest操作系统”'.那么，使用这个64位架构，我是否能够安装和使用ClouderaVM，然后安装和使用hadoop？最佳答案根据评论，您可以继续使用64位，没有任何问题，hadoop将启动并运行。但是，您始终可以返回并下载32位并导入您的VMWare，然后同时导入64位和32位。如果万一您遇到64位的任何问题，那么您可以

中安 Cloudera section 64 VMWare hadoop

hadoop - Spark : yarn cluster mode can't read hdfs path (No such file or directory)

我在yarn模式下使用spark提交，但我收到了这个错误:显然我的输入路径hdfs://缺少一个'/'我正在通过hdfs://master:8020/usr/jimmy/Test/，但是日志输出是日志文件中的hdfs:/master:8020/usr/jimmy/Test/Personal1(Personal1在我的代码中指定)缺少的'/'显然是问题所在我能做什么？请帮帮我我的命令:./bin/spark-submit--masteryarn-cluster--classMovie.Movies/usr/jimmy/Move.jarhdfs://master:8020/usr/jimm

directory cluster code hdfs master hadoop apache-spark

hadoop - Cloudera CDH 无法为 tez-ui 启动 yarn timeline server

当我通过在ClouderaManager高级配置选项中将配置添加到yarn-site.xml来启用yarn时间服务器时:yarn.timeline-service.hostnameyarn-hostnameyarn.timeline-service.enabledtrueyarn.timeline-service.generic-application-history.enabledtrueyarn.timeline-service.enabledtrueyarn.timeline-service.ttl-enabletrueyarn.resourcemanager.system-me

Cloudera timeline lt gt property hadoop hadoop-yarn cloudera-cdh apache-tez

hadoop - cluster.getJob 在 hadoop 中返回 null

publicvoidsetup(Contextcontext)throwsIOException,InterruptedException{Configurationconf=context.getConfiguration();org.apache.hadoop.mapreduce.Clustercluster=neworg.apache.hadoop.mapreduce.Cluster(conf);JobcurrentJob=cluster.getJob(context.getJobID());mapperCounter=currentJob.getCounters().findC

hadoop cluster section

Hadoop CDH。文件只能复制到 0 个节点而不是 minReplication (=1)

我对72台机器的集群有疑问。其中60个是热存储，12个是冷存储。当我尝试将数据放入COLDHive表时，有时出现错误:Causedby:org.apache.hadoop.hive.ql.metadata.HiveException:org.apache.hadoop.ipc.RemoteException(java.io.IOException):File/user/hive/warehouse/test.db/rawlogs/dt=2016-01-31/.hive-staging_hive_2016-06-29_12-54-09_949_6553181118480369018-1/

minReplication Hadoop section stackoverflow noreferrer hive hdfs cloudera-cdh

hadoop - Oozie Job(Cloudera VM)在抛出错误时执行 shell 脚本——错误=2，没有这样的文件或目录

我在尝试执行shell脚本时出现以下错误。如果我在这里做错了，请告诉我。我已将所有文件复制到Hdfs中。Oozie文件夹包含脚本文件夹，我在该文件夹中有sample.sh。Cannotrunprogram"sample.sh"(indirectory"/var/lib/hadoop-yarn/cache/yarn/nm-local-dir/usercache/cloudera/appcache/application_1468541187565_0011/container_1468541187565_0011_01_000002"):error=2,Nosuchfileordirec

mdash Cloudera gt lt 34 hadoop oozie cloudera-cdh

windows - 在 yarn cluster (linux) : Error no sheme for Filesystem "C" 上从客户端 (windows) 执行 spark

我想将一个spark应用程序(只是一个简单的HelloWorld应用程序)部署到我的hadoop集群。在我的Windows机器上使用spark提交，我使用--masteryarn在客户端模式下执行应用程序。连接到hadoop集群是成功的，在集群上的日志文件中可以看到。(hadoopconf文件已经从集群下载下来，保存在客户端windows机器上，环境变量已经设置好)。使用hadoop2.7和spark1.6这是使用的spark-submit命令:>spark-submit--masteryarn--class"SimpleApp"..\..\SimpleApp\target\scala

windows Filesystem sensored 10 INFO hadoop apache-spark client hadoop-yarn

hadoop - 在启用 kerberos 的 CDH 集群中添加 Hbase 服务

我有一个CDH集群已经在使用kerberos身份验证运行。我需要将HBase服务添加到正在运行的集群。自启用kerberos以来，正在寻找启用hbase服务的文档。欢迎使用命令行和GUI选项。还有，如果有像这样的小建表步骤那样的测试方法就好了。提前致谢! 最佳答案如果您通过ClouderaManager-AddService向导添加它，CDH会自动处理(创建/分发Kerberoskey表并添加服务) 关于hadoop-在启用kerberos的CDH集群中添加Hbase服务，我们在Sta

kerberos hadoop section stackoverflow cloudera cloudera-cdh

hadoop - Spark-SQL 在 yarn-cluster 上的错误 hdfs 权限

我有一个简单的工作，就是通过sparksql在hdfs中读取hive。我首先在yarn-client模式下运行它，我没有遇到任何问题。几次之后，我开始通过yarn-cluster模式启动它，但我遇到了这个问题:我有这个hdfs权限错误:Causedby:MetaException(message:org.apache.hadoop.security.AccessControlException:Permissiondenied:user=yarn,access=EXECUTE,inode="/Projects/SNB/directory/Private/table/table_ORC"

yarn-cluster Spark-SQL apache hadoop java apache-spark hive hdfs apache-spark-sql

72 73 747576 77 78