草庐IT

ensure_dir_exists

全部标签

hadoop - AWS EMR S3DistCp : The auxService:mapreduce_shuffle does not exist

我通过SSH连接到AWSEMRv5.4.0实例,我想调用s3distcp。Thislink演示了如何设置一个emr步骤来调用它,但是当我运行它时出现以下错误:Containerlaunchfailedforcontainer_1492469375740_0001_01_000002:org.apache.hadoop.yarn.exceptions.InvalidAuxServiceException:TheauxService:mapreduce_shuffledoesnotexistatsun.reflect.NativeConstructorAccessorImpl.newIns

hadoop - [hdfs]如何为每个datanode配置不同的dfs.datanode.data.dir?

我使用ambari来设置hadoop集群。但是当我配置hdfs的配置时。我发现如果我修改dfs.datanode.data.dir,configure会在所有datanodes上生效...如何为每个数据节点配置不同的配置?比如机器A有两block磁盘,分别挂载到/data1、/data2但是机器B只有一个盘,挂载到/data1所以我想将机器A的dfs.datanode.data.dir配置为“/data1,/data2”。但只有机器B的“/data1” 最佳答案 不存在的HDFS目录将被忽略。都放进去,没关系。

mysql - auxService :mapreduce_shuffle does not exist

当我尝试运行以下命令时:#sqoopimport--connectjdbc:mysql://IPAddress/database--usernameroot--passwordPASSWORD--tabletable_name--m1从mysql数据库导入数据到HDFS,报错:TheauxService:mapreduce_shuffledoesnotexist.搜索并浏览了很多网站,没有任何帮助。如何解决这个问题?如果需要更多输入,请告诉我。 最佳答案 它是您在yarn-site.xml中丢失的一个条目。在名称节点和数据节点中应用

hadoop - 失败后hadoop namenode dirs是否同步?

在这种情况下会发生什么:Namenode正在写入两个不同驱动器上的两个目录,一个是本地的,另一个(远程)是mounted。现在,namenode失败了,我们在远程机器上启动namenode进程(它有原始namenode数据的副本,所以它是安全的)并更改所有datanodes上的namenode的ip。一段时间后,我们设法使原来的名称节点与之前的配置完全一致。我们停止远程机器上的名称节点进程。现在,本地fs.name.dir是否会与挂载的同步(我的意思是在挂载目录上累积的差异,而原始名称节点已关闭)还是名称节点数据一致性会出现问题? 最佳答案

hadoop - HDFS:FileSystem.exists(path) 在现有资源上返回 false?

我在本地运行的HadoopHDFS(我的工作站是名称/数据节点)中遇到文件访问困难。在我的HDFS中,我有一个位于文件夹"/huser/data.txt"中的文件我可以用hdfsdfs-ls/huser确认该文件存在。我通过调用FileSystem.get(uri,config)创建文件系统,uri是hdfs://localhost:9000如果我调用org.apache.hadoop.fs.FileSystem的exist方法,我总是得到一个false作为返回值。我尝试了各种参数组合,但我想知道我做错了什么:fs.exists(newPath("hdfs:/huser/data.tx

windows - 映射减少错误 : Failed to setup local dir

我在Windows8上安装的hadoop上运行mapreducewordcount示例。我收到如下错误。这听起来像是一个安全许可问题。但我不太确定。我在yarn-site.xml文件中添加了一个属性yarn.nodemanager.local-dirsc:\hadoop\tmp-nm任何想法都会很有帮助!15/07/1511:01:54INFOclient.RMProxy:ConnectingtoResourceManagerat/0.0.0.0:803215/07/1511:01:55WARNmapreduce.JobResourceUploader:Hadoopcommand-li

hadoop - Hive No files matching path file 和 file Exists

我在让hive工作时遇到了很多麻烦。我正在使用YARN运行CDH4.5,所有这些都是从Cloudera的yum存储库安装的。我按照他们的说明设置了配置单元,但出于某种原因,它无法识别我本地文件系统上的合法文件。[msknapp@localhostdata]$pwd/home/msknapp/data[msknapp@localhostdata]$ll|grepcounty_insurance_pp.txt-rw-rw-rw-1msknappmsknapp162537Jan514:58county_insurance_pp.txt[msknapp@localhostdata]$sudo-

hadoop - pig 错误 2118 : Input path does not exist

我正在运行简单的pig脚本,但它一直在抛出异常,说;org.apache.pig.backend.executionengine.ExecException:ERROR2118:输入路径不存在相信我路径是绝对正确的(根据我的理解),我尝试在本地文件系统和MapReduce模式下使用相同的数据,但没有区别。 最佳答案 我得到了解决,背后的原因是,关系名称和指定的路径/文件夹具有相同的名称,在这种情况下它不会迭代子文件夹或目录并产生这样的错误:) 关于hadoop-pig错误2118:Inp

hadoop - 我可以将 pig.temp.dir 设置为/user/USERNAME/tmp/pig 吗?

Hive可以配置为hive.exec.scratchdir=/user/${user.name}/tmp/hive我可以用Pig做类似的事情吗?我已尝试修改pig.properties文件,但似乎没有任何效果。pig.temp.dir=/user/${user.name}/tmp/pig我可以用别名替换pig命令,但我希望将更改写入配置文件。pig-Dpig.temp.dir=/user/`whoami`/tmp/pig谢谢!更新:我们决定将/tmp/用于生产系统。这是一个问题的原因是因为我们正在运行MapR,它似乎试图将临时目录放入用户目录,并在Hive上成功,但在Pig上却没有。

scala - yarn 上的 Spark 提交没有将 jar 分发到 nm-local-dir

1、版本Spark:2.0.0标度:2.11.8java:1.8.0_91hadoop:2.7.22、问题:当我在yarn上提交scala程序到spark时,它抛出一个异常:Causedby:java.lang.IllegalStateException:Librarydirectory'/opt/hadoop/tmp/nm-local-dir/usercache/hadoop/appcache/application_1471514504287_0021/container_1471514504287_0021_01_000002/assembly/target/scala-2.11