草庐IT

home_dir

全部标签

hadoop - 使用 HDFS 而不是 spark.local.dir

试图理解为什么Spark需要本地机器上的空间!有办法解决吗?我一直遇到“设备上没有剩余空间”。我知道我可以将“spark.local.dir”设置为以逗号分隔的列表,但有没有办法改用HDFS?我正在尝试合并两个巨大的数据集。在较小的数据集上,Spark是MapReduce的对手,但在我用这些巨大的数据集证明之前,我不能宣布胜利。我没有使用yarn。此外,我们的网关节点(又名边缘节点)不会有很多可用空间。有解决办法吗? 最佳答案 当groupByKey操作时,Spark只是写入tmpDir序列化分区。它是普通文件(请参阅Shuffle

ubuntu - 无法从 $HIVE_HOME 以外的任何其他位置启动配置单元

我已经使用Derby10.12.1.1安装了Hive2.1.0我可以从以下位置运行Hive:$HIVE_HOME但是当我从另一个位置运行时,比如root或其他地方,它会抛出一个错误:Exceptioninthread"main"java.lang.RuntimeException:Couldn'tcreatedirectory$/tmp/98e1866e-f8c7-451d-b958-1f773f0c4b02_resourcesatorg.apache.hadoop.hive.ql.util.ResourceDownloader.ensureDirectory(ResourceDown

maven - 需要将 flink-hadoop-compatibility-2.10 jar 显式复制到 EMR 集群上的 ${FLINK-HOME}/lib 位置

我目前正在开发一个Flink应用程序,该应用程序使用一些Hadoop依赖项将数据写入S3位置。在本地环境中它运行良好,但是当我在EMR集群上部署这个Flink应用程序时,它抛出了与兼容性问题相关的异常。我得到的错误信息是java.lang.RuntimeException:无法加载类“org.apache.hadoop.io.Writable”的TypeInformation。您可能缺少“flink-hadoop-compatibility”依赖项。在org.apache.flink.api.java.typeutils.TypeExtractor.createHadoopWritab

Hadoop Cygwin Windows 7 JAVA_HOME 路径未找到且命令未找到

我已经通过谷歌尝试了所有可能的解决方案,但仍然无法正常工作我没有从hadoop-env.sh和bin/java中得到这个命令未找到的错误,不是这样的目录,这里是hadoop-env.sh导出JAVA_HOME=/cygdrive/c/Java/jre6导出JAVA_HOME=c:/Java/jre6下面是我的错误-bash-4.1$bin/hadoopnamenode-format/usr/local/hadoop-1.2.1/libexec/../conf/hadoop-env.sh:第2行:$'\r':找不到命令/usr/local/hadoop-1.2.1/libexec/../

hadoop - [hdfs]如何为每个datanode配置不同的dfs.datanode.data.dir?

我使用ambari来设置hadoop集群。但是当我配置hdfs的配置时。我发现如果我修改dfs.datanode.data.dir,configure会在所有datanodes上生效...如何为每个数据节点配置不同的配置?比如机器A有两block磁盘,分别挂载到/data1、/data2但是机器B只有一个盘,挂载到/data1所以我想将机器A的dfs.datanode.data.dir配置为“/data1,/data2”。但只有机器B的“/data1” 最佳答案 不存在的HDFS目录将被忽略。都放进去,没关系。

java - Hadoop hdfs 显示 ls : `/home/hduser/input/' : No such file or directory error

我已经使用thistutorial在一台机器上安装了Hadoop2.6.我使用的是Ubuntu12.04机器和Java版本1.6.0_27。我已经为Hadoop操作创建了单独的用户hduser。我已经设置了HADOOP_HOME环境变量的值/usr/local/hadoop我已经提取了Hadoop分布。现在我正在关注example.但是当我执行命令时$HADOOP_HOME/bin/hdfsdfs-ls/home/hduser/input/它给出了以下错误-15/01/0218:32:38WARNutil.NativeCodeLoader:Unabletoloadnative-hado

hadoop - Cloudera CDH VM 默认 HADOOP_HOME 位置

ClouderaCDH4VM中的默认HADOOP_HOME位置是什么。echo$HADOOP_HOME返回空白。 最佳答案 /usr/lib/hadoop是CDH4中的默认HADOOP_HOME。关于弃用,HADOOP_PREFIX似乎是HADOOP_HOME的替代品:$HADOOP_HOMEisdeprecated我相信HADOOP_MAPRED_HOME仅用于mapreduce基础设施,如果您直接使用HDFS,那么您可能需要HADOOP_PREFIX。 关于hadoop-Cloude

macos - 在 Mac 上为 Hadoop 设置 JAVA_HOME

我在OSX10.7上为Hadoop正确设置JAVA_HOME时遇到问题这是我所做的:转到/usr/local/Cellar/hadoop/1.0.3/libexec/conf/hadoop-env.sh并更改JAVA_HOME表单,无论它在那里默认为exportJAVA_HOME=/Library/Java/Home/我对Java也很陌生,所以即使JAVA_HOME也可能是错误的。因此,通过转到hadoop的bin文件夹并运行此命令:hadoopjarhadoop-*-examples.jar这是我得到的讨厌的错误:Exceptioninthread"main"java.io.IOEx

HADOOP_HOME 和 hadoop 流

您好,我正在尝试在安装了hadoop的服务器上运行hadoop,但我不知道hadoop所在的目录。服务器由服务器管理员配置。为了加载hadoop,我使用dotkit包中的use命令。可能有几种解决方案,但想知道hadoop包安装在哪里,如何设置$HADOOP_HOME变量,以及如何批准运行hadoop流作业,例如$HADOOP_HOME/bin/hadoopjar$HADOOP_HOME/mapred/contrib/streaming/hadoop-streaming.jar,又名http://wiki.apache.org/hadoop/HadoopStreaming。谢谢!任何帮

configuration - HBaseConfiguration 不读取我在 ${HBASE_HOME}/conf/hbase-site.xml 中设置的值

${HBASE_HOME}/conf/hbase-site.xml有下一个值:hbase.zookeeper.quorumhd1“hd1”主机名设置在“/etc/hosts”中,ping正常...使用这个简单的Java程序:importorg.apache.hadoop.conf.Configuration;importorg.apache.hadoop.hbase.HBaseConfiguration;publicclassTestConfigurator{/***@paramargs*/publicstaticvoidmain(String[]args){Configuration