草庐IT

SITE_NAME

全部标签

java - mapred-site.xml 未覆盖 mapred-default.xml 中的参数

我正在使用Hadoop版本0.20.2(Cloudera发行版cdh3u6)并发现问题。据我了解,如果我在/etc/hadoop/conf/mapred-site.xml中设置一个值,它应该自动覆盖Hadoop默认值。所以我设置了一个变量如下:mapred.child.java.opts-Xmx1024m但是,这没有任何效果。现在,我知道hadoop正在读取该文件,因为如果我将变量设置为final(true),则该设置确实适用于我的工作。但是,据我了解,这不是必需的,因为mapred-site.xml应该在mapred-default.xml之后加载所以它应该简单地覆盖它。您可能会问,

hadoop - 如何覆盖 mapred-site.xml 中的 mapred.local.dir?

我没有对mapred-site.xml中mapred.local.dir指定的目录的写入权限(也没有对mapred-site.xml的写入权限)有没有一种方法可以在每个session基础上覆盖此属性用于我的Hive作业? 最佳答案 您可以尝试通过执行以下查询在Hivesession中设置它:setmapred.local.dir='somedir';这应该有效。另一种选择是更改Hive引用的mapred-site.xml。确保配置未标记为最终配置。在这种情况下,它不能被覆盖。 关于had

java - 配置pentaho的hdfs-vfs来获取hdfs-site.xml

我刚开始使用Pentaho'sHDFSVFS并且对这个项目了解不多。我正在尝试从外部位置读取我的Hadoop配置文件。这似乎适用于除hdfs-site.xml之外的所有文件.尝试通过PentahoHDFSVFS项目与HDFS通信时,故障发生在VFS层。我的直觉告诉我pentaho正在通过一些环境变量或其他外部指针读取这个文件,但我似乎无法在他们的源代码中找到它。当我手动将hdfs-site.xml文件放入已编译的war时一切正常文件,但这对我来说不够,因为我需要将此文件放在外部位置,以便其他进程可以更改它。有没有人处理过这个问题?有人可以让我知道如何告诉pentaho从哪里获取这个文件

hadoop - Fi-Ware 宇宙 : Name node is in safe mode

我正在尝试删除我的Cosmos帐户中的一个文件夹,但我得到了SafeModeException:#hadoopfs-rmr/home//inputrmr:org.apache.hadoop.hdfs.server.namenode.SafeModeException:Cannotdelete/user//input.Namenodeisinsafemode 最佳答案 在启动期间,Namenode从fsimage加载文件系统状态并编辑日志文件。然后它等待数据节点报告它们的block,这样它就不会过早地开始复制block,尽管集群中已经

hadoop - 如果没有在hdfs-site.xml中定义,namenode和datanode安装在哪里?

我的hdfs-site.xml只有以下内容:dfs.replication1问题。NameNode和DataNode安装在哪里?我在装有Windows10的MSFTSurface笔记本电脑上使用Hadoop3.0.3版本。 最佳答案 在hdfs-default.xmldfs.datanode.data.dir默认值为file://${hadoop.tmp.dir}/dfs/data和dfs.namenode.name。目录file://${hadoop.tmp.dir}/dfs/name并且在core-default.xmlhado

hadoop - Cloudera CDH4 : Can't add a host to my cluster because canonical name is not consistent with hostname

我正在使用Ubuntu12.04LTS在4节点集群上安装CDH4。我能够安装cloudera管理器并在主机上启动单节点集群。但是,一旦我添加了一个新主机,CM就会说它运行状况不佳并抛出以下错误:“从Java进程检查时,此主机的主机名和规范名称不一致。”我修改了master和所有主机上的/etc/hosts的内容,以包含IP地址,后跟每台机器的FQDN。我是否还需要设置一个DNS服务器才能完成这项工作? 最佳答案 您不一定需要设置DNS服务器才能使其正常工作,但正向和反向DNS必须明确匹配Hadoop才能正常运行。Hadoop操作书有

hadoop - 编辑 yarn-site.xml 时需要重新加载 yarn 吗?

我已经在我的集群上编辑了yarn-site.xml。具体来说,我编辑了yarn.scheduler.minimum-allocation-mb设置。我是否需要以某种方式重新加载配置,或者重新启动资源管理器或其他东西才能生效,或者这些配置文件是否会自动监视和重新加载? 最佳答案 是的,你有。您还可以使用Ambari验证这一点。yarn-site.xml文件中的一项编辑会触发某些服务重新启动。YARN就是其中之一 关于hadoop-编辑yarn-site.xml时需要重新加载yarn吗?,我

java - Cassandra 错误 :Invalid method name "describe local ring"

我正在使用java在hadoop中开发一个项目。当我在本地集群上运行我的代码(jar)时它工作正常但是当我在亚马逊多集群上运行它时它会给出异常...我的mapreduce作业代码....job.setJarByClass(ReadActivityDriver.class);job.setMapperClass(ReadActivityLogMapper.class);job.setReducerClass(ReadActivityLogReducer.class);job.setMapOutputKeyClass(Text.class);job.setMapOutputValueCla

hadoop - Rack Awareness 和 Name node 的区别

我正在研究Hadoop,我怀疑Rackwareness和NameNode之间是否有区别。将Rackwareness和namenode保留在同一个盒子上 最佳答案 正如Aviral所说的那样,这个问题非常模糊。但只是为了您的理解而引用,Namenode:NameNode是HDFS文件系统的核心。它保留文件系统中所有文件的目录树,并跟踪文件数据在集群中的保存位置。它不存储这些文件本身的数据。客户端应用程序在希望定位文件或希望添加/复制/移动/删除文件时与NameNode通信。NameNode通过返回数据所在的相关DataNode服务器列

configuration - HBaseConfiguration 不读取我在 ${HBASE_HOME}/conf/hbase-site.xml 中设置的值

${HBASE_HOME}/conf/hbase-site.xml有下一个值:hbase.zookeeper.quorumhd1“hd1”主机名设置在“/etc/hosts”中,ping正常...使用这个简单的Java程序:importorg.apache.hadoop.conf.Configuration;importorg.apache.hadoop.hbase.HBaseConfiguration;publicclassTestConfigurator{/***@paramargs*/publicstaticvoidmain(String[]args){Configuration