草庐IT

CONFIGURATION

全部标签

java - 将 hadoop 的 Configuration 转换为 Map<String, String>

如何转换hadoop的Configurationconf至Map?我有一个将Map作为参数的方法,我想将Configurationconf传递给它,那么如何在两者之间转换? 最佳答案 您可以使用Configuration提供的迭代器并构建map。Configurationconfiguration=newConfiguration();Mapmap=newHashMap();Iterator>iterator=configuration.iterator();while(iterator.hasNext()){Map.Entryen

xml - Hadoop单节点安装-格式化错误-Content is not allowed in prolog

我正在尝试进行hadoop单节点安装。我正在关注this有关hadoop安装说明的文章。我需要做的步骤之一是使用命令格式化hadoop文件系统hduser@dbserver:~/hadoop/conf$/home/hduser/hadoop/bin/hadoopnamenode-formathduser@dbserver:~/hadoop/conf$/home/hduser/hadoop/bin/hadoopnamenode-format12/02/0618:24:31INFOnamenode.NameNode:STARTUP_MSG:/************************

java - 将带有参数的文件传递给 mapreduce 作业

我有一个mapreduce映射器。这个Mapper应该使用一些只读参数集。假设我想计算输入行中某些子字符串(某物的标题)的出现次数。我确实有一个成对列表:“一些标题”=>“从输入行中提取此标题的正则表达式”。这些对存储在通常的文本文件中。将此文件传递给Mapper的最佳方式是什么?我只有这个想法:将成对的文件上传到hdfs。使用-Dpath.to.file.with.properties将路径传递给文件在映射器的静态{}部分读取文件并填充映射对“sometitle”=>“标题的常规表达式”。这是好事还是坏事?请告知 最佳答案 您已经

java.lang.UnsupportedOperationException : Not implemented by the DistributedFileSystem FileSystem implementation during FileSystem. 获取()

请查找随附的代码片段。我正在使用此代码将文件从hdfs下载到我的本地文件系统-Configurationconf=newConfiguration();FileSystemhdfsFileSystem=FileSystem.get(conf);Pathlocal=newPath(destinationPath);Pathhdfs=newPath(sourcePath);StringfileName=hdfs.getName();if(hdfsFileSystem.exists(hdfs)){hdfsFileSystem.copyToLocalFile(false,hdfs,local,

java - Hbase 批量加载附加数据而不是覆盖它们

实际上,我是在Mapreduce和Bulkload的帮助下将数据加载到Hbase中,这是我用Java实现的。所以基本上我创建了一个Mapper并使用HFileOutputFormat2.configureIncrementalLoad(问题末尾的完整代码)用于减少,我使用一个映射器,它只是从文件中读取一些字节并创建一个放置。使用LoadIncrementalHFiles.doBulkLoad写出来将数据写入Hbase。这一切都很好。但可以肯定的是,什么时候这样做会覆盖Hbase中的旧值。所以我正在寻找一种附加数据的方法,就像api的附加函数一样。感谢阅读,希望你们中的一些人有可以帮助我

java.lang.NoClassDefFoundError : com/google/common when trying to create a Configuration object 错误

我正在尝试从java中与我的HDFS进行交互。当我尝试创建一个新的Configuration对象时配置conf=newConfiguration();我的应用程序抛出这个错误Exceptioninthread"main"java.lang.NoClassDefFoundError:com/google/common/base/Preconditionsatorg.apache.hadoop.conf.Configuration$DeprecationDelta.(Configuration.java:306)atorg.apache.hadoop.conf.Configuration$

hadoop - 在 hadoop 中处理大文件时出现 Shuffle、merger 和 fetcher 错误

我正在运行一个类似mapreduce的字数统计作业,处理200个文件,每个文件大小为1Gb。我在一个hadoop集群上运行该作业,该集群包含4个数据节点(每个2cpu),内存为8Gb,空间约为200G。我尝试了各种配置选项,但每次我的工作失败时,都会出现InMemoryShuffle、OnDiskShuffle、InMemorymerger、OnDiskMerger或Fetcher错误。映射器输出的大小与输入文件的大小相当,因此,为了最小化映射器输出大小,我对mapreduce输出使用BZip2压缩。然而,即使使用压缩的map输出,我仍然会在reducer阶段遇到错误。我使用4个red

java - 运行 bin/hadoop namenode -format 时出现 fatal error

运行bin/hadoopnamenode-format时出现fatalerror使用Windows7操作系统,在C:\cygwin\usr\local\hadoop-0.20.203.0\conf下编辑hadoop-env.sh文件,#exportJAVA_HOME=C:/ProgramFiles/Java/jdk1.6.0_24exportJAVA_HOME=C:/jdk1.6.0_24.我将我的Java类路径设置为C:/jdk1.6.0_24。FatalError]hdfs-site.xml:5:2:Themarkupinthedocumentfollowingtherootele

linux - 安装和获取当前的 dfs.name.dir 和 dfs.data.dir 值

我没有在hdfs-site.xml文件中设置dfs.name.dir和dfs.data.dir值没有设置。他们会怎样?有趣的是,他们默认接受什么值?(如何接收他们的当前值?) 最佳答案 dfs.name.dir的默认值为${hadoop.tmp.dir}/dfs/data和dfs.data.dir是${hadoop.tmp.dir}/dfs/data。如果hadoop.tmp.dir的值未使用-D选项或配置文件设置,则默认值为/tmp/hadoop-${user.name}user.name是您用来登录系统的用户名。对于所有默认值,

java - 为什么 hadoop 不能识别我的 Map 类?

我正在尝试在hadoop2.2.0上运行我的PDFWordCountmap-reduce程序,但出现此错误:13/12/2523:37:26INFOmapreduce.Job:TaskId:attempt_1388041362368_0003_m_000009_2,Status:FAILEDError:java.lang.RuntimeException:java.lang.ClassNotFoundException:ClassPDFWordCount$MyMapnotfoundatorg.apache.hadoop.conf.Configuration.getClass(Confi