草庐IT

hadoop-mapreduce

全部标签

hadoop - 为什么匿名 FTP 到 HDFS DistCp 不起作用?

我尝试使用以下命令将FTP数据复制到HDFS,hadoopdistcpftp://ftp.ncdc.noaa.gov/pub/data/noaa/1901/data/noaa/1901/这是我收到的错误15/03/0411:29:13INFOtools.DistCp:InputOptions:DistCpOptions{atomicCommit=false,syncFolder=false,deleteMissing=false,ignoreFailures=false,maxMaps=20,sslConfigurationFile='null',copyStrategy='unifo

maven - Hadoop的版本和Hadoop-common的版本有什么关系?

我正在使用Maven构建一个Hadoop项目,并在http://search.maven.org/中搜索依赖项.Hadoop-common的结果只包括版本0.2x和2.x,版本1呢。×?这是searchlink.看来Hadoop的版本与其Hadoop-common的版本不对应。顺便说一下,DifferencesbetweenHadoop-common,Hadoop-coreandHadoop-client?那么如果我选择Hadoop1.2.1,我应该在.pom文件中为mavendecencies编写哪个版本?(或者,是否一定要写一个特定版本的Hadoop-Common和Hadoop-C

hadoop - Hadoop DB 的 ORM 支持

我正在尝试使用Hadoop和Spring(MVC、IOC、数据、安全性)引导应用程序。我想知道哪种ORM适合这些技术。 最佳答案 ApacheGora开源框架为大数据提供内存数据模型和持久性。Gora支持持久存储到列存储、键值存储、文档存储和RDBMS,并通过广泛的ApacheHadoop™MapReduce支持分析数据。-查看更多信息:http://gora.apache.org/#sthash.aHUqfiFl.dpuf 关于hadoop-HadoopDB的ORM支持,我们在Stac

hadoop - java.lang.IncompatibleClassChangeError : Found interface org. apache.hadoop.mapreduce.JobContext,但类是预期的安装示例

我正在运行来自http://giraph.apache.org/quick_start.html#qs_section_2的示例成功安装Giraph后,我创建文件/tmp/tiny_graph.txt并运行$HADOOP_HOME/bin/hadoopjar/usr/local/giraph/giraph-examples/target/giraph-examples-1.2.0-SNAPSHOT-for-hadoop-1.2.1-jar-with-dependencies.jarorg.apache.giraph.GiraphRunnerorg.apache.giraph.examp

hadoop - 通过 php 运行简单的 Hadoop 命令

当我运行通过php包装的简单hadoopls命令时,它没有执行。有什么建议吗?猫foo.php:#!/usr/bin/envphp当我运行它时没有任何反应:phpfoo.php 最佳答案 echoexec("hadoopfs-ls/");你需要告诉php对结果做些什么! 关于hadoop-通过php运行简单的Hadoop命令,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/2897

mongodb - 无法在 HDP 的 Hive 查询中使用 mongo-hadoop 连接器

我是hadoop的新手。我已经安装了hortonworks沙箱2.1。我正在尝试使用HiveUI执行Hive脚本。我想访问Hive中的mongo集合。我为此使用了以下查询:CREATETABLEindividuals(idINT,nameSTRING,ageINT,citySTRING,hobbySTRING)STOREDBY'com.mongodb.hadoop.hive.MongoStorageHandler'WITHSERDEPROPERTIES('mongo.columns.mapping'='{"id":"_id"}')TBLPROPERTIES('mongo.uri'='m

hadoop - Hbase 和 Phoenix 无法映射整数

我试图用phoenix映射一个hbase表,但结果表在具有整数值的列中给出空值。这是我的hbase表create'foo2',{NAME=>'cf',VERSIONS=>5},{NAME=>'cn'}put'foo2','1','cf:ID','1'put'foo2','1','cf:c1','a'put'foo2','1','cf:c2','b'put'foo2','1','cn:idFoo3',1put'foo2','2','cf:ID','2'put'foo2','2','cf:c1','c'put'foo2','2','cf:c2','d'put'foo2','2','cn:i

java - YARN hadoop错误java堆空间

我在hadoop2.6.0上使用YARN。当我运行mapreduce作业时,出现如下错误:15/03/1222:22:59INFOmapreduce.Job:TaskId:attempt_1426132548565_0003_m_000002_1,Status:FAILEDError:Javaheapspace15/03/1222:22:59INFOmapreduce.Job:TaskId:attempt_1426132548565_0003_m_000000_1,Status:FAILEDError:Javaheapspace15/03/1222:23:20INFOmapreduce

Hadoop MapReduce 全局计数器

我的应用程序中需要一个全局计数器。当所有reduce任务完成后,我必须打印全局计数器。我在Here中找到了解决方案.但是,我想知道在使用C++编写应用程序时是否可以将全局计数器与Hadoop流或管道一起使用。 最佳答案 您可以使用流进程的stderr输出。我发现了这个Jira问题:https://issues.apache.org/jira/browse/HADOOP-1328它有几个补丁,我想你可以在其中找到关于如何做全局计数器的内容。 关于HadoopMapReduce全局计数器,我

java - 在 mapreduce 作业中对单独的行应用 wordcount

我有一个像这样的输入文件LOWLOWHIGHLOWLOWLOWHIGHMODLOWLOWHIGHLOWHIGHHIGHHIGHLOWLOWLOWLOWLOW..........我希望得到如下结果:GenuineModerateNot_genuineGenuine..为此,我需要解析一行并在每一行上应用WordCount,然后基于编号。高或低的计数我会指定所需的结果。通过使用Stringtokenizer所有的行都被考虑在内并且split方法没有得到行的结尾(\n)。无论如何我可以继续解决这个问题并得到想要的答案为MAPPER完成的代码这是我尝试通过获取\n进行修改的映射器函数publi