草庐IT

hadoop-mapreduce

全部标签

macos - Hadoop:在 OS-X 上安装 native 库

开始使用Hadoop并尝试将其安装到我的机器上。使用brew安装后,我无法运行它的native命令,如hadoopfs-ls。Hadoop版本:2.6.0操作系统:OSX优胜美地 最佳答案 你应该像这样运行命令:hadoopfs-ls/这实际上指向HDFS中的根文件夹并显示其中的文件。喜欢:找到1个项目drwxr-xr-x-hadoopsuper组02016-06-1900:53/user试试这个。 关于macos-Hadoop:在OS-X上安装native库,我们在StackOverf

java - MapReduce 权限 0700 错误

在Eclipseluna中运行mapreducejar文件时出现错误。我已经使用Cygwin设置了我的HBASE和HADOOP。这是来自Eclipse控制台的错误消息:15/03/2316:02:01INFOmapreduce.TableOutputFormat:CreatedtableinstanceforTWEETS_TIMEWISE15/03/2316:02:03INFOmapred.JobClient:Runningjob:job_201503231018_000915/03/2316:02:04INFOmapred.JobClient:map0%reduce0%15/03/2

hadoop - Oracle Sqoop 检索到 0 条记录

我在OracleXE11g中有一个表SQL>createtablebloblkup(2idNUMBERPRIMARYKEY,3namevarchar(28)NOTNULL,4fdataBLOB5);Tablecreated.SQL>descbloblkupNameNull?Type-----------------------------------------------------------------------------IDNOTNULLNUMBERNAMENOTNULLVARCHAR2(28)FDATABLOB充满了SQL>select*frombloblkup;IDNA

hadoop - java.lang.NoClassDefFoundError : org/apache/accumulo/core/client/Instance 错误

我正在使用小程序将数据写入Accumulo。程序在手动添加jars时运行。但是,当使用Maven构建时,使用手册中使用的相同版本会抛出:java.lang.NoClassDefFoundError:org/apache/accumulo/core/client/Instance.我该如何解决? 最佳答案 您的作业将在MR网络中的所有节点上运行。您需要在所有节点上安装适当的jar才能使其正常工作。正如您所注意到的,另一种方法是将所有内容都包含到一个uberjar中,其中包含您需要的所有内容。这样当你的工作被运送到每个节点时,你将拥有你

hadoop - 拆分 Pig 元组

我想使用pig脚本将以下元组拆分为两个元组。(key=bb7bde5661923b947ce59958773e85c5\,\/css\/bootstrap.min.cssHTTP\/1.1\,\/con-us.php,\/con-us.phpHTTP\/1.1\)我想要的输出如下:(key=bb7bde5661923b947ce59958773e85c5\)(\/css\/bootstrap.min.cssHTTP\/1.1\,\/con-us.php,\/con-us.phpHTTP\/1.1\) 最佳答案 是的,您可以使用REG

hadoop - 添加 phoenix-4.3.0-server.jar 后 region server 在 cloudera 中失败

我在cloudera的/opt/cloudera/parcels/CDH/lib/hbase/lib中添加了phoenix-4.3.0-server.jar。当我尝试启动服务器(区域和主服务器)时,只有主服务器启动。区域服务器有时会暂时启动并立即关闭。这适用于以前版本的phoenix(4.0.0-incubating)。请帮我解决这个问题。 最佳答案 从4.0.0升级到4.3.0失败的原因是兼容性。由于某种原因,4.3.0不兼容从旧版本的phoenix升级。因此,从4.0.0升级到4.1.0,重新启动HBase服务器,然后通过重新启

java - 一个 Mapper 类 Hadoop 中的多个输入文件?

所以,我正在尝试在MapReduce范例中编写FP-Tree算法,对于创建频繁项集列表,我有以下问题:输入:File1.txt(包含所有交易)1234522211245769877776123354[EachLinecontainsitemsBoughtinoneTransaction]File2.txt(包含按降序购买的元素)1212362215774354[Count][ItemId]输出:output.txt12322112377354[2ndtransactioniseliminated]根据计数的项目被采纳(降序),其他被删除是否可以将File1.txt和File2.txt都

maven - 在 Windows 8 上构建 Hadoop 2.6 时出错

我正在按照教程构建和安装hadoop。http://www.srccodes.com/p/article/38/build-install-configure-run-apache-hadoop-2.2.0-microsoft-windows-os但是,当我在VS2010命令提示符下输入以下命令时:mvnpackage-Pdist,native-win-DskipTests-Dtar我收到以下错误:main:[mkdir]SkippingC:\hdfs\hadoop-hdfs-project\hadoop-hdfs\target\nativebecauseitalreadyexists

eclipse - java.lang.NoClassDefFoundError : org/apache/commons/logging/LogFactory in Hadoop 1. 2.1 Kmean算法

我尝试从http://codingwiththomas.blogspot.kr/2011/05/k-means-clustering-with-mapreduce.html但是有错误log4j:WARNErrorduringdefaultinitializationjava.lang.NoClassDefFoundError:org/apache/log4j/AppenderSkeletonatjava.lang.ClassLoader.findBootstrapClass(NativeMethod)atjava.lang.ClassLoader.findBootstrapClassO

apache - Hadoop 客户端无法连接到服务器

我设置了一个2节点Hadoop集群,运行start-df.sh和start-yarn.sh运行良好(即所有预期的服务都在运行,日志中没有错误)。但是,当我实际尝试运行一个应用程序时,有几个任务失败了:15/04/0115:27:53INFOmapreduce.Job:TaskId:attempt_1427894767376_0001_m_000008_2,Status:FAILED我检查了yarn和datanode日志,但那里没有任何报告。在userlogs中,slave节点上的syslogs文件都包含如下错误信息:2015-04-0115:27:21,077INFO[main]org