草庐IT

hadoop - HBase completebulkload 返回异常

我正在尝试使用批量加载方法从文本文件(几GB)快速批量填充HBase表described在Hadoop文档中。我已经创建了一个HFile,现在我想将其推送到我的HBase表。当我使用这个命令时:hadoopjar/home/hxcaine/hadoop/lib/hbase.jarcompletebulkload/user/hxcaine/dbpopulate/output/cf1my_hbase_table作业开始,然后我得到这个异常:Exceptioninthread"main"java.lang.NoClassDefFoundError:com/google/common/util

hadoop - Hadoop 上的临时查询

我们在美国处理2400万家企业。我们现在在HDFS和Hadoop上使用Pig。我们希望加快调试的临时查询。例如。现在,从我们的5个服务器集群中的2400万个业务中提取一个业务需要几分钟。Hbase似乎是我发现的唯一可以完成这项工作的系统。Hive似乎没有这样做。这是我们的模式,目前在HDFS中存储为制表符分隔的纯文本文件。place_idnamevalue1TitleBambooGarden1TitleBambooGardenRestaurant1Phone425-555-5551Phone425-444-4441Address123BellevueWay2TitleBurgerKin

hadoop - 如何强制 HBase 在 HDFS 上运行?

我在native文件系统上使用HBase并创建了一些表。现在我配置了HDFS并希望HBase使用它。我启动了Namenode和Datanode,但找不到可以告诉HBase使用HDFS的设置。我认为它可能会在重启时获取HDFS,所以我这样做了(stop-hbase+start-hbase),但我仍然能够看到我之前在native文件系统上创建的表。如何让HBase使用HDFS? 最佳答案 在$HBASE_HOME/conf/hbase-site.xml中,hbase.rootdir定义了HBase所在的文件系统/目录。看:http://

hadoop - 在 hdfs 文件上运行 mapreduce 并将 reducer 结果存储在 hbase 表中的示例

有人可以为mapreduce和Hbase提供一个很好的示例链接吗?我的要求是在hdfs文件上运行mapreduce并将reducer输出存储到hbase表。映射器输入将是hdfs文件,输出将是Text,IntWritable键值对。Reducers输出将是Put对象,即添加reducerIterableIntWritable值并存储在hbase表中。 最佳答案 这是解决你问题的代码司机HBaseConfigurationconf=HBaseConfiguration.create();Jobjob=newJob(conf,"JOB_

hadoop - 试图了解 HBase

以下是我的问题:Hbase是否在其内部工作中使用Map/Reduce从Hadoop中提取数据?HBase能否与其他框架(如Amazondynamo)一起使用,或者它必须以Hadoop作为基础框架?Hbase好学吗?我可以练习的设置HBase实例的最佳方法是什么上? 最佳答案 当您尝试访问其中的单元格或行时,HBase不使用map/reduce。基本上,Hadoop存储数据以便它知道在哪里可以找到键(键按字典顺序存储)。您可以在thispost中查看详细信息拉尔斯·乔治。HBase确实支持map/reduce,因此您可以将其用作您创建

hadoop - HBase批量加载异常

我能够使用Java程序生成HFile,但每当我尝试将它们导入我的HBase表时,我都会收到附加错误。当我没有使用我的Java程序,而是使用completebulkload时,我遇到了同样的错误。如果有人能在这里帮助我,那将是一个很大的帮助。几天来我一直坚持这个问题,开始变得非常沮丧。亲切的问候,彼得扬异常:12/12/1417:46:23WARNmapreduce.LoadIncrementalHFiles:Skippingnon-directoryhdfs://localhost:9000/hadoopdir/user/data/output/hfiles/test/_SUCCESS

java - HBase:MiniDFSCluster.java 在某些环境中失败

我正在编写一些代码来访问HBase,我正在编写单元测试以创建一个MiniDFSCluster作为测试设置的一部分。(defntest-config[&options](let[testing-utility(HBaseTestingUtility.)](.startMiniClustertesting-utility1)(let[config(.getConfigurationtesting-utility)](if(not=optionsnil)(doseq[[keyvalue]options](.setconfigkeyvalue)))config)));;Forthosewhod

java - Hbase方案设计-最佳实践

我最近从rdbms切换到Hbase来处理数百万条记录。但是作为一个新手,我不确定设计Hbase方案的有效方法是什么。实际上,场景是我有文本文件,其中包含我必须读取并存储到Hbase中的成百上千和数百万条记录。因此,有两组文本文件(RawData文件、Label文件)相互链接,因为它们属于同一用户,对于这些文件,我制作了两个单独的表(RawData和Label),并将它们的信息存储在那里.所以RawData文件和RawData表看起来像这样:因此您可以在我的RawData表中看到我有行键,它实际上是文本文件的文件名(01-01-All-Data.txt)以及文本文件每一行的行号。列族只是

hadoop - Hbase 错误 java.lang.RuntimeException : Unable to run quorum server

我无法启动Hbase,每当我启动时,我只会在jps中获得Hmaster和Hregionserver。Hquorompeer不断丢失。我检查了日志,但出现以下错误:java.lang.RuntimeException:Unabletorunquorumserveratorg.apache.zookeeper.server.quorum.QuorumPeer.loadDataBase(QuorumPeer.java:454)atorg.apache.zookeeper.server.quorum.QuorumPeer.start(QuorumPeer.java:409)atorg.apac

java - 通过 Java 以编程方式设置 "hbase.server.keyvalue.maxsize"

我正在通过JavaSpringboot执行hbase操作。我遇到了错误“大小为10762275的单元格超出了10485760字节的限制”。我在某处了解到有关增加单元格大小的信息,即需要在hbase-site.xml中将“hbase.server.keyvalue.maxsize”设置为所需的大小才能解决此问题。我添加了此属性并解决了问题。但是我想通过我的Java代码添加此属性,因为我可能无法在生产中访问hbase-site.xml。我设置属性的Configuration方法是:publicConfigurationcreateHbaseConfiguration(){Configura