hbase

python - 在 CDH3 上编写 HBase MapReduce 的最简单的非 Java 方法？

我已经为此工作了很长时间，我感到很疲惫；我希望来自SO社区的[显而易见的？]见解可能会让我的宠物项目重新开始，这样我就可以停止踢自己了。我正在使用ClouderaCDH3、HBase.89和Hadoop.20。我有一个Python/Django应用程序，它使用Thrift接口(interface)将数据写入单个HBase表，效果很好。现在我想将它映射/减少到更多的HBase表中。这里明显的答案是Dumbo或ApachePIG，但是对于Pig，我的版本尚不支持HBaseStorage适配器(Pig能够加载类和定义，但在“映射”步骤卡住，提示“输入拆分”；Pig邮件列表建议这在Pig0.8

MapReduce 编写 section HBase Pig python hadoop

exception - 帮助 : org. apache.hadoop.hbase.MasterNotRunningException 12.34.56.78:60000

我正在编写一个小型Java应用程序来连接到HBase节点。ZooKeeper连接成功，但是后来，我系统性的报如下错误(当然我已经更改了我的IP地址):org.apache.hadoop.hbase.MasterNotRunningException12.34.56.78:60000有谁知道发生了什么以及如何解决这个问题？谢谢! 最佳答案好的，解决了这个问题。在某人自杀之前...->问题是由中央maven存储库(当前为0.90.xx)中可用的HBase.jar版本与Cloudera的CDH3安装包(0.89.xx)使用的版本不匹配引

MasterNotRunningException exception section gt lt connection hadoop hbase

persistence - 具有 HBase 持久性的 ActiveMQ

是否可以使用HBase作为ActiveMQ的持久化数据库？有人做过类似的事情吗？最佳答案根据我在activemq主页上看到的http://activemq.apache.org/persistence.html在这个pdf(http://fusesource.com/docs/broker/5.0/persistence/persistence.pdf)中，应该可以使用通用的jdbc连接。关于persistence-具有HBase持久性的ActiveMQ，我们在StackOverf

persistence 持久 section noreferrer hadoop activemq hbase

hadoop - ETL关联HADOOP数据库Hbase？

HI谁能告诉我哪些是可以与Hbase一起使用的ETL工具，Hbase是hadoop的数据库？我的意思是说如何使用oracle数据库中的数据来提取数据并在Informatica和SSIS等工具中使用，是否有可用于Hbase的ETL工具？请帮助我。最佳答案看看PentahoDataIntegrationforHadoop. 关于hadoop-ETL关联HADOOP数据库Hbase？，我们在StackOverflow上找到一个类似的问题： https://sta

hadoop section Hbase etl

nosql - NoSQL 上的文件 I/O - 特别是 HBase - 是否推荐？或不？

我是NoSQL的新手，现在我正在尝试使用HBase用于文件存储。我会将文件以二进制形式存储在HBase中。我不需要任何统计数据，只需要文件存储。是否推荐？我担心I/O速度。我使用HBase作为存储的原因是我必须使用HDFS，但我无法在客户端计算机上构建Hadoop。因此，我试图找到一些库来帮助客户端连接到HDFS以获取文件。但是我找不到它，我只是选择了HBase而不是连接库。遇到这种情况，我该怎么办？最佳答案我不知道Hadoop，但MongoDB有GridFS，它专为分布式文件存储而设计，使您能够水平扩展、“免费”获得复制等。h

别是 nosql section HBase noreferrer hadoop hdfs

hadoop - Hbase Hadoop 集群.. java.io.IOException : java. lang.NoSuchMethodExceptio

我正在尝试设置一个在hadoop集群之上运行的hbase集群。两个集群都已启动并正在运行，但是当我尝试在Hbase客户端中创建表时..在日志中看到以下错误!!compute-0-11:是hadoop集群的名称节点。2012-03-1801:18:54,696WARNorg.apache.hadoop.hbase.util.FSUtils:Unabletocreateversionfileathdfs://compute-0-11:9000/hbase,retrying:java.io.IOException:java.lang.NoSuchMethodException:org.apa

NoSuchMethodExceptio java hadoop section hbase

hadoop - 在分布式 Hadoop 上设置 HBase 时出错，ZooKeeperServer 未运行

我正在尝试在Hadoop上设置HBase，并且一直在关注MichaelG.Noll提供的各种很棒的在线教程。和here.基本上一切都很好，我的Hdfs和MapRed在Web界面上运行良好，它显示我有2个节点(我的NameNode既是NameNode又是DataNode，但这只是为了测试目的)。当我开始安装HBase时，我遇到了问题，我遇到了很多不同的错误。最新的一个在我的从节点的日志文件上INFOorg.apache.zookeeper.server.NIOServerCnxn:Closedsocketconnectionforclient/10.2.xx.xx:43089(noses

时出 ZooKeeperServer section HBase noreferrer hadoop apache-zookeeper

hadoop - 如何使用 MAP-REDUCE java 程序将 HBASE 表加载到 HDFS

如何编写一个MAP-REDUCEjava程序来将任何表从HBASE加载到HDFS中？而不是使用下面的命令，我如何使用MAP-REDUCEjava程序编写一个TRANSFORMATION，它将从HBASE导出任何表并加载到HDFS??bin/hbaseorg.apache.hadoop.hbase.mapreduce.Driverexporthdfs://user/etc*** 最佳答案查看codeoftheExporthbase自带的函数关于hadoop-如何使用MAP-REDUCE

MAP-REDUCE hadoop code section hbase mapreduce hdfs

hadoop - 在hbase中写入数据

我在hbase中写入数据时遇到问题。我有4个区域服务器。当我写入数据并使用随secret钥时，数据写入任何区域，但它们在一个区域服务器中。一个服务器忙，三个服务器空闲.如何在所有区域服务器中写入正则性。最佳答案 HBase跨区域服务器对其表进行分区。见:HowHBasepartitionstableacrossregionservers?http://www.larsgeorge.com/2009/10/hbase-architecture-101-storage.html我不确定你的随secret钥应该有多随机或多远才能写入不同

hadoop hbase section stackoverflow

hadoop - HBase 中的 WAL 文件

在HBase中写入memstore数据之前会先写入WAL，但是当我检查我的系统时WAL文件不会在每次Put操作后立即更新，更新需要很长时间。需要设置什么参数吗？(WAL已启用) 最佳答案您知道更新WAL文件需要多长时间吗？您确定时间是写入时间还是在您检查WAL时，它已经移至旧日志。如果启用了WAL，则所有条目必须首先进入WAL，然后按照集群配置写入特定区域。我知道WAL文件被移动到.oldlogs相当快，即通过hbase.master.logcleaner.ttl设置在hbase-site.xml中定义的60秒。

hadoop HBase section strong WAL

101 102 103104105 106 107