有没有一种简单的方法可以在插入发生后重新计算一些值?我有一个包含多个列族的表,其中一个是统计列族。我想插入原始记录,而不是使用一些特定于HBase的工具来离线计算值-而不会阻止插入。假设我将一些文件放入hbase表中,并希望获得有关其中行数以及存储在那里的日期的信息。我一直在研究RegionObserver及其preGet方法。此解决方案有效,但恐怕它会阻止实际插入发生,直到计算完成。 最佳答案 使用postPut方法。可以看一下HBase的协处理器简介here 关于hadoop-在Hb
我正在通过hadoop多节点集群的importsv工具将1000万条记录加载到Hbase表中。现在这个任务需要5分钟。但我想知道如何提高它的性能。importtsv工具看起来根本不像使用缩减器。我想知道我是否可以强制它使用reducer,它可以提高性能或您认为可以提高性能的任何其他方式将不胜感激。谢谢。 最佳答案 使用HfileOutPutFormat、completeBulkLoadTool尝试Importtsv。 关于Hadoop/Hbase批量加载的性能提升,我们在StackOve
我对Hadoop生态系统有几个疑问。渴望很好地理解这些概念。Hive表在哪里存储数据?对于Datawarehouse,我们是否需要在Hive和Hbase表中拥有相同的数据。我们如何从Hbase插入、更新和读取数据。HDFS可以存储除csv之外的所有文件格式。我们可以在Hbase上安装PIG吗?如果我有Hive,我可以省略Hbase表吗? 最佳答案 答案,按顺序:Hive通常将数据存储在其配置的文件系统目录下的表名目录中,通常是/user/hive/warehouse的HDFS目录,可通过hive-site.xml进行调整hive.m
我知道Sqoop允许我们将数据从RDBMS导入HDFS。我想知道sqoop中的sqlserverconnector是否也允许我们直接将其导入到HBase中?我知道我们可以用mysql做到这一点。我想知道是否也可以用sqlserver做同样的事情 最佳答案 我在Hortonworks沙箱中工作,我能够通过执行以下步骤将数据从SQLServer实例提取到HBase表中:将SQLServerJDBC驱动程序安装到Hadoop机器上。curl-L'http://download.microsoft.com/download/0/2/A/02
如果可能的话,我想在Hbase中从独立模式迁移到完全分布式模式。我有一些独立模式的数据,我想在迁移期间保留这些数据。请帮忙。 最佳答案 很老的问题,但最近我遇到了同样的问题并使用以下步骤解决了它:在独立模式下要迁移的导出表:bin/hbaseorg.apache.hadoop.hbase.mapreduce.Driverexporttable_name/local/path/table_name_backup在伪分布式/分布式模式下使用hadoop在hdfs中复制表:./bin/hadoopfs-copyFromLocal/loca
我在机器A上以伪分布式的方式搭建了Hadoop和Hbase。我正在从机器B运行我的客户端(Java程序)。(机器A和B可以相互通信)。但我在这样做时遇到了问题。我的客户端代码如下所示:配置config=HBaseConfiguration.create();config.set("hbase.zookeeper.quorum",zookeeperLocation);config.set("hbase.zookeeper.property.clientPort","2181");HtablePooltablePool=newHTablePool(config,Integer.MAX_VA
在hbaseshell中,我使用describe'table_name',只有column_family返回。我怎样才能知道每个列族中的所有列? 最佳答案 正如@zsxwing所说,您需要扫描所有行,因为在HBase中,每一行都可以有一个完全不同的模式(这是Hadoop强大功能的一部分——存储多结构数据的能力)。你可以看到HFilefilestructure并看到HBase不跟踪列因此,列族及其(它们的)设置实际上是HBase表的模式,这就是您“描述”它时得到的结果 关于hadoop-我
关闭。这个问题需要detailsorclarity.它目前不接受答案。想改进这个问题吗?通过editingthispost添加细节并澄清问题.关闭8年前。Improvethisquestion我是HBase的新手,必须使用复合键作为行键。请告诉我以及如何使用该复合键扫描或(获取)一些记录?(在R.K的第1和第2部分以及其他部分)。(例如Rowkey:在tom上扫描)编辑:行键是字节数组(这在问题中同样重要)
Hadoop2.2.0和HBase0.98.0-hadoop2兼容吗?编辑:http://hbase.apache.org/book/configuration.html已经阅读。 最佳答案 不,它们不兼容。阅读this发布。 关于hadoop-兼容性hbase和hadoop,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/23802710/
简介对thisquestion的后续问题.HBase已经连接到HDFS。是否可以向HBase提供一个文件,该文件随后使用命令存储在HDFS中。根据thisdocumentation有几个HBaseshell命令。然而,这些命令仅限于例如创建、删除表。问题需要发出哪个命令来向HBase提供一个文件,该文件随后将存储在HDFS中? 最佳答案 问题不明确。HBase是一个键值存储。要将数据放入HBase,您必须首先创建一个具有模式的表(实际上,只是一个列族列表)。创建表后,就可以向表中加载数据;HBase命令是“put”。引用HBase书