hbase-parameter-tuning

scala - 带 Spark 的独立 HBase，HBaseTest.scala 出错

您好，我正在使用独立的hbase，我想在上面测试spark。我的机器上没有hadoop。当我尝试使用HBaseTest.scala获取表的计数时(在scala示例中)我收到以下错误:ERRORTableInputFormat:java.io.IOException:java.lang.reflect.InvocationTargetExceptionatorg.apache.hadoop.hbase.client.HConnectionManager.createConnection(HConnectionManager.java:416)atorg.apache.hadoop.hba

eclipse - 无法从 windows eclipse 创建 Hbase 表

我正在尝试从Windows中安装的eclipse创建Hbase表。我有cloudera虚拟机运行。我在Windows主机文件和虚拟机主机文件中有ip“192.168.1.5”。请提出建议。我已经包含了所有的hbasejar文件。你能指导我如何将eclipse连接到clouderavm吗？该作业没有抛出任何错误，但运行了很长时间。packagehbase;importjava.io.IOException;importorg.apache.hadoop.conf.Configuration;importorg.apache.hadoop.hbase.HBaseConfiguration;

eclipse windows hbase apache hadoop hive cloudera

hadoop - 尽管我添加了 NoColumnFamily，但 HBase 行写入失败

这可能是一个标准的异步操作问题。通过HBaseAdmin.addColumnFamily添加列族是异步的。现在我需要在添加此columnFamily之后添加行，这会引发NoColumnFamily错误。除了检查columnFamily是否存在之外，我如何推迟添加行直到添加columnFamily。最佳答案如果要添加列族。您将需要:1.禁用表2.添加列族3.启用表。只有您才能将数据写入该列族。完成上述3个步骤后，就可以确定该列族是否存在了。关于hadoop-尽管我添加了NoColum

NoColumnFamily 尽管 section columnFamily apache hadoop hbase

hadoop - Exasol 与 HBase

我对大数据架构还很陌生，所以请不要对我太苛刻。我正在尝试找出构建能够处理大量数据的BI架构的最佳替代方案。正如我所看到的，解决方案必须是集群/水平可扩展的，以应对系统的增长。我希望能够使用SQL与系统进行交互，因此HBase+Hive(或者甚至是Pig，不是用于sql但不需要手动编写MR任务)可能是一个解决方案。与例如Exasolution及其In-Memory-MPP-Columnar解决方案相比，这种架构的优点/缺点是什么。还有其他可能有一些额外好处的选择吗？维护和配置呢？任何Microsoft解决方案(我可能会发现与此相关的客户特定需求)很抱歉发布这样一个悬而未决的问题，但我希望

hadoop Exasol strong section 的 hbase business-intelligence exasolution

json - 使用 Pig 脚本将 Json 导入 Hbase

我正在尝试编写一个允许我加载Json的pig脚本(从Elasticsearch中获取并转储到hdfs)。我已经为此苦苦挣扎了好几天，也许有人可以让我对我遇到的问题有一些了解。这是我写的一个快速pig脚本，用于从hbase读取任意修改数据，然后存储回hbase(只是为了确保一切正常)REGISTERhbase-common-1.1.1.jarREGISTER/tmp/udfs/json-simple-1.1.1.jarREGISTER/tmp/udfs/elephant-bird-hadoop-compat-4.9.jarREGISTER/tmp/udfs/elephant-bird-p

Hbase json hadoop MRAppMaster apache apache-pig

hadoop - 来自 HBase 查询的 Hbase 表

我们是否可以创建一个Hbase表作为hbase查询的输出？假设我有一个巨大的hbase表，然后我使用过滤器查询hbase表。我想将结果存储回Hbase表中。可能吗？最佳答案您可以拍摄正在运行的Hbase表的快照并将其导出到HDFS。编写Mapreduce以根据需要在文件中获取数据，然后将数据批量加载到新的Hbase表中。您也可以直接将数据写入Hbase表。这样，在Snapshot上运行MapReduce也不会影响实际的Hbase表。这就是您可以执行下面提到的所有步骤的方法创建快照snapshot'HbaseTable','Hba

hadoop HBase section mapreduce hdfs

java - Hbase ResultScanner.next() 第一次响应需要很长时间

我是Hbase的新手，我的以下问题可能看起来很愚蠢!我提前道歉:)我们有一个用例，我们需要在Hbase中存储一些大数据，每行将近30MB，我们将其存储在6列中，每列5MB，一些元数据的2列都在一个列族中。我们有两种类型的数据，我们使用Hbase作为一些大队列!我们在Hbase中创建了两个表，分别命名为TableA和TableB。我们必须插入数据(来自A或B类型)，我们有一个pull函数，它应该获取一行(A或B类型)，返回它并从表中删除它。我们有三个具有4GBRAM和足够存储空间的集群节点。对于这项工作，在Java中，我制作了一个ResultScanner，获取第一行的键，然后使用Get

长时 ResultScanner code section scanner java hadoop hbase bigdata

hadoop - 我应该使用 PIG 从 HIVE 将数据加载到 HBase 还是有更好的方法？

我必须将数据从HIVE加载到HBase表中。我知道有多种方法可以做到这一点，例如:从HIVE生成CSV，然后使用批量加载将其转换为HFile以加载数据使用MapReduce生成HFile使用PIG脚本生成并加载HFile或者是否有可用的直接转换器？您能否通过推荐最佳方法来指导我？我们没有在这个用例中使用phoenix。最佳答案您可以使用HBASEintegration:CREATETABLEhbase_table_1(keyint,valuestring)STOREDBY'org.apache.hadoop.hive.hbase

hadoop HBase section 34 mapreduce hive apache-pig

hadoop - 无法从 hive 加载 hbase 表中的数据

我使用的是hadoop版本2.7.0，hive版本1.1.0，HBase版本hbase-0.98.14-hadoop2。我已经成功地从hive创建了一个hbase表。hive(Koushik)>CREATETABLEhive_hbase_emp_test(eidint,enamestring,esaldouble)>STOREDBY'org.apache.hadoop.hive.hbase.HBaseStorageHandler'>WITHSERDEPROPERTIES>("hbase.columns.mapping"=":key,cfstr:enm,cfsal:esl")>TBLPR

hadoop hbase jar java hive

database - HDFS vs NoSQL (HBASE)，它是如何工作的？

我(几乎)浏览了谷歌上的所有资源，但没有得到有关Hadoop和NoSQL的信息。假设我有很多数据要存储。我使用Hadoop和它的原生高清文件系统，但我也想获得实时信息，所以我需要NoSQL。我的数据库将安装在哪里？在数据节点本身？在名称节点上？两者？让我们(再一次)想象一下，我的系统中有数据，namenode将把它分成几部分并将它们复制到不同的datanode上。使用NoSQL，它会以同样的方式工作吗？HDFS是否参与此过程？存储在NameNode中的元数据给出了地址，那么如何查询呢？我想我基本上理解了Hadoop和HBase的概念，但是当我进一步深入时，我就误解了..

database HBASE strong NoSQL Hadoop bigdata

143 144 145146147 148 149