hbase-parameter-tuning

hadoop - 对HDFS、HBase和Hive的一些疑惑

我对Hadoop生态系统有几个疑问。渴望很好地理解这些概念。Hive表在哪里存储数据？对于Datawarehouse，我们是否需要在Hive和Hbase表中拥有相同的数据。我们如何从Hbase插入、更新和读取数据。HDFS可以存储除csv之外的所有文件格式。我们可以在Hbase上安装PIG吗？如果我有Hive，我可以省略Hbase表吗？最佳答案答案，按顺序:Hive通常将数据存储在其配置的文件系统目录下的表名目录中，通常是/user/hive/warehouse的HDFS目录，可通过hive-site.xml进行调整hive.m

hadoop HBase li section code hive hdfs

hadoop - Apache PIG : apply LIMIT only if parameter is > 0

如何在PIG中的foreach中实现以下目标:REL=foreachRELS{if(cnt==0)limited_result=NULL/Empty;elselimited_result=LIMITresultscnt;generatelimited_result.some_field;}我不能使用LIMIT，因为它会验证“cnt”是否大于0；我尝试使用SPLIT，但显然它在foreach中不受支持。最佳答案在FOREACH之前FILTER怎么样？REL=foreach(filterRELSbycnt>0){limited_re

parameter hadoop code limited_result section apache-pig

sql-server - 从sql server导入数据到hbase

我知道Sqoop允许我们将数据从RDBMS导入HDFS。我想知道sqoop中的sqlserverconnector是否也允许我们直接将其导入到HBase中？我知道我们可以用mysql做到这一点。我想知道是否也可以用sqlserver做同样的事情最佳答案我在Hortonworks沙箱中工作，我能够通过执行以下步骤将数据从SQLServer实例提取到HBase表中:将SQLServerJDBC驱动程序安装到Hadoop机器上。curl-L'http://download.microsoft.com/download/0/2/A/02

server sql-server sqoop section hadoop hbase

hadoop - Hbase:从独立模式迁移到全分布式模式

如果可能的话，我想在Hbase中从独立模式迁移到完全分布式模式。我有一些独立模式的数据，我想在迁移期间保留这些数据。请帮忙。最佳答案很老的问题，但最近我遇到了同样的问题并使用以下步骤解决了它:在独立模式下要迁移的导出表:bin/hbaseorg.apache.hadoop.hbase.mapreduce.Driverexporttable_name/local/path/table_name_backup在伪分布式/分布式模式下使用hadoop在hdfs中复制表:./bin/hadoopfs-copyFromLocal/loca

hadoop Hbase section table_name_backup

hadoop - 无法远程连接Hbase

我在机器A上以伪分布式的方式搭建了Hadoop和Hbase。我正在从机器B运行我的客户端(Java程序)。(机器A和B可以相互通信)。但我在这样做时遇到了问题。我的客户端代码如下所示:配置config=HBaseConfiguration.create();config.set("hbase.zookeeper.quorum",zookeeperLocation);config.set("hbase.zookeeper.property.clientPort","2181");HtablePooltablePool=newHTablePool(config,Integer.MAX_VA

hadoop Hbase section config tablePool

hadoop - 我怎样才能知道 hbase 表中的所有列？

在hbaseshell中，我使用describe'table_name'，只有column_family返回。我怎样才能知道每个列族中的所有列？最佳答案正如@zsxwing所说，您需要扫描所有行，因为在HBase中，每一行都可以有一个完全不同的模式(这是Hadoop强大功能的一部分——存储多结构数据的能力)。你可以看到HFilefilestructure并看到HBase不跟踪列因此，列族及其(它们的)设置实际上是HBase表的模式，这就是您“描述”它时得到的结果关于hadoop-我

hadoop hbase section stackoverflow

java - 扫描 HBase 中的复合键

关闭。这个问题需要detailsorclarity.它目前不接受答案。想改进这个问题吗？通过editingthispost添加细节并澄清问题.关闭8年前。Improvethisquestion我是HBase的新手，必须使用复合键作为行键。请告诉我以及如何使用该复合键扫描或(获取)一些记录？(在R.K的第1和第2部分以及其他部分)。(例如Rowkey:在tom上扫描)编辑:行键是字节数组(这在问题中同样重要)

HBase java section class notice hadoop nosql

hadoop - 兼容性 hbase 和 hadoop

Hadoop2.2.0和HBase0.98.0-hadoop2兼容吗？编辑:http://hbase.apache.org/book/configuration.html已经阅读。最佳答案不，它们不兼容。阅读this发布。关于hadoop-兼容性hbase和hadoop，我们在StackOverflow上找到一个类似的问题： https://stackoverflow.com/questions/23802710/

hadoop hbase section noreferrer noopener compatibility

hadoop - 向 HBase 提供文件的命令，该文件随后存储在 HDFS 中

简介对thisquestion的后续问题.HBase已经连接到HDFS。是否可以向HBase提供一个文件，该文件随后使用命令存储在HDFS中。根据thisdocumentation有几个HBaseshell命令。然而，这些命令仅限于例如创建、删除表。问题需要发出哪个命令来向HBase提供一个文件，该文件随后将存储在HDFS中？最佳答案问题不明确。HBase是一个键值存储。要将数据放入HBase，您必须首先创建一个具有模式的表(实际上，只是一个列族列表)。创建表后，就可以向表中加载数据；HBase命令是“put”。引用HBase书

该文 hadoop 39 section HBase command hdfs

java - 特定表的 hbase-default.xml 中单元格的最大大小

是否可以在hbase-default.xml中为特定表配置单元格的最大大小。如果可能，请告诉我我们配置最大单元格大小的方法列表。Reference:Igotthiserror,java.lang.IllegalArgumentException:**KeyValuesize**toolargeatorg.apache.hadoop.hbase.client.HTable.validatePut(HTable.java:1312)atorg.apache.hadoop.hbase.client.HTable.doPut(HTable.java:941)atorg.apache.hadoo

hbase-default default section hbase HTable java hadoop max

149 150 151152153 154 155