NoSql_HBase

amazon-ec2 - 在 EC2 集群上安装 Hbase/Hadoop

我知道我可以分拆出一个安装了Hadoop的EC2集群(除非我错了)。Hbase怎么样？我可以预先准备好Hadoop和Hbase吗？或者我需要弄脏我的手吗？如果它不是一个选项，什么是最好的选择？Cloudera显然有一个包含两者的软件包。这是要走的路吗？感谢您的帮助。最佳答案 hbase有一组ec2脚本，可以让您快速设置并准备好运行。它允许您配置zk服务器和从节点的数量，但我不确定它们在哪些版本中可用。我正在使用0.20.6。设置一些S3/EC2信息后，您可以执行以下操作:/usr/local/hbase-0.20.6/contri

hadoop - 在 HBase 与 Parquet 文件中存储数据

我是大数据的新手，正在尝试了解保存和检索数据的各种方式。我知道Parquet和HBase都是面向列的存储格式，但Parquet是面向文件的存储，而不是与HBase不同的数据库。我的问题是:使用Parquet代替HBase的用例是什么是否有Parquet可以与HBase一起使用的用例。在执行连接的情况下，Parquet的性能会比HBase(比如，通过像Phoenix这样的SQL皮肤访问)？最佳答案正如您已经提到的，parquet是一种存储，而HBase是存储(HDFS)+查询引擎(API/shell)，因此应该在parquet+I

Parquet hadoop HBase strong apache-phoenix

database - HBase 错误 - 分配 -ROOT- 失败

我刚刚从cloudera(3)安装了hadoop和hbase，但是当我尝试转到http://localhost:60010时它只是坐在那里不断加载。我可以正常访问区域服务器-http://localhost:60030...查看主hbase服务器日志，我可以看到以下内容。看起来像是根区域的问题。所有这些都安装在运行Ubuntu(Natty)11的ext41TB分区上。没有集群/其他盒子。任何帮助都会很棒!11/05/1519:58:27WARNmaster.AssignmentManager:Failedassignmentof-ROOT-,,0.70236052toserverNam

database HBase hadoop apache nosql cloudera

hadoop - 如何确定我的 HBase 表的大小？。有没有命令可以这样做？

我的Hbaseshell上有多个表，我想将它们复制到我的文件系统中。有些表超过100gb。但是，我的本地文件系统中只剩下55gb可用空间。因此，我想知道我的hbase表的大小，以便我可以只导出小型表。任何建议表示赞赏。谢谢，高瑟姆最佳答案尝试hdfsdfs-du-h/hbase/data/default/(或/hbase/取决于您使用的hbase版本)这将显示您的表格文件使用了多少空间。希望对您有所帮助。关于hadoop-如何确定我的HBase表的大小？。有没有命令可以这样做？，我

hadoop HBase section stackoverflow export bigdata

hadoop - Hbase Schema 嵌套实体

有没有人有关于如何使用嵌套实体创建Hbase表的示例？例子UserName(string)SSN(string)+Books(collection)例如，书籍收藏看起来像这样书籍isbntitleetc...我找不到一个例子来说明如何创建这样的表。我看到很多人都在谈论它，以及它在某些情况下如何成为最佳实践，但我找不到关于如何在任何地方做到这一点的例子。谢谢... 最佳答案嵌套实体不是HBase的官方功能；这只是一些人谈论一种使用模式的一种方式。在此模式中，您使用HBase中的“列”实际上只是一个大映射(一组键/值对)这一事实，让您

hadoop Schema 39 section code hbase

hadoop - HBase 获取单元格的所有时间戳值

我的hbase实例中有以下场景hbase(main):002:0>create'test','cf'0row(s)in1.4690secondshbase(main):003:0>put'test','row1','cf:a','value1'0row(s)in0.1480secondshbase(main):004:0>put'test','row2','cf:b','value2'0row(s)in0.0070secondshbase(main):005:0>put'test','row3','cf:c','value3'0row(s)in0.0120secondshbase(ma

hadoop HBase 39 row

hadoop - Hadoop 和 Nosql 的区别

按照目前的情况，这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持，但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开，visitthehelpcenter指导。关闭10年前。我想知道hadoop和nosql的基本区别Hadoop的需求是什么？NoSQL的需求是什么？两者相同吗？

hadoop section 求是 notice nosql

hadoop - HBase & Mahout - 使用 HBase 作为 Mahout 的数据存储/源 - 分类

我正在从事一个大型文本分类项目，我们将文本数据(简单消息)存储在HBase中。我们有两个问题，首先我们想使用HBase作为Mahout分类器的来源，即拜耳和随机森林。其次，我们希望能够存储在HBase中生成的模型，而不是使用内存方法(InMemoryBayesDatastore)，但是随着我们的集的增长，我们遇到了内存利用问题，并且想测试HBase作为可行的替代方案。似乎很少有资料将HBase与Mahout一起使用，以及是否可以将其用作潜在的数据源。我在具有InMemory数据存储的Java中使用Mahout0.6核心API。做一些挖掘我相信有一个HBaseBayers数据存储组件-o

Mahout HBase hadoop machine-learning classification

hadoop - 使用HBase存储时序数据

我们正在尝试使用HBase来存储时间序列数据。我们目前拥有的模型将时间序列存储为单元格中的版本。这意味着该单元最终可能会存储数百万个版本，并且此时间序列上的查询将使用HBase中的Get类中可用的setTimeRange方法检索一系列版本。例如{"row1":{"columnFamily1":{"column1":{1:"1",2:"2"},"column2":{1:"1"}}}}这是在HBase中存储时序数据的合理模型吗？在多列(是否可以跨列查询)或行中存储数据的替代模型更合适？最佳答案我认为您不应该在此处使用版本控制来存储时

时序 hadoop 34 section code hbase opentsdb

hadoop - HBase 中基于时间戳的扫描？

例如，对于hbase表'test_table'，插入的值是:Row1-Val1=>tRow1-Val2=>t+3Row1-Val3=>t+5Row2-Val1=>tRow2-Val2=>t+3Row2-Val3=>t+5在扫描'test_table'时应该返回version=t+4Row1-Val1=>t+3Row2-Val2=>t+3我如何在HBase中实现基于时间戳的扫描(基于小于或等于时间戳的最新可用值)？最佳答案考虑这个表:hbase(main):009:0>create't1',{NAME=>'f1',VERSIONS

中基 hadoop 39 value hbase

41 42 434445 46 47