BigSQL-HBase

java - (HBase) 错误 : JAVA_HOME is not set and Java could not be found

我已经阅读了一些关于设置JAVA_HOME的评论。因为我是这方面的初学者，所以我没有在不知道自己在做什么的情况下编辑任何东西。我不想把事情搞得更糟。因此，如果您能指导我解决这个问题并告诉我我的编码有什么问题，我将不胜感激。我一直在尝试安装Hadoop，然后安装HBase。在解决了很多困难和错误之后，我终于可以安装Hadoop，并在运行start-all.sh时得到这个输出，一切似乎都很好。>hduser@CSLAP106:~$/usr/local/hadoop/bin/start-all.sh>hduser@CSLAP106:~$jps>3005NameNode>3404JobTrac

hadoop - 从 HDFS 导入数据到 HBase (cdh3u2)

我已经安装了hadoop和hbasecdh3u2。在hadoop中，我在路径/home/file.txt中有一个文件。它有这样的数据one,1two,2three,3我想将这个文件导入到hbase中。其中，第一个字段应解析为字符串，第二个字段应解析为整数，然后应将其插入hbase。帮我做这个a提前致谢.... 最佳答案我喜欢使用ApachePig来摄取HBase，因为它简单、直接且灵活。这是一个Pig脚本，可以在您创建表和列族后为您完成这项工作。要创建表和列族，您需要:$hbaseshell>create'mydata','myc

hadoop cdh3u2 39 code hbase hdfs cloudera sqoop

hadoop - Hbase mapreduce错误

我写作业mapreduce，输入是hbase中的一张表。作业运行时出现错误:org.apache.hadoop.hbase.client.ScannerTimeoutException:88557mspassedsincethelastinvocation,timeoutiscurrentlysetto60000atorg.apache.hadoop.hbase.client.HTable$ClientScanner.next(HTable.java:1196)atorg.apache.hadoop.hbase.mapreduce.TableRecordReaderImpl.nextK

mapreduce hadoop apache java hbase

shell - get "ERROR: Can' t 从 ZooKeeper 获取主地址； znode data == null"使用 Hbase shell 时

我安装了Hadoop2.2.0和Hbase0.98.0，这是我所做的:$./bin/start-hbase.sh$./bin/hbaseshell2.0.0-p353:001>list然后我得到了这个:ERROR:Can'tgetmasteraddressfromZooKeeper;znodedata==null为什么我会收到这个错误？另一个问题:我需要在运行base之前运行./sbin/start-dfs.sh和./sbin/start-yarn.sh吗？另外，./sbin/start-dfs.sh和./sbin/start-yarn.sh有什么用？这是我的一些conf文档:hbas

amp shell code gt lt hadoop hbase

amazon-ec2 - 在 EC2 集群上安装 Hbase/Hadoop

我知道我可以分拆出一个安装了Hadoop的EC2集群(除非我错了)。Hbase怎么样？我可以预先准备好Hadoop和Hbase吗？或者我需要弄脏我的手吗？如果它不是一个选项，什么是最好的选择？Cloudera显然有一个包含两者的软件包。这是要走的路吗？感谢您的帮助。最佳答案 hbase有一组ec2脚本，可以让您快速设置并准备好运行。它允许您配置zk服务器和从节点的数量，但我不确定它们在哪些版本中可用。我正在使用0.20.6。设置一些S3/EC2信息后，您可以执行以下操作:/usr/local/hbase-0.20.6/contri

amazon-ec amazon strong section INSTANCE amazon-ec2 hadoop hbase

hadoop - 在 HBase 与 Parquet 文件中存储数据

我是大数据的新手，正在尝试了解保存和检索数据的各种方式。我知道Parquet和HBase都是面向列的存储格式，但Parquet是面向文件的存储，而不是与HBase不同的数据库。我的问题是:使用Parquet代替HBase的用例是什么是否有Parquet可以与HBase一起使用的用例。在执行连接的情况下，Parquet的性能会比HBase(比如，通过像Phoenix这样的SQL皮肤访问)？最佳答案正如您已经提到的，parquet是一种存储，而HBase是存储(HDFS)+查询引擎(API/shell)，因此应该在parquet+I

Parquet hadoop HBase strong apache-phoenix

database - HBase 错误 - 分配 -ROOT- 失败

我刚刚从cloudera(3)安装了hadoop和hbase，但是当我尝试转到http://localhost:60010时它只是坐在那里不断加载。我可以正常访问区域服务器-http://localhost:60030...查看主hbase服务器日志，我可以看到以下内容。看起来像是根区域的问题。所有这些都安装在运行Ubuntu(Natty)11的ext41TB分区上。没有集群/其他盒子。任何帮助都会很棒!11/05/1519:58:27WARNmaster.AssignmentManager:Failedassignmentof-ROOT-,,0.70236052toserverNam

database HBase hadoop apache nosql cloudera

hadoop - 如何确定我的 HBase 表的大小？。有没有命令可以这样做？

我的Hbaseshell上有多个表，我想将它们复制到我的文件系统中。有些表超过100gb。但是，我的本地文件系统中只剩下55gb可用空间。因此，我想知道我的hbase表的大小，以便我可以只导出小型表。任何建议表示赞赏。谢谢，高瑟姆最佳答案尝试hdfsdfs-du-h/hbase/data/default/(或/hbase/取决于您使用的hbase版本)这将显示您的表格文件使用了多少空间。希望对您有所帮助。关于hadoop-如何确定我的HBase表的大小？。有没有命令可以这样做？，我

hadoop HBase section stackoverflow export bigdata

hadoop - Hbase Schema 嵌套实体

有没有人有关于如何使用嵌套实体创建Hbase表的示例？例子UserName(string)SSN(string)+Books(collection)例如，书籍收藏看起来像这样书籍isbntitleetc...我找不到一个例子来说明如何创建这样的表。我看到很多人都在谈论它，以及它在某些情况下如何成为最佳实践，但我找不到关于如何在任何地方做到这一点的例子。谢谢... 最佳答案嵌套实体不是HBase的官方功能；这只是一些人谈论一种使用模式的一种方式。在此模式中，您使用HBase中的“列”实际上只是一个大映射(一组键/值对)这一事实，让您

hadoop Schema 39 section code hbase

hadoop - HBase 获取单元格的所有时间戳值

我的hbase实例中有以下场景hbase(main):002:0>create'test','cf'0row(s)in1.4690secondshbase(main):003:0>put'test','row1','cf:a','value1'0row(s)in0.1480secondshbase(main):004:0>put'test','row2','cf:b','value2'0row(s)in0.0070secondshbase(main):005:0>put'test','row3','cf:c','value3'0row(s)in0.0120secondshbase(ma

hadoop HBase 39 row

38 39 404142 43 44