草庐IT

BigSQL-HBase

全部标签

java - (HBase) 错误 : JAVA_HOME is not set and Java could not be found

我已经阅读了一些关于设置JAVA_HOME的评论。因为我是这方面的初学者,所以我没有在不知道自己在做什么的情况下编辑任何东西。我不想把事情搞得更糟。因此,如果您能指导我解决这个问题并告诉我我的编码有什么问题,我将不胜感激。我一直在尝试安装Hadoop,然后安装HBase。在解决了很多困难和错误之后,我终于可以安装Hadoop,并在运行start-all.sh时得到这个输出,一切似乎都很好。>hduser@CSLAP106:~$/usr/local/hadoop/bin/start-all.sh>hduser@CSLAP106:~$jps>3005NameNode>3404JobTrac

hadoop - 从 HDFS 导入数据到 HBase (cdh3u2)

我已经安装了hadoop和hbasecdh3u2。在hadoop中,我在路径/home/file.txt中有一个文件。它有这样的数据one,1two,2three,3我想将这个文件导入到hbase中。其中,第一个字段应解析为字符串,第二个字段应解析为整数,然后应将其插入hbase。帮我做这个a提前致谢.... 最佳答案 我喜欢使用ApachePig来摄取HBase,因为它简单、直接且灵活。这是一个Pig脚本,可以在您创建表和列族后为您完成这项工作。要创建表和列族,您需要:$hbaseshell>create'mydata','myc

hadoop - Hbase mapreduce错误

我写作业mapreduce,输入是hbase中的一张表。作业运行时出现错误:org.apache.hadoop.hbase.client.ScannerTimeoutException:88557mspassedsincethelastinvocation,timeoutiscurrentlysetto60000atorg.apache.hadoop.hbase.client.HTable$ClientScanner.next(HTable.java:1196)atorg.apache.hadoop.hbase.mapreduce.TableRecordReaderImpl.nextK

shell - get "ERROR: Can' t 从 ZooKeeper 获取主地址; znode data == null"使用 Hbase shell 时

我安装了Hadoop2.2.0和Hbase0.98.0,这是我所做的:$./bin/start-hbase.sh$./bin/hbaseshell2.0.0-p353:001>list然后我得到了这个:ERROR:Can'tgetmasteraddressfromZooKeeper;znodedata==null为什么我会收到这个错误?另一个问题:我需要在运行base之前运行./sbin/start-dfs.sh和./sbin/start-yarn.sh吗?另外,./sbin/start-dfs.sh和./sbin/start-yarn.sh有什么用?这是我的一些conf文档:hbas

amazon-ec2 - 在 EC2 集群上安装 Hbase/Hadoop

我知道我可以分拆出一个安装了Hadoop的EC2集群(除非我错了)。Hbase怎么样?我可以预先准备好Hadoop和Hbase吗?或者我需要弄脏我的手吗?如果它不是一个选项,什么是最好的选择?Cloudera显然有一个包含两者的软件包。这是要走的路吗?感谢您的帮助。 最佳答案 hbase有一组ec2脚本,可以让您快速设置并准备好运行。它允许您配置zk服务器和从节点的数量,但我不确定它们在哪些版本中可用。我正在使用0.20.6。设置一些S3/EC2信息后,您可以执行以下操作:/usr/local/hbase-0.20.6/contri

hadoop - 在 HBase 与 Parquet 文件中存储数据

我是大数据的新手,正在尝试了解保存和检索数据的各种方式。我知道Parquet和HBase都是面向列的存储格式,但Parquet是面向文件的存储,而不是与HBase不同的数据库。我的问题是:使用Parquet代替HBase的用例是什么是否有Parquet可以与HBase一起使用的用例。在执行连接的情况下,Parquet的性能会比HBase(比如,通过像Phoenix这样的SQL皮肤访问)? 最佳答案 正如您已经提到的,parquet是一种存储,而HBase是存储(HDFS)+查询引擎(API/shell),因此应该在parquet+I

database - HBase 错误 - 分配 -ROOT- 失败

我刚刚从cloudera(3)安装了hadoop和hbase,但是当我尝试转到http://localhost:60010时它只是坐在那里不断加载。我可以正常访问区域服务器-http://localhost:60030...查看主hbase服务器日志,我可以看到以下内容。看起来像是根区域的问题。所有这些都安装在运行Ubuntu(Natty)11的ext41TB分区上。没有集群/其他盒子。任何帮助都会很棒!11/05/1519:58:27WARNmaster.AssignmentManager:Failedassignmentof-ROOT-,,0.70236052toserverNam

hadoop - 如何确定我的 HBase 表的大小?。有没有命令可以这样做?

我的Hbaseshell上有多个表,我想将它们复制到我的文件系统中。有些表超过100gb。但是,我的本地文件系统中只剩下55gb可用空间。因此,我想知道我的hbase表的大小,以便我可以只导出小型表。任何建议表示赞赏。谢谢,高瑟姆 最佳答案 尝试hdfsdfs-du-h/hbase/data/default/(或/hbase/取决于您使用的hbase版本)这将显示您的表格文件使用了多少空间。希望对您有所帮助。 关于hadoop-如何确定我的HBase表的大小?。有没有命令可以这样做?,我

hadoop - Hbase Schema 嵌套实体

有没有人有关于如何使用嵌套实体创建Hbase表的示例?例子UserName(string)SSN(string)+Books(collection)例如,书籍收藏看起来像这样书籍isbntitleetc...我找不到一个例子来说明如何创建这样的表。我看到很多人都在谈论它,以及它在某些情况下如何成为最佳实践,但我找不到关于如何在任何地方做到这一点的例子。谢谢... 最佳答案 嵌套实体不是HBase的官方功能;这只是一些人谈论一种使用模式的一种方式。在此模式中,您使用HBase中的“列”实际上只是一个大映射(一组键/值对)这一事实,让您

hadoop - HBase 获取单元格的所有时间戳值

我的hbase实例中有以下场景hbase(main):002:0>create'test','cf'0row(s)in1.4690secondshbase(main):003:0>put'test','row1','cf:a','value1'0row(s)in0.1480secondshbase(main):004:0>put'test','row2','cf:b','value2'0row(s)in0.0070secondshbase(main):005:0>put'test','row3','cf:c','value3'0row(s)in0.0120secondshbase(ma