草庐IT

Hbase常用命令

全部标签

java - 到 HBase 的 Mapreduce 作业抛出 IOException : Pass a Delete or a Put

在EMR上使用Hadoop2.4.0和HBase0.94.18时,我试图直接从我的Mapper输出到HBase表。在执行下面的代码时,我遇到了一个讨厌的IOException:PassaDeleteoraPut。publicclassTestHBase{staticclassImportMapperextendsMapper{privatebyte[]family=Bytes.toBytes("f");@Overridepublicvoidmap(MyKeykey,MyValuevalue,Contextcontext){MyItemitem=//dosomestuffwithkey/

hadoop - 尝试配置 Apache Phoenix 时 HBase 区域服务器出现故障

我正在使用CDH5.3.1和HBase0.98.6-cdh5.3.1并尝试配置ApachePhoenix4.4.0根据ApachePhoenixInstallation中提供的文档将phoenix-4.4.0-HBase-0.98-server.jar文件复制到lib目录(/opt/cloudera/parcels/CDH-5.3.1-1.cdh5.3.1.p0.5/lib/hbase/lib)主服务器和区域服务器从ClouderaManager重新启动HBase服务。当我检查HBase实例时,我发现区域服务器已关闭并且我在日志文件中没有看到任何问题。我什至尝试从phoenix文件夹中

hadoop - 如何将图像文件从 HDFS 目录移动到 HBase?

我有ClouderaCDH5.3.0我在HDFS中有一个目录,其中包含几千兆字节的图像文件。这些文件有多种类型(jpg、png、gif)。对于每个文件picturename.jpg,我希望在HBase中有一行以picturename作为行键,一列包含图像数据。有人可以解释一下我将如何完成这样的事情吗? 最佳答案 对于背景,HBase将所有内容存储为二进制。你会Put和Get二进制数据。将图像作为二进制文件读取正如您所描述的,HBase表看起来像rowkeycf:data有几种方法可以将数据提取到HBase。使用或不使用mapredu

scala - 使用 HBase 的 Spark 作业失败

我运行的任何涉及HBase访问的Spark作业都会导致以下错误。我自己的工作是在Scala中,但提供的python示例以相同的方式结束。集群是Cloudera,运行CDH5.4.4。相同的作业在使用CDH5.3.1的不同集群上运行良好。非常感谢任何帮助!...15/08/1521:46:30WARNTableInputFormatBase:initializeTablecalledmultipletimes.Overwritingconnectionandtablereference;TableInputFormatBasewillnotclosetheseoldreferencesw

hadoop - HBase 无法在 Mac OSX 上以单节点集群模式启动

我正在尝试设置个人HBase开发环境。我正在运行hdfs和yarn,但无法启动HBase。我已经通过运行start-dfs.sh和start-yarn.sh启动了hadoop2.7.1。我已经通过测试hdfsdfs-mkdir/test并运行示例中捆绑的示例MR作业来验证这些正在运行,我已经在端口50070浏览了HDFS。我已经在端口2181上启动了zookeeper3.4.6并设置了它的dataDir。我的zoo.cfg有:dataDir=/Users/.../tools/hd/zookeeper_dataclientPort=2181我在我选择的dataDir中观察它的zookee

使用 HBase 作为数据接收器的 Hadoop 流式传输

我们的研究小组设置并运行了Hadoop和HBase。最近在用Hadoopstreaming(只有mappers)处理数据,想用HBase做datasink。我觉得我可以将-outputformat设置为TableOutFormat。但是在网上搜索了一段时间后,我发现具体操作可能需要很长时间才能弄清楚。下面是我的试用版:$HADOOP_HOME/bin/hadoopjar$HADOOP_HOME/hadoop-streaming.jar\-inputmyInputDirs\-outputformatHBaseLibDir/TableOutFormat\-mappermyMapperScr

database - 将记录存储在 HDFS 或 HBase 中

我有以下场景:测量数据以文件形式通过网络服务上传这些文件随后被复制到HDFS每个测量包含一个或多个参数的许多特征(值)测量值的数量可能不同使用Hadoop上的机器学习算法处理测量值并非所有测量都进行了,而是针对特定用户在特定时间段进行的(例如,对用户X在Y-Z期间上传的文件进行处理)中间结果存储在HDFS,最终结果也是如此我的问题与第二点有关-这些文件后来被复制到HDFS-我担心存在大量小文件(例如1MB)可能是个问题。我的想法是将该文件存储在数据库中,这样我就可以避免小文件的问题,并且还能够查询数据(为用户选择一段时间的数据)。这是更好的方法吗?如果答案是肯定的,我可以使用哪些数据库

mysql - Sqoop 使用 Java API 导入到 Hbase 表

我一直在尝试使用Sqoop将数据从MySQL数据库导入到Hbase,但一直遇到错误。请问你能帮我吗?(我使用的是Sqoop1)我的代码如下:importcom.cloudera.sqoop.SqoopOptions;importcom.cloudera.sqoop.tool.ImportTool;importcom.cloudera.sqoop.SqoopOptions.IncrementalMode;importcom.cloudera.sqoop.tool.SqoopTool;importorg.apache.hadoop.conf.Configuration;importorg.

hadoop - 同时使用 Delete 和 Put 时无法在 HBase 中插入新数据

我正在使用Hbasemapreduce来计算报告。在reducer中,我尝试清除“result”列族,然后添加一个新的“total”列。但我发现列族是删除的,但新数据不是插入的。Put操作似乎不起作用。你知道为什么吗?reducer类中的示例代码:Deletedel=newDelete(rowkey.getBytes());del.addFamily(RESULT);context.write(newImmutableBytesWritable(Bytes.toBytes(key.toString())),del);Putput=newPut(rowkey.getBytes());pu

hadoop - Hbase:列的自动递增

我是Hbase的新手。需要帮忙,我在Hbase中有一个包含一些数据的表。IdNameAddress1johnXX-XX2mikeXXX-XX和Id应该自动递增。现在我必须将数据插入表中,就像我们插入10条记录一样,Id应该递增到12,就像IdNameAddress1johnXX-XX2mikeXXX-XX3fooXXXX......12boooxxx可能会想到Hbase中的sequencegenerator。谁能帮我写代码。 最佳答案 HBase没有序列生成器。正如Sergey评论的那样,不推荐使用序列作为行键。当面对这样的需求时,