草庐IT

HBASE_CLASSPATH

全部标签

hadoop - HBase导入命令

我们目前正在从CDH3u4迁移到CDH5。我们创建了新集群并复制了所有数据。感谢Cloudera经理,一切都很顺利。但是我们在将数据从HBase0.90.6迁移到HBase0.96.1.1时遇到了问题。我尝试使用HBase(https://hbase.apache.org/book/ops_mgt.html#export)的导出/导入功能来迁移数据。我已经设法导出数据并将它们复制到新服务器(discp)。当我在目标集群上使用命令时:hbase-Dhbase.import.version=0.90org.apache.hadoop.hbase.mapreduce.Importip/use

java - 使用 Apache Crunch 的 WordCount 到 HBase Standalone

目前我正在评估ApacheCrunch。我遵循了一个简单的WordCountMapReducejobexample:之后我尝试将结果保存到一个独立的HBase中。HBase正在运行(使用jps和HBaseshell检查),如下所述:http://hbase.apache.org/book/quickstart.html下面我采用写入HBase的例子:Pipelinepipeline=newMRPipeline(WordCount.class,getConf());PCollectionlines=pipeline.readTextFile(inputPath);PTablecounts

hadoop - Spark 插入 HBase 慢

我正在使用Spark插入到HBase,但速度很慢。对于60,000条记录,需要2-3分钟。我有大约1000万条记录要保存。objectWriteToHbaseextendsSerializable{defmain(args:Array[String]){valcsvRows:RDD[Array[String]=...valdateFormatter=DateTimeFormat.forPattern("yyyy-MM-ddHH:mm:ss")valusersRDD=csvRows.map(row=>{newUserTable(row(0),row(1),row(2),row(9),ro

hadoop - Hbase:只有每个单元格的第一个版本

我想知道如何以仅存储每个单元格的第一个版本的方式配置Hbase?假设下面的Htable:row_keycf1:c1timestamp----------------------------------------1xt1将("1","cf1:c2",t2)放入ColumnDescriptor.DEFAULT_VERSIONS=2的场景后,提到的Htable变为:row_keycf1:c1timestamp----------------------------------------1xt11xt2其中t2>t1。我的问题是如何改变这种情况,使第一个版本的单元格成为唯一可以存储和检索的

hadoop - 如何在 HBase 表中设置 autoflush=false

我有这段代码可以保存到HBaseHTABLE。预期的行为是该表将为每个分区推送提交或将puts“刷新”到hbase。注意:这是更新后的代码rdd.foreachPartition(p=>{valtable=connection.getTable(TableName.valueOf(HTABLE))valmutator=connection.getBufferedMutator(TableName.valueOf(HTABLE))p.foreach(row=>{valhRow=newPut(rowkey)hRow.addColumn....//usetable.existsinstead

hadoop - 我现在如何锁定 hbase?

不再允许使用Rowlock功能。htable.lockrow()isnotprovidedinlibrary如何在hbase中实现锁?有什么方法可以帮助我做到这一点吗? 最佳答案 现在不支持客户端行锁:https://issues.apache.org/jira/browse/HBASE-7315 关于hadoop-我现在如何锁定hbase?,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/quest

java - Hbase 中的 addImmutable 和 addColumn 有什么区别?

在HBase的put操作中有两种类型addImmutable()和addColumn().这两者有什么区别?不可变是否可以更新/覆盖? 最佳答案 您可以在此JIRA中阅读有关此方法的更多信息:https://issues.apache.org/jira/plugins/servlet/mobile#issue/HBASE-10024简单地说:addImmutable不会复制传递的数组并“按原样”使用它。因此,如果您稍后更改传递的字节数组的内容(在调用addImmutable之后),Put实例也会看到此更改,这对您来说可能是非常意外的

hadoop - 为什么 hbase KeyValueSortReducer 需要对所有 KeyValue 进行排序

最近在学习PhoenixCSVBulkLoad,发现org.apache.phoenix.mapreduce.CsvToKeyValueReducer的源码在列比较大的时候会导致OOM(javaheapoutofmemory)一行(在我的例子中,一行44列,一行的平均大小为4KB)。此外,该类与hbase批量负载reducer类-KeyValueSortReducer类似。这意味着在我的情况下使用KeyValueSortReducer时可能会发生OOM。所以,我有一个关于KeyValueSortReducer的问题-为什么它需要先对treeset中的所有kvs进行排序,然后将它们全部写

hadoop - 为行键放置不同值但在 hbase 中放置相同时间戳的解决方案?

我是Hbase的新人。将文本文件中的数据批量加载到Hbase时遇到问题。假设我有下表:Key_id|f1:c1|f2:c2row1'a''b'row1'x''y'当我解析2条记录并同时将其放入Hbase时(相同的时间戳),然后只有版本{row1'x''y'}更新。解释如下:WhenyouputdataintoHBase,atimestampisrequired.ThetimestampcanbegeneratedautomaticallybytheRegionServerorcanbesuppliedbyyou.Thetimestampmustbeuniqueperversionofa

java - 如何在 HBase 中更新过期的 Kerberos 票证?

我有一个小的spring服务,它提供基本的功能,比如从hbase表中放入/删除/获取。一切似乎都正常,但有一个问题。启动我的tomcat服务器10小时后,我的kerberos票证到期,所以我应该更新它。我尝试将javaapi用于hbase并在我的代码中的每个方法中使用,它连接到hbase我添加了这一行:UserGroupInformation.getLoginUser().checkTGTAndReloginFromKeytab();我也试过:UserGroupInformation.getLoginUser().reloginFromKeytab()和:SecurityUtil.lo