hbase-parameter-tuning

hadoop - HBase 和 Bigtable 支持单行事务

HBase和Google的Bigtable都支持单行事务不支持多行是什么意思？目前我在本地文件系统之上使用HBase；我怎么才能看到这一点？最佳答案你有一行看起来像这样:用户名:fabspro密码:1234帐户活跃:1last_login:2012-10-10last_login_ip:135.23.15.3例如。然后当用户登录时，你需要更新last_login和last_login_ip。如果您在单个放置操作中更新两个字段，则两个字段将同时更新。如果某个字段由于某种原因无法更新，或者更新中途失败，那么这两个值都不会被写入。这意

hadoop - hbase standalone 和 zookeeper standalone 在一台机器上

是否可以在单机中以独立模式同时运行Hbase和外部zookeeper？它卡在clientPort问题上。请澄清一下？最佳答案是的，这是可能的。为此，您必须更改外部动物园管理员服务器的客户端端口。进入外部zookeeper的conf目录。打开zoo.cfg文件。如果它不在那里，而是zoo_sample.cfg在那里，那么做mvconf/zoo_sample.cfgconf/zoo.cfg创建它。在zoo.cfg文件中，将clientPort=2181的默认端口号更改为2182。同时将dataDir更改为您希望的某个目录。例如-我会

standalone zookeeper section code hadoop hbase bigdata apache-zookeeper

hadoop - HBase导入命令

我们目前正在从CDH3u4迁移到CDH5。我们创建了新集群并复制了所有数据。感谢Cloudera经理，一切都很顺利。但是我们在将数据从HBase0.90.6迁移到HBase0.96.1.1时遇到了问题。我尝试使用HBase(https://hbase.apache.org/book/ops_mgt.html#export)的导出/导入功能来迁移数据。我已经设法导出数据并将它们复制到新服务器(discp)。当我在目标集群上使用命令时:hbase-Dhbase.import.version=0.90org.apache.hadoop.hbase.mapreduce.Importip/use

hadoop HBase mapreduce reduce INFO import export

java - 使用 Apache Crunch 的 WordCount 到 HBase Standalone

目前我正在评估ApacheCrunch。我遵循了一个简单的WordCountMapReducejobexample:之后我尝试将结果保存到一个独立的HBase中。HBase正在运行(使用jps和HBaseshell检查)，如下所述:http://hbase.apache.org/book/quickstart.html下面我采用写入HBase的例子:Pipelinepipeline=newMRPipeline(WordCount.class,getConf());PCollectionlines=pipeline.readTextFile(inputPath);PTablecounts

Standalone WordCount section String Put java hadoop mapreduce hbase apache-crunch

hadoop - Spark 插入 HBase 慢

我正在使用Spark插入到HBase，但速度很慢。对于60,000条记录，需要2-3分钟。我有大约1000万条记录要保存。objectWriteToHbaseextendsSerializable{defmain(args:Array[String]){valcsvRows:RDD[Array[String]=...valdateFormatter=DateTimeFormat.forPattern("yyyy-MM-ddHH:mm:ss")valusersRDD=csvRows.map(row=>{newUserTable(row(0),row(1),row(2),row(9),ro

hadoop Spark section dateFormatter val apache-spark hbase rdd

hadoop - Hbase:只有每个单元格的第一个版本

我想知道如何以仅存储每个单元格的第一个版本的方式配置Hbase？假设下面的Htable:row_keycf1:c1timestamp----------------------------------------1xt1将("1","cf1:c2",t2)放入ColumnDescriptor.DEFAULT_VERSIONS=2的场景后，提到的Htable变为:row_keycf1:c1timestamp----------------------------------------1xt11xt2其中t2>t1。我的问题是如何改变这种情况，使第一个版本的单元格成为唯一可以存储和检索的

hadoop Hbase code section 的

hadoop - 如何在 HBase 表中设置 autoflush=false

我有这段代码可以保存到HBaseHTABLE。预期的行为是该表将为每个分区推送提交或将puts“刷新”到hbase。注意:这是更新后的代码rdd.foreachPartition(p=>{valtable=connection.getTable(TableName.valueOf(HTABLE))valmutator=connection.getBufferedMutator(TableName.valueOf(HTABLE))p.foreach(row=>{valhRow=newPut(rowkey)hRow.addColumn....//usetable.existsinstead

中设何在 code section BufferedMutator hadoop hbase

hadoop - 我现在如何锁定 hbase？

不再允许使用Rowlock功能。htable.lockrow()isnotprovidedinlibrary如何在hbase中实现锁？有什么方法可以帮助我做到这一点吗？最佳答案现在不支持客户端行锁:https://issues.apache.org/jira/browse/HBASE-7315 关于hadoop-我现在如何锁定hbase？，我们在StackOverflow上找到一个类似的问题： https://stackoverflow.com/quest

hadoop hbase section https 端行

java - Hbase 中的 addImmutable 和 addColumn 有什么区别？

在HBase的put操作中有两种类型addImmutable()和addColumn().这两者有什么区别？不可变是否可以更新/覆盖？最佳答案您可以在此JIRA中阅读有关此方法的更多信息:https://issues.apache.org/jira/plugins/servlet/mobile#issue/HBASE-10024简单地说:addImmutable不会复制传递的数组并“按原样”使用它。因此，如果您稍后更改传递的字节数组的内容(在调用addImmutable之后)，Put实例也会看到此更改，这对您来说可能是非常意外的

addImmutable addColumn section code java apache hadoop hbase

hadoop - 为什么 hbase KeyValueSortReducer 需要对所有 KeyValue 进行排序

最近在学习PhoenixCSVBulkLoad，发现org.apache.phoenix.mapreduce.CsvToKeyValueReducer的源码在列比较大的时候会导致OOM(javaheapoutofmemory)一行(在我的例子中，一行44列，一行的平均大小为4KB)。此外，该类与hbase批量负载reducer类-KeyValueSortReducer类似。这意味着在我的情况下使用KeyValueSortReducer时可能会发生OOM。所以，我有一个关于KeyValueSortReducer的问题-为什么它需要先对treeset中的所有kvs进行排序，然后将它们全部写

KeyValueSortReducer KeyValue section hadoop hbase apache-phoenix bulk-load