草庐IT

hbase-shell

全部标签

java - HBase 中的组合键

我是HBase的新手,必须使用组合键作为主键。请告诉我Howtomakecomposite-keyinhbase?AndHowtosearcharecordusingthatcomposite-key? 最佳答案 只需连接您的key部分并使用它。没什么特别的。假设您有一个客户表,并且您想要一个由CustID和Timestamp组成的行键。然后你想获取特定用户的所有结果,而不考虑时间戳。你会做这样的事情:publicstaticvoidmain(String[]args)throwsIOException{Configurationc

java - HBase:/hbase/meta-region-server节点不存在

我在上面安装了cloudera和hdfs、mapreduce、zookeper、hbase。具有这些服务的4个节点(3个动物园管理员)。全部由cloudera向导安装,在cloudera中没有配置问题。从Java连接时出现错误:9:32:23.020[main-SendThread()]INFOorg.apache.zookeeper.ClientCnxn-Openingsocketconnectiontoserver/172.20.7.6:218109:32:23.020[main]INFOorg.apache.hadoop.hbase.zookeeper.RecoverableZo

hadoop - TTL 行为 - HBase

我们在HBase表中有很多数据。我是这个NoSQL世界的新手。我们希望仅在固定时间内保留数据。我们应该编写单独的清理脚本还是可以依赖TTL配置?我浏览了可用的文档,但不理解确切的行为。 最佳答案 HBasedocumentation明确表示早于TTL的数据将被HBase自动删除。 关于hadoop-TTL行为-HBase,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/217205

scala - SPARK_EXECUTOR_INSTANCES 在 SPARK SHELL、YARN 客户端模式下不工作

我是spark的新手。正在尝试运行sparkonyarninyarn-clientmode.SPARKVERSION=1.0.2HADOOPVERSION=2.2.0yarn集群有3个事件节点。spark-env.sh中设置的属性SPARK_EXECUTOR_MEMORY=1GSPARK_EXECUTOR_INSTANCES=3SPARK_EXECUTOR_CORES=1SPARK_DRIVER_MEMORY=2GCommandused:/bin/spark-shell--masteryarn-client但是在登录spark-shell之后,它只注册了1个执行器,并为其分配了一些默认

hadoop - hbase 随机写入是如何工作的

我是Hbase的新手。Hbase适用于对表进行随机更新(放入或删除),但我无法理解hbase如何执行该操作。由于hbase使用HDFS进行存储,因此无法更新HDFS中的任何内容。Hbase使用memstore更新记录并首先将任何编辑写入memstore。因此MemStore包含按排序键顺序排列的任意数量的更新行。当它将数据转储到磁盘到hfile时,这个hfile是否与其他hfiles全局排序.转储所有hfile后,hfile被复制到HDFS。WAL编辑日志也有同样的问题。WAL日志文件是否也在HDFS中复制。对于每次更新,我们都将更新复制到HDFS。 最佳答

shell - HDFS 命令行追加

有没有办法像复制文件一样从命令行append到HDFS上的文件:hadoopfs-copyFromLocalURI 最佳答案 此功能在Hadoop2.3.0中实现为appendToFile语法如下:hdfsdfs-appendToFilelocalfile/user/hadoop/hadoopfile(在2009年考虑HDFSAppend功能时首次提出:https://issues.apache.org/jira/browse/HADOOP-6239) 关于shell-HDFS命令行追加

hadoop - 通过 API 获取 Hbase 区域大小

我正在尝试为Hbase编写一个平衡器工具,它可以根据区域计数和/或区域大小(存储文件大小的总和)来平衡跨区域服务器的区域。我找不到任何返回区域大小或相关信息的HbaseAPI类。我已经检查了一些可用于获取其他表/区域信息的类,例如org.apache.hadoop.hbase.client.HTable和HBaseAdmin。我在想,另一种实现方法是使用Hadoop类之一,它返回文件系统中目录的大小,例如org.apache.hadoop.fs.FileSystem列出特定HDFS路径下的文件。有什么建议吗? 最佳答案 我用它来进行

c# - 如何使用 C# 连接到 HBase/Hadoop 数据库

最近,ExploringMicrosoftHDInsightHadoopforWindows。但不知道从哪里开始,开始使用apachehadoop和c#/asp.netmvc。我知道http://hadoopsdk.codeplex.com/是最好的可用资源,但找不到从头开始的文档?比如创建集群、数据库,然后将其连接到C#应用程序。 最佳答案 最简单的入门方法是使用HDInsightserviceonAzure(仍在预览中,但效果很好)。这样,您只需登录到您的Azure门户并启动一个集群,该集群将链接到您的Azure存储。如果实在不

hadoop - 一致性在 HBase 中是如何工作的

从CAP上,我读到HBase支持一致性和分区容错性。我想知道HBase中的一致性是如何实现的。是否应用了任何锁定?我在网上查了下没有找到这方面的好资料。任何机构能否提供有关此主题的任何博客/文章。 最佳答案 对行数据的访问是原子的,包括任意数量的正在读取或写入的列到。不存在跨越多行或跨表。原子访问是这种架构的一个因素严格一致,因为每个并发的读者和作者都可以做出安全的假设关于一行的状态。当数据更新时,它首先写入提交日志,称为预写日志(WAL)在HBase中,然后存储在内存中(按RowId排序)memstore。一旦内存中的数据有超过给

hadoop - 在 oozie Java Action 中传递 HBase 凭据

我需要安排一个与安全hbase交互的oozieJava操作,因此我需要为Java操作提供hbase凭据。我使用的是安全的hortonworks2.2环境,我的工作流XML如下${jobTracker}${nameNode}com.test.hbase.TestHBaseSecure${arg1}Javafailed,errormessage[${wf:errorMessage(wf:lastErrorNode())}]我还修改了oozie属性以包含HbaseCredentials类oozie.credentials.credentialclasses=hcat=org.apache.o