hbase-shell

java - HBase 中的组合键

我是HBase的新手，必须使用组合键作为主键。请告诉我Howtomakecomposite-keyinhbase?AndHowtosearcharecordusingthatcomposite-key? 最佳答案只需连接您的key部分并使用它。没什么特别的。假设您有一个客户表，并且您想要一个由CustID和Timestamp组成的行键。然后你想获取特定用户的所有结果，而不考虑时间戳。你会做这样的事情:publicstaticvoidmain(String[]args)throwsIOException{Configurationc

java - HBase:/hbase/meta-region-server节点不存在

我在上面安装了cloudera和hdfs、mapreduce、zookeper、hbase。具有这些服务的4个节点(3个动物园管理员)。全部由cloudera向导安装，在cloudera中没有配置问题。从Java连接时出现错误:9:32:23.020[main-SendThread()]INFOorg.apache.zookeeper.ClientCnxn-Openingsocketconnectiontoserver/172.20.7.6:218109:32:23.020[main]INFOorg.apache.hadoop.hbase.zookeeper.RecoverableZo

meta-region-server region cloudera hbase zookeeper java hadoop apache-zookeeper

hadoop - TTL 行为 - HBase

我们在HBase表中有很多数据。我是这个NoSQL世界的新手。我们希望仅在固定时间内保留数据。我们应该编写单独的清理脚本还是可以依赖TTL配置？我浏览了可用的文档，但不理解确切的行为。最佳答案 HBasedocumentation明确表示早于TTL的数据将被HBase自动删除。关于hadoop-TTL行为-HBase，我们在StackOverflow上找到一个类似的问题： https://stackoverflow.com/questions/217205

hadoop HBase section stackoverflow

scala - SPARK_EXECUTOR_INSTANCES 在 SPARK SHELL、YARN 客户端模式下不工作

我是spark的新手。正在尝试运行sparkonyarninyarn-clientmode.SPARKVERSION=1.0.2HADOOPVERSION=2.2.0yarn集群有3个事件节点。spark-env.sh中设置的属性SPARK_EXECUTOR_MEMORY=1GSPARK_EXECUTOR_INSTANCES=3SPARK_EXECUTOR_CORES=1SPARK_DRIVER_MEMORY=2GCommandused:/bin/spark-shell--masteryarn-client但是在登录spark-shell之后，它只注册了1个执行器，并为其分配了一些默认

SPARK SPARK_EXECUTOR_INSTANCES code Dspark scala hadoop apache-spark hadoop-yarn

hadoop - hbase 随机写入是如何工作的

我是Hbase的新手。Hbase适用于对表进行随机更新(放入或删除)，但我无法理解hbase如何执行该操作。由于hbase使用HDFS进行存储，因此无法更新HDFS中的任何内容。Hbase使用memstore更新记录并首先将任何编辑写入memstore。因此MemStore包含按排序键顺序排列的任意数量的更新行。当它将数据转储到磁盘到hfile时，这个hfile是否与其他hfiles全局排序.转储所有hfile后，hfile被复制到HDFS。WAL编辑日志也有同样的问题。WAL日志文件是否也在HDFS中复制。对于每次更新，我们都将更新复制到HDFS。最佳答

hadoop hbase section memstore bigtable

shell - HDFS 命令行追加

有没有办法像复制文件一样从命令行append到HDFS上的文件:hadoopfs-copyFromLocalURI 最佳答案此功能在Hadoop2.3.0中实现为appendToFile语法如下:hdfsdfs-appendToFilelocalfile/user/hadoop/hadoopfile(在2009年考虑HDFSAppend功能时首次提出:https://issues.apache.org/jira/browse/HADOOP-6239) 关于shell-HDFS命令行追加

shell HDFS section appendToFile hadoop command-line append

hadoop - 通过 API 获取 Hbase 区域大小

我正在尝试为Hbase编写一个平衡器工具，它可以根据区域计数和/或区域大小(存储文件大小的总和)来平衡跨区域服务器的区域。我找不到任何返回区域大小或相关信息的HbaseAPI类。我已经检查了一些可用于获取其他表/区域信息的类，例如org.apache.hadoop.hbase.client.HTable和HBaseAdmin。我在想，另一种实现方法是使用Hadoop类之一，它返回文件系统中目录的大小，例如org.apache.hadoop.fs.FileSystem列出特定HDFS路径下的文件。有什么建议吗？最佳答案我用它来进行

hadoop Hbase section final clusterStatus

c# - 如何使用 C# 连接到 HBase/Hadoop 数据库

最近，ExploringMicrosoftHDInsightHadoopforWindows。但不知道从哪里开始，开始使用apachehadoop和c#/asp.netmvc。我知道http://hadoopsdk.codeplex.com/是最好的可用资源，但找不到从头开始的文档？比如创建集群、数据库，然后将其连接到C#应用程序。最佳答案最简单的入门方法是使用HDInsightserviceonAzure(仍在预览中，但效果很好)。这样，您只需登录到您的Azure门户并启动一个集群，该集群将链接到您的Azure存储。如果实在不

c#noreferrer section noopener hadoop hbase hive azure-hdinsight

hadoop - 一致性在 HBase 中是如何工作的

从CAP上，我读到HBase支持一致性和分区容错性。我想知道HBase中的一致性是如何实现的。是否应用了任何锁定？我在网上查了下没有找到这方面的好资料。任何机构能否提供有关此主题的任何博客/文章。最佳答案对行数据的访问是原子的，包括任意数量的正在读取或写入的列到。不存在跨越多行或跨表。原子访问是这种架构的一个因素严格一致，因为每个并发的读者和作者都可以做出安全的假设关于一行的状态。当数据更新时，它首先写入提交日志，称为预写日志(WAL)在HBase中，然后存储在内存中(按RowId排序)memstore。一旦内存中的数据有超过给

hadoop HBase section strong

hadoop - 在 oozie Java Action 中传递 HBase 凭据

我需要安排一个与安全hbase交互的oozieJava操作，因此我需要为Java操作提供hbase凭据。我使用的是安全的hortonworks2.2环境，我的工作流XML如下${jobTracker}${nameNode}com.test.hbase.TestHBaseSecure${arg1}Javafailed,errormessage[${wf:errorMessage(wf:lastErrorNode())}]我还修改了oozie属性以包含HbaseCredentials类oozie.credentials.credentialclasses=hcat=org.apache.o

凭据传递 gt lt hbase hadoop kerberos oozie hortonworks-data-platform

87 88 899091 92 93