草庐IT

HBASE_CLASSPATH

全部标签

hadoop - 如何中止/回滚 HBase 待处理程序?

我有一个待处理的HBase程序列表。我想回滚所有这一切。我怎样才能做到这一点?list_procedure命令的输出-PIDNameStateSubmittedLast_UpdateParameters7org.apache.hadoop.hbase.master.procedure.CreateTableProcedureWAITING2019-02-2720:16:51+05302019-02-2720:16:51+0530[{"state"=>[1,2,3,4,5]},{"userInfo"=>{"effectiveUser"=>"hadoop"},"tableSchema"=>

java - 如何创建 2+ HBase 表?

我正在尝试创建2个HBase表,但遇到了一些问题。这是我到目前为止所拥有的。表未正确创建。我能在网上找到的唯一教程和帮助是关于创建一个HBase表而不是2个以上的HBase表。更新:我使用的是HortonWorksSandboxHDP2.3.2。我不确定如何在不调用表描述符表两次来创建假期表和组表的情况下创建2个表我使用的教程是:https://www.tutorialspoint.com/hbase/hbase_create_table.htm公共(public)类TableCreation{publicstaticvoidmain(String[]args)throwsIOExce

hadoop - 构建 Impala 是否依赖于 Hive、HBase 和 Sentry?

我有一个Hadoop集群,有一个主节点和3个从节点。现在,我想在此集群上添加ApacheImpala功能。我已经从here下载了tarball.我想构建Impala,但不确定先决条件是什么。有两个不同的来源:This,来自文档,其中说要求是:MySQL(或PostgreSQL)、Hivemetastore和Java依赖项(很明显)。apache-impala目录中的README.md文件在解压tar包后创建。引用它:Impalacanbebuiltwithpre-builtcomponents,downloadedfromS3,orcanbebuiltwithanin-placetoo

hadoop - HBase 1.4.9 创建表失败

我想创建一个Demo表,例如,命名为Teacher,并指定该表可以存储的版本数,我这样写语句:hbase(main):052:0>create'Teacher',{NAME=>'username',VERSIONS=>2}Anargumentignored(unknownoroverridden):usernameAnargumentignored(unknownoroverridden):VERSIONSERROR:Tablemusthaveatleastonecolumnfamily但是我得到了如上的错误,我不知道如何解决这个问题,你能给我一些指示吗?

hadoop - HBase 中的数据读取是如何发生的?

我们知道HBase部署在Hadoop和HDFS之上。此外,我们知道当我们想要从HDFS读取文件(或记录)时,使用HDFSCLI需要花费大量时间。但即使HBase使用HDFS,它也能够在几毫秒内读取key。这是怎么发生的? 最佳答案 我认为原因包括:数据被拆分到不同的区域服务器。客户端可以得到META表中的区域服务器,并直接与HBase区域服务器通信。区域服务器与HDFS数据节点并置,这使得数据局部性(将数据放在需要的地方)区域服务器提供的数据。一个HFile包含一个多层索引,它允许HBase查找无需读取整个文件即可访问数据。HBas

hadoop - 从 Hbase 同步数据到 Hive

我们正在开展一个项目,我们使用HBase作为操作数据存储;所有数据都实时进入hbase。并且每隔2小时,Hbase中的数据需要同步到Hive中。这是为了使分析查询能够在最新数据之上运行。从Hbase同步数据到Hive:对于仅插入/更新的场景,我可以使用hbase提供的时间戳列来了解插入/更新的记录。对于“DELETE”场景,我正在努力寻找正确的方法。HBaseScanAPI是否提供任何选项来做到这一点?或者我应该使用ApachePhoenix等任何SQL选项来做同样的事情吗? 最佳答案 这是HBase引用指南第KeepDeleted

hadoop - 如何使用 Hbase rest API 将数据从 IBM db2 导入到 Hbase

实际上我们的需求是使用HbaserestAPI将数据从IBMdb2导入到hbase。任何人都可以向我提供详细信息或步骤。提前致谢。 最佳答案 你可以试试sqoop-hbaseimport 关于hadoop-如何使用HbaserestAPI将数据从IBMdb2导入到Hbase,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/57292350/

hadoop - 在hbase中导出表

开始导出作业后,即:hadoopjar/path/to/hbase-0.20.3.jarexportyour_table/export/your_table是否包含记录的所有版本?或者您必须明确指定,即hadoopjar/path/to/hbase-0.20.3.jarexportyour_table/export/your_table3以这个语法为例:Export[[[]]] 最佳答案 默认情况下-仅导出最新版本的记录。您可以选择指定要导出的最大版本数以及时间范围。看这里http://javasourcecode.org/html

hadoop - 将 PIG 中的一些字段存储到 Hbase 中

我正在尝试提取字符串的某些部分并将其存储到列中的hbase。文件内容:msgType1PersonxyzhasopenedInternet:www.google.comfromIP:192.123.123.123forduration00:15:00msgType2PersonxyzdeniedforopeningInternet:202.x.x.xfromIP:192.123.123.123reason:unautheticatedmsgType1PersonxyzhasopenedInternet:202.x.x.xfromIP:192.123.123.123forduration

hadoop - HBase 和 Hadoop

根据我目前阅读的内容,HBase需要安装Hadoop。看起来HBase可以设置为使用现有的Hadoop集群(与其他一些用户共享)还是可以设置为使用专用的Hadoop集群?我想后者会是一个更安全的配置,但我想知道是否有人对前者有任何经验(但我不太确定我对HBase设置的理解是否正确)。 最佳答案 我知道Facebook和其他大型组织出于性能原因将其HBase集群(实时访问)与其Hadoop集群(批处理分析)分开。集群上的大型MapReduce作业有能力影响实时接口(interface)的性能,这可能会产生问题。在较小的组织或HBase