草庐IT

hbase-unsecure

全部标签

python - 从 REST API 获取数据并将其存储在 HDFS/HBase 中

我是大数据的新手。我了解到HDFS更多的是存储结构化数据,HBase更多的是存储非结构化数据。我有一个RESTAPI,我需要在其中获取数据并将其加载到数据仓库(HDFS/HBase)中。数据为JSON格式。那么将数据加载到哪个更好呢?HDFS还是HBase?你也可以请你指导我一些教程来做到这一点。我遇到了关于TutorialwithStreamingData的问题.但我不确定这是否适合我的用例。如果你能指导我使用特定的资源/技术来解决这个问题,那将是非常有帮助的。 最佳答案 有几个问题你要思考您想使用批处理文件还是流媒体?这取决于请

hadoop - 如何使用 Hbase 1.2.6 编译 Nutch 2.3.1

我必须使用Nutch2.3.1设置hadoop堆栈。hadoop2.7.4支持的Hbase版本是1.2.6,我已经配置并测试成功。但是当我编译Nutch时,我得到了关注并抓取了一个示例页面,我得到了这个错误。/usr/local/nutch/runtime/local/bin/nutchinjecturls/-crawlIdkicsInjectorJob:startingat2017-09-2114:20:10InjectorJob:InjectingurlDir:urlsExceptioninthread"main"java.lang.NoSuchFieldError:HBASE_C

hadoop - 为什么 HBase 支持的 Hive 表使用 MapReduce

我在我的项目中使用Hbase支持的Hive表,但我们选择Hbase支持的Hive的原因是为了执行更新。除此之外,Hbase支持的Hive表还有哪些其他优点。因为它在从Hive查询时仍然使用MapReduce。即使我们需要少量数据并且由于表很大,也需要时间来给出结果。但是,如果我们在Hbaseshell上执行带范围扫描或仅在Hbase中获取结果,则只需几分之一秒。那么除了更新(现在在HIVE中也可用)和SQL易用性之外,使用Hbase支持的Hive表还有哪些其他优势。如果HIVE由Hbase支持,它如何评估和运行查询?为什么它使用MapReduce扫描并给出结果而不是更快的Hbase引擎

scala - 由 : java. lang.ClassNotFoundException : org. apache.hadoop.hbase.HBaseConfiguration 引起

我正在尝试在Hbase上(在指定的集群上)创建一个表,我尝试了以下代码:importorg.apache.hadoop.hbase.client.{HTable,Put,HBaseAdmin}importorg.apache.hadoop.hbase.util.Bytesimportorg.apache.hadoop.hbase.mapreduce.TableInputFormatimportorg.apache.hadoop.hbase.{HBaseConfiguration,HTableDescriptor,HColumnDescriptor}objectImportData{va

java - 如何仅使用它们的键来获取 HBase 行?

我有一个非常基础的问题,但我是HBase的新手。我想仅使用行键获取一行(例如[]byte)。我正在查看Get对象,但构造函数需要整行:https://hbase.apache.org/apidocs/org/apache/hadoop/hbase/client/Get.html它表示“要获取一行的所有内容,请使用要获取的行实例化一个Get对象。要进一步缩小要获取的内容的范围,请使用以下方法。”更具体地说,我正在尝试使用HRegionLocator.getStartEndKeys()的输出来获取整行。 最佳答案 您可以为此使用org.

hadoop - 如何查找hbase表的创建日期

有没有办法找到HBase表的创建日期或时间戳。我们有desc在Hive这将提供表创建信息。我很好奇有没有什么HBase命令可以获取元数据信息?describe'table'不提供任何时间或日期信息。 最佳答案 Hbase数据位于HDFS中,没有直接的方法可以做到这一点。检查hbase.rootdir并运行hadoopfs-ls-R|grepyourtable查看何时创建或修改(时间戳)。 关于hadoop-如何查找hbase表的创建日期,我们在StackOverflow上找到一个类似的问

hadoop - 如何中止/回滚 HBase 待处理程序?

我有一个待处理的HBase程序列表。我想回滚所有这一切。我怎样才能做到这一点?list_procedure命令的输出-PIDNameStateSubmittedLast_UpdateParameters7org.apache.hadoop.hbase.master.procedure.CreateTableProcedureWAITING2019-02-2720:16:51+05302019-02-2720:16:51+0530[{"state"=>[1,2,3,4,5]},{"userInfo"=>{"effectiveUser"=>"hadoop"},"tableSchema"=>

java - 如何创建 2+ HBase 表?

我正在尝试创建2个HBase表,但遇到了一些问题。这是我到目前为止所拥有的。表未正确创建。我能在网上找到的唯一教程和帮助是关于创建一个HBase表而不是2个以上的HBase表。更新:我使用的是HortonWorksSandboxHDP2.3.2。我不确定如何在不调用表描述符表两次来创建假期表和组表的情况下创建2个表我使用的教程是:https://www.tutorialspoint.com/hbase/hbase_create_table.htm公共(public)类TableCreation{publicstaticvoidmain(String[]args)throwsIOExce

hadoop - 构建 Impala 是否依赖于 Hive、HBase 和 Sentry?

我有一个Hadoop集群,有一个主节点和3个从节点。现在,我想在此集群上添加ApacheImpala功能。我已经从here下载了tarball.我想构建Impala,但不确定先决条件是什么。有两个不同的来源:This,来自文档,其中说要求是:MySQL(或PostgreSQL)、Hivemetastore和Java依赖项(很明显)。apache-impala目录中的README.md文件在解压tar包后创建。引用它:Impalacanbebuiltwithpre-builtcomponents,downloadedfromS3,orcanbebuiltwithanin-placetoo

hadoop - HBase 1.4.9 创建表失败

我想创建一个Demo表,例如,命名为Teacher,并指定该表可以存储的版本数,我这样写语句:hbase(main):052:0>create'Teacher',{NAME=>'username',VERSIONS=>2}Anargumentignored(unknownoroverridden):usernameAnargumentignored(unknownoroverridden):VERSIONSERROR:Tablemusthaveatleastonecolumnfamily但是我得到了如上的错误,我不知道如何解决这个问题,你能给我一些指示吗?