草庐IT

java - 特定表的 hbase-default.xml 中单元格的最大大小

是否可以在hbase-default.xml中为特定表配置单元格的最大大小。如果可能,请告诉我我们配置最大单元格大小的方法列表。Reference:Igotthiserror,java.lang.IllegalArgumentException:**KeyValuesize**toolargeatorg.apache.hadoop.hbase.client.HTable.validatePut(HTable.java:1312)atorg.apache.hadoop.hbase.client.HTable.doPut(HTable.java:941)atorg.apache.hadoo

hadoop - 全分布式配置hadoop/hbase

我是Hbase的新手,我需要在完全分布式模式下对其进行一些实验。我正在使用ubuntu。我想创建一个有两个节点(一个主节点和一个从节点)的集群,根据我的阅读,HBase在Hadoop分布式文件系统下运行,我需要正确配置这两个节点。我尝试按照Internet上的一些教程进行操作,但我无法在分布式模式下正确运行Hbase。我认为问题出在hadoop和hbase配置上。有没有人有全分布式模式运行的Hbase?您能告诉我应该遵循的所有步骤吗?并正确设置hadoop和hbase配置?或者即使有一些更简单的方法来使用Hadoop/HBase... 最佳答案

java - 如何使用 MapReduce 将 CSV 导入 HBASE 表

您好,我是hadoop的新手,我正在尝试使用MapReduce将csv表导入到Hbase。我正在使用hadoop1.2.1和hbase1.1.1我有以下格式的数据:WbanNumber,YearMonthDay,Time,HourlyPrecip03011,20060301,0050,003011,20060301,0150,0我写了下面的批量加载代码publicclassBulkLoadDriverextendsConfiguredimplementsTool{publicstaticvoidmain(String[]args)throwsException{intresult=To

hadoop - 如何获取 HBase 表的 HFile 大小?

我正在尝试获取HBase中HFile的一些指标详细信息。以下是问题。如何获取Hbase表的HFile的实际位置。是否有任何shell命令来获取合并后的文件大小。我理解Hfile存储在HDFS中,所以数据以block的形式存储在不同的数据节点中。但是如何从HBase的角度获取合并后的数据。 最佳答案 Hbase表数据按照你说的存储在hdfs上。hdfs上表数据的默认位置是/hbase/data/default路径。你可以使用hadoopfs-dus/user/hbase/data/*表格总大小的命令。转到hfiles的此路径下的表文件

hadoop - 错误 TableInputFormat : Java. lang.NullPointerException 在 org.Apache.Hadoop.hbase.TableName.valueOf

我正在尝试使用Spark从HBase读取数据。我正在使用的版本是星火1.3.1和Hbase1.1.1。我收到以下错误ERRORTableInputFormat:java.lang.NullPointerExceptionatorg.apache.hadoop.hbase.TableName.valueOf(TableName.java:417)atorg.apache.hadoop.hbase.client.HTable.(HTable.java:159)atorg.apache.hadoop.hbase.mapreduce.TableInputFormat.setConf(Table

apache - 扩展自定义 Apache Knox 服务以查询多个 HBase 表

我目前正致力于扩展ApacheKnox与HDP2.3.2上的HBase交互的功能。我在ApacheKnox上创建了一个名为Decode的新网关,用于查询HBase。解码网关是使用HBase网关作为模板构建的。拓扑已被编辑为以下查询:curl-kuadmin:admin-password-H"Accept:application/json"https://sandbox.hortonworks.com:8443/gateway/default/decode/hbase/MyHBaseTable/HBaseRowKey123*将返回第123行的数据(在Base64中)有没有办法改变Deco

hadoop - 如果你把东西存到HBase里,能直接从HDFS访问吗?

有人告诉我HBase是一个位于HDFS之上的数据库。但是假设您在将一些信息放入HBase之后使用了hadoop。您仍然可以使用mapreduce访问信息吗? 最佳答案 您可以使用mapreduce程序或hive查询或pig脚本读取HBase表的数据。Here是mapreduce的例子Here是Hive的示例。创建Hive表后,您可以在HBase表上运行select查询,这将使用mapreduce处理数据。您甚至可以轻松地将HBase表与其他Hadoop生态系统工具(例如Pig)集成。 关

hadoop - Spark 无法检索特定列中的所有 Hbase 数据

我的Hbase表有3000万条记录,每条记录都有raw:sample列,raw是columnfamilysample是column。这个栏目很大,大小从几KB到50MB不等。当我运行下面的Spark代码时,它只能得到4万条记录,但我应该得到3000万条记录:valconf=HBaseConfiguration.create()conf.set("hbase.zookeeper.quorum","10.1.1.15:2181")conf.set(TableInputFormat.INPUT_TABLE,"sampleData")conf.set(TableInputFormat.SCAN

hadoop - Hbase批量删除最快最有效的方法是什么

批量删除hbase记录最快最有效的方法是什么?Hbase客户端API还是MapReduce作业? 最佳答案 除非您知道要删除的单元格的行键,否则HBase客户端API不允许进行批量删除。可以利用BulkDeleteEndpoint根据扫描器的结果进行批量删除。 关于hadoop-Hbase批量删除最快最有效的方法是什么,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/3602718

hadoop - hadoop + hbase 设置的 docker-compose 问题

我已经为hadoop和hbase设置了docker容器,没有任何问题。我现在正尝试将它们放在一起并使用docker-compose按顺序运行它们。version:'2'services:hadoop:image:hadoop:2.6container_name:hadoop-composeports:-"50070:50070"hbase:image:hbase:0.98container_name:hbase-composeports:-"9000:9000"command:bash-c"while!nc-v-z-w3172.17.0.250070;doechowaitingforh