hbase-default

Hadoop MapReduce : default number of mappers

如果我不指定映射器的数量，如何确定该数量？是否有从配置文件(例如mapred-site.xml)中读取的默认设置？最佳答案在Chris上面添加的内容上添加更多内容:映射的数量通常由输入文件中的DFSblock数量决定。虽然这会导致人们调整他们的DFSblock大小来调整map的数量。map的正确并行级别似乎是大约10-100个map/节点，尽管对于非常cpu-lightmaptask，这可以达到300左右。任务设置需要一段时间，因此最好至少花一分钟时间执行map。您可以通过修改JobConf的conf.setNumMapTask

java - 在 HBase 中将 bytes[] 转换为字符串

我将以下行存储在HBase表中DIEp(^o^)q3column=DIE:ID,timestamp=1346194191174,value=\x00\x00\x00\x01我正在尝试访问该值并将其转换为其字符串表示形式，该表示形式应为1，但是当我cat时我没有得到正确的字符串表示形式文件(我的输出被重定向到的地方)cat/hadoop/logs/userlogs/job_201209121654_0027/attempt_201209121654_0027_m_000000_0/stdout我得到了类似这样的垃圾NULNULNULSOH下面是我正在使用的代码片段。byte[]resul

HBase bytes code section pre java hadoop byte

java - 为什么 HBase 将值存储为字节数组而不是类型值(如 String、Long 等)

当我使用HBase时，我花了很多时间将字节数组转换为String或Long等类型。为什么HBase将值存储为字节数组而不是类型值？最佳答案我不认为“Hbase将所有内容都存储为byte[]因为BigTable确实如此”实际上是一个令人满意的答案。我的2美分:它使我们能够毫不费力地存储任何类型的数据。例如，假设您必须将与产品相关的数据存储到您的hbase表中，比如ID、制造商、国家/地区、价格等。要存储这些参数中的每一个，您必须提前处理每个参数的单独数据类型这肯定会增加一些开销。与RDBMS不同，hbase在创建表时不会要求所有这

String HBase section stackoverflow java hadoop

用于安全 Hbase 的 Java 客户端

您好，我正在尝试为安全的hbase编写一个Java客户端。我也想从代码本身做kinit因为我正在使用用户组信息类。谁能指出我哪里出错了？这是我尝试连接ohbase的主要方法。我必须在CONfiguration对象中添加配置而不是使用xml，因为客户端可以位于任何地方。请看下面的代码:publicstaticvoidmain(String[]args){try{System.setProperty(CommonConstants.KRB_REALM,ConfigUtil.getProperty(CommonConstants.HADOOP_CONF,"krb.realm"));Syste

Hbase Java 34 config security hadoop kerberos

rest - 如何列出 hbase 表中的所有行键？

如何列出hbase表中的所有行键？我需要使用带有REST接口(interface)的PHP来执行此操作。最佳答案如果您列出HBase表中的所有键，那么您使用了错误的工具。HBase适用于无法列出所有键的大型数据系统。可能更明智的做法是从给定键开始并列出接下来的N个键(对于N小于10K的值)。有很好的Java接口(interface)可以通过扫描来完成这种类型的事情——设置开始键和/或结束键。大多数HBase功能都是通过Thrift接口(interface)公开的。我建议去那里看看关

hbase rest section interface stackoverflow hadoop stargate

java - 无法使用 Hbase 连接到远程服务器

我是Hadoop和Hbase的新手。我正在尝试从java代码创建一个表并连接到我的远程服务器(Hbase)，它是(172.80.72.86)。它是一台Linux机器(172.80.72.86)。我试过上面的我收到以下错误12/08/2214:06:49INFOzookeeper.ZooKeeper:Clientenvironment:zookeeper.version=3.3.5-1301095,builton03/15/201219:48GMT12/08/2214:06:49INFOzookeeper.ZooKeeper:Clientenvironment:host.name=use

Hbase java zookeeper apache hadoop mapreduce

java - HBase:Zookeeper 告诉远程客户端连接到本地主机

这里是HBase/Hadoop的super新手。我启动并运行了一个双节点HBase测试集群，现在我正尝试从远程Java客户端连接到该集群。这是我卡住的地方:客户端成功连接到单服务器Zookeeperquorum(与HBasemaster在同一台服务器上运行)，但是Zookeeper传回给客户端的地址是localhost，并且(显然)客户端失败连接到任何东西，因为HBase没有在本地运行。考虑到出于管理原因我无法编辑客户端主机文件(无论如何我都不愿意这样做，因为这看起来像是一个糟糕的hack)，有没有办法让Zookeeper为HBase主服务器？Java代码:publicstaticfi

Zookeeper HBase apache java networking hadoop apache-zookeeper

java - 尝试运行 HBase map reduce 时出错

我真的很难在Hadoop上运行Hbase-MapReduce。我确实使用HadoopHortonwork2版本。我使用的HBase版本是0.96.1-hadoop2。现在，当我尝试像这样运行我的MapReduce时:hadoopjartarget/invoice-aggregation-0.1.jarstart="2014-02-0101:00:00"end="2014-02-1901:00:00"firstAccountId=0lastAccountId=10Hadoop告诉我在其文件系统中找不到invoice-aggregation-0.1.jar？!我想知道为什么它需要在那里？这

时出试运 java hadoop apache mapreduce hbase

Java - HBase 客户端停留在 session 建立完成

我正在尝试连接到远程HBase集群以检索数据，但客户端一直在同一个地方挂起:15/02/1111:32:58INFOzookeeper.ZooKeeper:Clientenvironment:zookeeper.version=3.4.5-1392090,builton09/30/201217:52GMT15/02/1111:32:58INFOzookeeper.ZooKeeper:Clientenvironment:host.name=rap-es-1.hidden.host.com15/02/1111:32:58INFOzookeeper.ZooKeeper:Clientenvir

session HBase zookeeper environment java maven hadoop apache-zookeeper

hadoop - 如何使用 HBase 和 Hadoop 为实时流量提供服务并执行分析？ (单个集群还是单独的集群？)

我们的主要目的是使用Hadoop进行分析。在此用例中，我们进行批处理，因此吞吐量比延迟更重要，这意味着HBase不一定是合适的(尽管更接近实时分析听起来确实很有吸引力)。我们正在尝试使用Hive，到目前为止我们很喜欢它。虽然分析是我们在不久的将来希望使用Hadoop做的主要事情，但我们也希望有可能将我们的部分操作迁移到HBase并从中提供实时流量。将存储在那里的数据与我们在分析中使用的数据相同，我想知道我们是否可以只拥有一个系统来同时进行实时流量和分析。我阅读了很多报告，似乎大多数组织都选择使用单独的集群来提供流量和分析。出于稳定性目的，这似乎是一个合理的选择，因为我们计划让很多人编写

hadoop section HBase analytics live cluster-computing

207 208 209210211 212 213