草庐IT

HBASE_CLASSPATH

全部标签

java - hadoop java.net.URISyntaxException : Relative path in absolute URI: rsrc:hbase-common-0. 98.1-hadoop2.jar

我有一个连接到HBASE的mapreduce作业,但我不知道我在哪里遇到了这个错误:Exceptioninthread"main"java.lang.reflect.InvocationTargetExceptionatsun.reflect.NativeMethodAccessorImpl.invoke0(NativeMethod)atsun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:57)atsun.reflect.DelegatingMethodAccessorImpl.invoke

hadoop - HBASE 0.94.1 与 hadoop 的兼容性

我是HBASE和HADOOP的新手,需要可用的兼容版本的hbase和hadoop才能运行我的实验。“http://apache.techartifact.com/mirror/hbase/”的当前稳定版本是hbase-0.94.1。任何人都可以告诉我应该使用哪个版本的hadoop以便没有兼容性问题,future不会丢失数据。请从当前在线提供的hadoop和hbase版本中提出建议。下面是我用来下载这些版本的网站http://apache.techartifact.com/mirror/hadoop/common/(hadoop)http://apache.techartifact.co

hadoop - 我如何从一个 HBase 实例读取但写入另一个实例?

目前我有两个Hbase表(我们称它们为tableA和tableB)。使用单阶段MapReduce作业,tableA中的数据被读取处理并保存到tableB。目前这两个表驻留在同一个HBase集群中。但是,我需要将tableB重新定位到它的集群上。是否可以在Hadoop中配置单阶段mapreduce作业以从不同的HBase实例读取和写入? 最佳答案 有可能,HBase的CopyTableMapReducejob通过使用TableMapReduceUtil.initTableReducerJob()来实现这允许您设置一个替代的quorum

hadoop - HBase region server和Hadoop数据节点应该在同一台机器上吗?

抱歉,我没有资源来设置集群来测试它,我只是想知道:我可以在hadoop数据节点机器以外的单独机器上部署hbase区域服务器吗?我想答案是肯定的,但我不确定。hbaseregionserver和hadoopdatanode部署在不同的机器上好还是不好?当将一些数据放入hbase时,这些数据最终存储在什么地方,数据节点还是区域服务器?我猜是datanode,但是regionserver里面的StoreFile和HFile是什么东西,不就是存放我们数据的物理文件吗?谢谢! 最佳答案 如果您想要良好的性能,RegionServers应该始终

implementation - Hadoop MR source : HDFS vs HBase. 各有什么好处?

如果我正确理解Hadoop生态系统,我可以运行我的MapReduce作业,从HDFS或HBase获取数据。假设之前的假设是正确的,我为什么要选择一个而不是另一个?使用HBase作为MR源在性能、可靠性、成本或易用性方面是否有优势?我能找到的最好的引用是这句话,“HBase是当您需要对非常大的数据集进行实时读/写随机访问时使用的Hadoop应用程序。”-TomWhite(2009)Hadoop:权威指南,第1版 最佳答案 在HDFS上直接使用HadoopMap/Reduce,您的输入和输出通常存储为平面文本文件或HadoopSeque

hadoop - Hbase:如何为 Hbase master 指定主机名

我正在努力设置一个具有2个节点的Hbase分布式集群,一个是我的机器,一个是VM,使用VirtualBox中的“host-only”适配器。我的问题是区域服务器(来自VM机器)无法连接到主机上运行的Hbasemaster。尽管在Hbaseshell中我可以在VM机器('slave')上的区域服务器中列出,创建表,......,日志总是显示org.apache.hadoop.hbase.regionserver.HRegionServer:Unabletoconnecttomaster.Retrying.Errorwas:java.net.ConnectException:Connect

sql - HBase 中的高级查询

给定以下HBase模式场景(fromtheofficialFAQ)...HowwouldyoudesignanHbasetableformany-to-manyassociationbetweentwoentities,forexampleStudentandCourse?Iwoulddefinetwotables:Student:studentidstudentdata(name,address,...)courses(usecourseidsascolumnqualifiershere)Course:courseidcoursedata(name,syllabus,...)stud

java - 来自 hbase/文件系统的 hadoop namenode 连接中的 EOF 异常是什么意思?

这既是关于javaEOF异常的一般问题,也是Hadoop的EOF异常,它与jar互操作性有关。可以接受关于任一主题的评论和答案。背景我注意到一些线程讨论了一个神秘的异常,它最终是由“readInt”方法引起的。此异常似乎具有一些独立于hadoop的通用含义,但最终是由Hadoopjar的互操作性引起的。就我而言,当我尝试在Java中的hadoop中创建一个新的FileSystem对象时,我得到了它。问题我的问题是:发生了什么以及为什么读取整数会引发EOF异常?这个EOF异常指的是什么"file",如果两个jar不能互操作,为什么会抛出这样的异常?其次,我还想知道如何修复此错误,以便我可

hadoop - HBase连接异常

我尝试以伪分布式模式运行HBase。但是我设置hbase-site.xml后就不行了。每次我尝试在hbaseshell中运行命令时,我都会收到此错误:ERROR:org.apache.hadoop.hbase.ZooKeeperConnectionException:org.apache.hadoop.hbase.ZooKeeperConnectionException:org.apache.zookeeper.KeeperException$ConnectionLossException:KeeperErrorCode=connectionLossfor/hbase我设置了ssh并确

database - HBase如何保证行级原子性?

考虑到HBase将每个列族存储在一个单独的HFile中以及一行可以跨越许多列族的事实。HBase如何确保跨多个列族的行上的放置/删除操作确实是原子的? 最佳答案 所有对一行的写入,无论该行中可能有多少列族,都转到一个区域服务器,然后该区域服务器将编辑写入区域WAL(Hlog),然后写入同步,然后将数据添加到memstore以便提供服务。然后-一旦memstore达到其限制-将memstore刷新到磁盘。如果区域服务器出现任何问题并且它崩溃/死机/插头被拔掉,则可以运行WAL以保持一切一致。有关更多详细信息,请参阅HBASE-2283