草庐IT

HBASE_CLASSPATH

全部标签

hadoop - 在分布式 Hadoop 上设置 HBase 时出错,ZooKeeperServer 未运行

我正在尝试在Hadoop上设置HBase,并且一直在关注MichaelG.Noll提供的各种很棒的在线教程。和here.基本上一切都很好,我的Hdfs和MapRed在Web界面上运行良好,它显示我有2个节点(我的NameNode既是NameNode又是DataNode,但这只是为了测试目的)。当我开始安装HBase时,我遇到了问题,我遇到了很多不同的错误。最新的一个在我的从节点的日志文件上INFOorg.apache.zookeeper.server.NIOServerCnxn:Closedsocketconnectionforclient/10.2.xx.xx:43089(noses

hadoop - 如何使用 MAP-REDUCE java 程序将 HBASE 表加载到 HDFS

如何编写一个MAP-REDUCEjava程序来将任何表从HBASE加载到HDFS中?而不是使用下面的命令,我如何使用MAP-REDUCEjava程序编写一个TRANSFORMATION,它将从HBASE导出任何表并加载到HDFS??bin/hbaseorg.apache.hadoop.hbase.mapreduce.Driverexporthdfs://user/etc*** 最佳答案 查看codeoftheExporthbase自带的函数 关于hadoop-如何使用MAP-REDUCE

hadoop - 在hbase中写入数据

我在hbase中写入数据时遇到问题。我有4个区域服务器。当我写入数据并使用随secret钥时,数据写入任何区域,但它们在一个区域服务器中。一个服务器忙,三个服务器空闲.如何在所有区域服务器中写入正则性。 最佳答案 HBase跨区域服务器对其表进行分区。见:HowHBasepartitionstableacrossregionservers?http://www.larsgeorge.com/2009/10/hbase-architecture-101-storage.html我不确定你的随secret钥应该有多随机或多远才能写入不同

hadoop - HBase 中的 WAL 文件

在HBase中写入memstore数据之前会先写入WAL,但是当我检查我的系统时WAL文件不会在每次Put操作后立即更新,更新需要很长时间。需要设置什么参数吗?(WAL已启用) 最佳答案 您知道更新WAL文件需要多长时间吗?您确定时间是写入时间还是在您检查WAL时,它已经移至旧日志。如果启用了WAL,则所有条目必须首先进入WAL,然后按照集群配置写入特定区域。我知道WAL文件被移动到.oldlogs相当快,即通过hbase.master.logcleaner.ttl设置在hbase-site.xml中定义的60秒。

java - 获取区域开始键和结束键-HBase

我有hbase0.94.0。我正在尝试检索所有区域的StartKey和EndKey。我使用以下代码获取hbase中的区域。MetaScannerms=newMetaScanner();System.out.println("Regionof.META."+ms.listAllRegions(config));它产生了以下输出。Regionof.META.[{NAME=>'Student9,,1364452609604.9955bddb298229d6b9fa749dfa7d6b40.',STARTKEY=>'',ENDKEY=>'0011000',ENCODED=>9955bddb29

hadoop - Hbase 分布式模式可以使用本地文件系统代替DFS吗?

我有独立模式下的工作hbase实例。我计划将其迁移到分布式模式(3台机器组成的集群)。我的问题是我可以从独立模式迁移到分布式模式而不丢失独立模式的数据吗?还有分布式模式使用HDFS有必要吗? 最佳答案 (H)adoop(D)分布式(F)文件(S)系统。这是促进分布式Hbase的东西。如果您使用nativeFS,它将不再分发。所以,这不是一个选择。分布式意味着存储(连同计算)分布在所有参与的机器上,这与nativeFS所做的相反。关于您的第一个问题,您可以这样做。从独立模式迁移到分布式模式应该只是从本地磁盘复制到HDFS的问题。自己确

hadoop - pig HBASE 失败;存储 CSV

我从环境Hadoop、HBase、Pig开始;我会将数据库存储在Hbase表上;这是我的要求:hbase->创造创建我的数据库。我在HDFS文件上重新启动了我的CVS文件hadoopdfs-copyFromLocal~/data.csv/user/hduser/location.csv我执行了我的请求PIGraw_data=LOAD'/user/hduser/data.csv'USINGPigStorage(';')AS(世界气象组织:国际,成熟度:charArray,温度:整数,temps_present:整数,direction_du_vent:整数,force_du_vent:整

hadoop - 我应该在什么时候以及在哪个目录中设置 hbase-env.sh 中的 HBASE_CLASSPATH 属性?

我在hbase-env.sh中设置配置,按照一些博客的一些教程在伪分布式模式下设置hbase,我想知道为什么有些人建议设置hbase-env.sh中的HBASE_CLASSPATH属性,而其他人没有,我也很困惑我应该给它什么路径 最佳答案 HBASE_CLASSPATH应该是您希望与HBase一起使用的jar的路径。例如,如果您编写了自定义HBase过滤器,那么为了使其可用并在您的应用程序中使用它,您需要取消注释并编辑hbase-env.sh中的HBASE_CLASSPATH以将其指向包含过滤器的jar。恕我直言,如果您打算只使用H

hadoop - 从 hdfs 读取数据并将其存储到 hbase?

我有表格中的数据:source,destination,connection这个数据保存在hdfs中我想读取这些数据并将其放入hbase表中,如下所示:Column1(source)|Column2(Destination)|Column3(ConnectionType)RowvertexA|vertexB|connection我该怎么做?谢谢 最佳答案 引用LoadingcsvdataintoHbase.他们使用逗号分隔值,但您可以将其更改为使用空格 关于hadoop-从hdfs读取数

hadoop - Hbase重写异常

这个异常是在HBase中引发的,当有大量写入时集群:WARNorg.apache.hadoop.ipc.HBaseServer:IPCServerlisteneron60020:readAndProcessthrewexceptionjava.io.IOException:Connectionresetbypeer.Countofbytesread:0java.io.IOException:Connectionresetbypeeratsun.nio.ch.FileDispatcher.read0(NativeMethod)atsun.nio.ch.SocketDispatcher.r