草庐IT

hbase-shell

全部标签

Shell超时不会停止CloudFoundry App-nozzle,仍然有新的输出

我想运行CloudFoundryApp-nozzle命令10秒钟,以收集有关应用程序的一些指标。即使我停止命令,之后输出文件中仍然有新的输出。我不知道发生了什么。我的命令(将在脚本中运行):timeout10scfapp-nozzlemy_app--filterContainerMetric>CF_nozzle.txt看来它停止并在gitbash中退出,即使几分钟后,我可以运行其他脚本。我关闭了整个窗口,它仍在进行中。更新:我仅在CLI中尝试过它,超时后,它甚至在命令行中仍然删除数据。看答案看来这可能是WindowsGitBash中的错误。同一命令在Ubuntu终端效果很好。

hadoop - 将 Pig 与 Hbase 集成

我在linux上安装了hadoop-2.5.0、pig0.13.0和HBase0.98.6.1。尝试运行简单的pig脚本时,出现错误2014-10-1416:01:54,891[main]ERRORorg.apache.pig.tools.grunt.Grunt-ERROR2998:Unhandledinternalerror.org.apache.hadoop.hbase.util.Bytes.equals([BLjava/nio/ByteBuffer;)ZDetailsatlogfile:/home/labuser/pig_1413279561970.log粘贴下面的日志...Pi

hadoop - 三节点hadoop集群中的Hbase安装

我已经安装了我的hadoop三节点集群(master、slave1和slave2)。我想安装Hbase完全分布式模式。我想在我的hadoop集群MASTER机器(即Namenode)中安装HBaseMaster和Zookeepr,并在SLAVE1和SLAVE2(即Datanodes)机器中安装区域服务器。这是正确的做法吗?抱歉,这可能是一个简单的问题,但我是NoSQL系统的新手,想进行此安装。如果有人能够分享安装的任何引用文档,我真的很感激。提前致谢。 最佳答案 为了在三个节点上配置hbase和zookeeper,即1master和

linux - 像 "hadoop fs -ls"这样的 hadoop shell 命令是如何工作的?

我想知道hadoop编译器如何解释像“hadoopfs-ls”这样的hadoopshell命令?当我输入“hadoopfs-ls/user/hadoop/someDirName”时后台会发生什么如果我想创建自己的shell命令,我该怎么做?提前致谢。如果有人可以分享带有示例的源代码链接,我将不胜感激。 最佳答案 每个hadoop命令都在内部调用一个java实用程序来进行进一步的操作。org.apache.hadoop.fs.FsShell提供对文件系统的命令行访问。hadoopfs-ls内部调用上述包中的相应方法。注意hadoopf

linux - 我是否需要在 Windows 中使用 Hadoop 来连接在 Linux 上运行的 hbase?

我是否需要在我的Windows中使用Hadoop来使用hadoop连接在ununtu上运行的hbase?我的hbase在我的ubuntu机器上运行良好。我可以在同一台机器上连接eclipse(我正在使用kundera连接hbase)。现在我想从我的windows7eclipseIDE连接hbase。我需要在我的Windows上安装hadoop来连接ubuntu上的远程hbase吗??当我尝试时,我得到了这样的东西FailedtolocatethewinutilsbinaryinthehadoopbinarypathReadaboutopen-sourcetechnology.IOExc

hadoop - 有人可以建议 HBase 架构点击流数据吗

我想使用HBase创建一个点击流应用程序,在sql中这将是一个非常简单的任务,但在Hbase中我还没有得到第一条线索。有人可以建议我在HBase中使用的架构设计和key。我提供了一个粗略的数据模型和几个我想查询数据的问题。关于访问数据我想问的问题哪些事件导致了转化?最后一页是什么/浏览了多少页?客户离开了哪些页面?20-30岁的男性顾客喜欢买什么产品?客户购买了产品x也可能购买产品y?第一页的转化量?{PageViews:[{date:"1970010100:00",domain:"http://foobar.com",path:"pageOne.html",timeOnPage:"1

hadoop - HBase 和 Hive 需要放在同一台机器上吗?

我们目前正在构建一个新的hbase集群。架构如下:现在我想添加一个新的Hive集群。但是不知道要不要和hbase在同一个hadoop集群上搭建hive。还是应该为hive构建一个新的hadoop集群?如果我为hive新建一个hadoop集群,执行sql聚合hbase的数据时,hive和hbase之间的流量会不会太大(AFAIK,hive需要将hbase上的数据导入到自己的hdfs存储中)? 最佳答案 让我们首先定义HBase和Hive之间的流量是多少。在每个Hive查询中,您将:使用Hive直接查询HBase使用Hive执行Ware

hadoop - NiFi 或 Streamsets 从 HBase 读取,加入平面文件中的内容并写入 Hive

试图弄清楚是否可以使用apacheNiFi或Streamsets实现连接。这样我就可以定期从HBase读取数据,与其他表连接并将少量字段写入Hive表。或者有没有其他工作流管理器工具支持这个操作? 最佳答案 我不熟悉Streamsets,但我会尽力帮助NiFi。您的平面文件是静态的吗?如果是这样,您是否希望直接替换值?您应该能够使用ReplaceTextWithMapping处理器。如果不是直接替换,您可以预填充DistributedMapCache使用平面文件中的值,然后使用FetchDistributedMapCache对HBa

java - InvalidInputException 将文件加载到 Hbase MapReduce 时

我是Hadoop和MapReduce的新手。对于起始基地,我执行了字数统计程序。它执行得很好,但是当我尝试将csv文件运行到Htable时,我遵循了[Csv文件][1]它让我陷入了我不知道的错误,请任何人帮助我了解上述错误12/09/0705:47:31ERRORsecurity.UserGroupInformation:PriviledgedActionExceptionas:hdusercause:org.apache.hadoop.mapreduce.lib.input.InvalidInputException:Inputpath[1]:http://salsahpc.indi

hadoop - 通过 PIG 加载多个 hbase 表限定符

我有一个名为USERS的hbase表,其列族名称为USER_INFO。USER_INFO有两个限定符EMAIL、AGE。当我尝试通过PIG加载单个限定符值时,它成功了。使用命令:R=LOAD'USERS'USINGorg.apache.pig.backend.hadoop.hbase.HBaseStorage('USER_INFO:EMAIL','-loadKey')AS(key:chararray,EMAIL:chararray);dumpR;但我无法使用这两个限定符加载表格。即电子邮件、年龄。我试过这个:S=LOAD'USERS'USINGorg.apache.pig.backen