hbase-shell_草庐IT

Shell超时不会停止CloudFoundry App-nozzle，仍然有新的输出

我想运行CloudFoundryApp-nozzle命令10秒钟，以收集有关应用程序的一些指标。即使我停止命令，之后输出文件中仍然有新的输出。我不知道发生了什么。我的命令（将在脚本中运行）：timeout10scfapp-nozzlemy_app--filterContainerMetric>CF_nozzle.txt看来它停止并在gitbash中退出，即使几分钟后，我可以运行其他脚本。我关闭了整个窗口，它仍在进行中。更新：我仅在CLI中尝试过它，超时后，它甚至在命令行中仍然删除数据。看答案看来这可能是WindowsGitBash中的错误。同一命令在Ubuntu终端效果很好。

hadoop - 将 Pig 与 Hbase 集成

我在linux上安装了hadoop-2.5.0、pig0.13.0和HBase0.98.6.1。尝试运行简单的pig脚本时，出现错误2014-10-1416:01:54,891[main]ERRORorg.apache.pig.tools.grunt.Grunt-ERROR2998:Unhandledinternalerror.org.apache.hadoop.hbase.util.Bytes.equals([BLjava/nio/ByteBuffer;)ZDetailsatlogfile:/home/labuser/pig_1413279561970.log粘贴下面的日志...Pi

hadoop - 三节点hadoop集群中的Hbase安装

我已经安装了我的hadoop三节点集群(master、slave1和slave2)。我想安装Hbase完全分布式模式。我想在我的hadoop集群MASTER机器(即Namenode)中安装HBaseMaster和Zookeepr，并在SLAVE1和SLAVE2(即Datanodes)机器中安装区域服务器。这是正确的做法吗？抱歉，这可能是一个简单的问题，但我是NoSQL系统的新手，想进行此安装。如果有人能够分享安装的任何引用文档，我真的很感激。提前致谢。最佳答案为了在三个节点上配置hbase和zookeeper，即1master和

linux - 像 "hadoop fs -ls"这样的 hadoop shell 命令是如何工作的？

我想知道hadoop编译器如何解释像“hadoopfs-ls”这样的hadoopshell命令？当我输入“hadoopfs-ls/user/hadoop/someDirName”时后台会发生什么如果我想创建自己的shell命令，我该怎么做？提前致谢。如果有人可以分享带有示例的源代码链接，我将不胜感激。最佳答案每个hadoop命令都在内部调用一个java实用程序来进行进一步的操作。org.apache.hadoop.fs.FsShell提供对文件系统的命令行访问。hadoopfs-ls内部调用上述包中的相应方法。注意hadoopf

linux - 我是否需要在 Windows 中使用 Hadoop 来连接在 Linux 上运行的 hbase？

我是否需要在我的Windows中使用Hadoop来使用hadoop连接在ununtu上运行的hbase？我的hbase在我的ubuntu机器上运行良好。我可以在同一台机器上连接eclipse(我正在使用kundera连接hbase)。现在我想从我的windows7eclipseIDE连接hbase。我需要在我的Windows上安装hadoop来连接ubuntu上的远程hbase吗？？当我尝试时，我得到了这样的东西FailedtolocatethewinutilsbinaryinthehadoopbinarypathReadaboutopen-sourcetechnology.IOExc

hadoop - 有人可以建议 HBase 架构点击流数据吗

我想使用HBase创建一个点击流应用程序，在sql中这将是一个非常简单的任务，但在Hbase中我还没有得到第一条线索。有人可以建议我在HBase中使用的架构设计和key。我提供了一个粗略的数据模型和几个我想查询数据的问题。关于访问数据我想问的问题哪些事件导致了转化？最后一页是什么/浏览了多少页？客户离开了哪些页面？20-30岁的男性顾客喜欢买什么产品？客户购买了产品x也可能购买产品y？第一页的转化量？{PageViews:[{date:"1970010100:00",domain:"http://foobar.com",path:"pageOne.html",timeOnPage:"1

hadoop - HBase 和 Hive 需要放在同一台机器上吗？

我们目前正在构建一个新的hbase集群。架构如下:现在我想添加一个新的Hive集群。但是不知道要不要和hbase在同一个hadoop集群上搭建hive。还是应该为hive构建一个新的hadoop集群？如果我为hive新建一个hadoop集群，执行sql聚合hbase的数据时，hive和hbase之间的流量会不会太大(AFAIK，hive需要将hbase上的数据导入到自己的hdfs存储中)？最佳答案让我们首先定义HBase和Hive之间的流量是多少。在每个Hive查询中，您将:使用Hive直接查询HBase使用Hive执行Ware

hadoop - NiFi 或 Streamsets 从 HBase 读取，加入平面文件中的内容并写入 Hive

试图弄清楚是否可以使用apacheNiFi或Streamsets实现连接。这样我就可以定期从HBase读取数据，与其他表连接并将少量字段写入Hive表。或者有没有其他工作流管理器工具支持这个操作？最佳答案我不熟悉Streamsets，但我会尽力帮助NiFi。您的平面文件是静态的吗？如果是这样，您是否希望直接替换值？您应该能够使用ReplaceTextWithMapping处理器。如果不是直接替换，您可以预填充DistributedMapCache使用平面文件中的值，然后使用FetchDistributedMapCache对HBa

java - InvalidInputException 将文件加载到 Hbase MapReduce 时

我是Hadoop和MapReduce的新手。对于起始基地，我执行了字数统计程序。它执行得很好，但是当我尝试将csv文件运行到Htable时，我遵循了[Csv文件][1]它让我陷入了我不知道的错误，请任何人帮助我了解上述错误12/09/0705:47:31ERRORsecurity.UserGroupInformation:PriviledgedActionExceptionas:hdusercause:org.apache.hadoop.mapreduce.lib.input.InvalidInputException:Inputpath[1]:http://salsahpc.indi

hadoop - 通过 PIG 加载多个 hbase 表限定符

我有一个名为USERS的hbase表，其列族名称为USER_INFO。USER_INFO有两个限定符EMAIL、AGE。当我尝试通过PIG加载单个限定符值时，它成功了。使用命令:R=LOAD'USERS'USINGorg.apache.pig.backend.hadoop.hbase.HBaseStorage('USER_INFO:EMAIL','-loadKey')AS(key:chararray,EMAIL:chararray);dumpR;但我无法使用这两个限定符加载表格。即电子邮件、年龄。我试过这个:S=LOAD'USERS'USINGorg.apache.pig.backen