草庐IT

hadoop - Impala 不在 Hbase 表上工作

您好,我有一个Hbase表,我可以使用Hive查询该表。当我尝试从impala(从HUE或shell)访问相同内容时,出现以下错误:Query:select*fromclickviewERROR:RuntimeException:couldn'tretrieveHBasetable(clickviewtab)info:Enable/DisablefailedCDH版本-cdh5.4.2Impala版本-2.2.0Hbase版本-1.0.0-cdh5.4.2所有Hbase、impala和hive都是CDH5.4.2版本的一部分,并作为软件包安装。 最佳答案

sql - 从查询中的数值表达式返回的数据类型

在cloudera的Impala指南中(https://www.cloudera.com/documentation/enterprise/5-8-x/topics/impala_conversion_functions.html)有一个示例演示了如何使用typeof()函数来检查数值表达式的返回数据类型:+--------------------------+|typeof(5.30001/2342.1)|+--------------------------+|DECIMAL(13,11)|+--------------------------+当我这样做时:selecttypeo

Hadoop 初学者 - 数据摄取和分析

HDFS存储结构化和非结构化数据。HIVE和IMPALA使我们能够编写sql查询,然后将其转换为MapReduce。用户如何了解存储数据的模式或如何根据存储在HDFS中的数据形成这些表? 最佳答案 如果您使用Parquet文件格式,可以使用工具直接检查文件block。参见this例如。大多数hadoop文件格式也有类似的方便工具,例如https://orc.apache.org/docs/tools.html对于兽人文件。 关于Hadoop初学者-数据摄取和分析,我们在StackOver

hadoop - Impala 是否支持数据库游标?

我正在尝试实现服务器端分页。数据库游标看起来是一个很好的方法。Impala是否支持databasecursors喜欢关系数据库?该文档没有明确提及它会或不会。 最佳答案 Here是impala做分页的官方推荐。简短回答:不支持游标。近期的开发路线图中也没有光标功能。 关于hadoop-Impala是否支持数据库游标?,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/47868198

hadoop - 如何比较一个表中的列名与 impala 中另一个表中的值

第一个是主表,第二个是查找表。我需要将第一个表的列名与第二个表中的值进行比较,如果在第二个表的任何行中找到某个列名,则从第二个表中提取一些字段。有可能在impala中实现吗?Table1source|location|origin----------+----------+-------s1|india|xxxTable2extractedfrom|lct|lkp_value|map_value-------------+----------+---------+---------s1|location|india|india_xs1|origin|xxx|yyyyyy我需要有类似的东

hadoop - Impala Cloudera Manager 代理从该角色的 Web 服务器获得意外响应

我已经用clouderamanager完成了一个hadoop集群安装。安装后impala状态变坏了。主节点出现以下错误:WebServerStatus这一个用于带有imapala守护进程的节点:ImpalaDaemonReadyCheck,WebServerStatus查看日志我发现了一些错误:ThehealthtestresultforIMPALAD_WEB_METRIC_COLLECTIONhasbecomebad:TheClouderaManagerAgentgotanunexpectedresponsefromthisrole'swebserver.查看cloudera-scm

Hadoop 查询将行值与组值进行比较,带条件

我希望将一些R代码移植到Hadoop,以便与Impala或Hive一起使用,并进行类似SQL的查询。我的代码基于这个问题:Rdatatable:comparerowvaluetogroupvalues,withcondition点si为每一行找到子组1中具有相同id且价格更便宜的行数。假设我有以下数据:CREATETABLEproject(idint,priceint,subgroupint);INSERTINTOproject(id,price,subgroup)VALUES(1,10,1),(1,10,1),(1,12,1),(1,15,1),(1,8,2),(1,11,2),(2

macos - impala 安装 mac os 指南

官方impala安装包括用于在linux系统上安装impala的apt-get,有什么方法可以在mac上运行(或任何其他方法)impala包,运行yosemite和CDH5.1.1。 最佳答案 您可以按照工作将Impala转到buildandrunonOSX和installwithHomebrew在ClouderaJIRA上(虽然我确信这些问题会迁移到ApacheJIRA,因为Impala是recentlycontributed到Apache孵化器)。 关于macos-impala安装m

hadoop - 如何从 hive 或 impala 读取 Hbase 当前和以前版本的数据?

我想从Hive或Impala读取Hbase当前和以前版本的数据。在我最初的研究中,我发现只能从Hive访问当前版本。那么,目前有什么方法可以从hive或Impala中检索旧版本吗? 最佳答案 在Hive的情况下:请看this似乎不可能在Hive中获得同一单元格的不同版本(即使Hbase具有同一单元格的多个版本),它总是返回具有最新时间戳的单元格。我相信我们可以从战术上解决这个问题。我们可以将以前的版本附加到Hbase行键或者作为单独的单元格(名称,值)如果是Impala:请看limitations节

hadoop - 如何从中心点终止 apache Impala 2.10 中正在运行的查询

有时,我的查询应该只需要几秒钟就可以保持运行和运行,并阻止其他查询,或者将值设置为MT_DOP的查询调整得太大,这让impala跪下了.虽然在使用UIClouderaManagerortheAPI的Cloudera发行版时这可能会终止查询我目前没有看到Impala的普通版本(2.10版)存在这种可能性,除非您转到每个工作人员Web界面并找到您想要终止的查询。我查了官PDFmanual但是kill只是一个保留字供将来使用。您知道在普通Impala2.10中是否可以终止正在运行的查询吗?谢谢 最佳答案 应该可以从执行查询的Impala守