黑斑

hadoop - Hue UI 中的黑斑羚时间

我正在尝试估算Impala中从简单到复杂的查询所需的时间，并使用HueUI。是否可以通过UI知道完成查询所需的时间。最佳答案 Impala或Hive仅提供进度的一般估计。Hue可以尝试通过根据当前进度推断开始时间来显示结束时间。欢迎关注https://issues.cloudera.org/browse/HUE-1219. 关于hadoop-HueUI中的黑斑羚时间，我们在StackOverflow上找到一个类似的问题： https://stackoverf

黑斑 hadoop section https stackoverflow hue impala

mysql - 黑斑羚查询 : Combine multiple COUNT DISTINCT WHERE clauses

在impala上，我试图计算包含“101”、“102”或“103”的不同样本ID的数量。这是我的数据示例:|sample_id|___________|101-345-5||101-345-6||101-345-6||102-345-5||103-345-5||103-345-8||103-345-8|我想知道每个研究组中有多少不同的样本ID:|Study|Count|_______________|101|2||102|1||103|2|我可以轻松地创建单独的查询来查找每个组中的数字:SELECTCOUNT(DISTINCTill.sample_id)as101_countFROMi

黑斑 multiple section code sample mysql sql count substring impala

hadoop - 黑斑羚 : Running sum of 1 hour

我想在1小时内统计每个ID的记录。我尝试了一些IMPALA查询，但没有任何运气。我有如下输入数据:预期的输出是:我试过了:selectconcat(month,'/',day,'/',year,'',hour,':',minute)time,id,count(1)over(partitionbyidorderbyconcat(month,'/',day,'/',year,'',hour,':',minute)rangebetween'1hour'PRECEDINGANDCURRENTROW)requestfromrt_requestwhereconcat(year,month,day,

黑斑 Running 39 section hour hadoop hive hql impala

hadoop - Hive 有哪些 impala 没有的功能？ hive 与黑斑羚

我已广泛使用HIVE13.1，并希望开始在Impala2.5中运行我的一些作业。当前Hive中的哪些功能在impala中不可用？有没有人将工作流从Hive转移到Impala，需要注意什么？最佳答案我不认为这里的问题与“功能差异”本身有关，而是与用例有关。如果您的用例涉及由单个用户运行的长时间运行的ETL作业(因此容错是主要要求)，Impala与Hive相比几乎没有优势。如果您的用例涉及多个用户编写并发BI样式查询以进行分析(因此低延迟是主要要求)，Impala将始终比Hive更快。因此，两者都有足够的空间。

黑斑 hadoop section Impala Hive hdfs cloudera

date - Hadoop 黑斑羚 : Format datatype integer to date/timestamp to use addtime function

我在Impala中使用下表:customer_id|day_id|return_day_idABC2017083020170923BCD2017083020170901不幸的是，day_id和return_day_id字段都是INT而不是日期。如何将它们的数据类型更改为日期，以便我可以在day_id之后的4天内仅使用return_day_id计算不同的customer_id。我是否需要将其转换为日期，然后转换为时间戳，以便我可以使用adddate函数？最佳答案其中一条评论正确指出，您需要使用unix_timestamp和from

黑斑 date section code day_id hadoop timestamp type-conversion impala

sql - 黑斑羚每月的最后一天

是一个更好/更短的解决方案selectadd_months(date_sub(trunc(to_timestamp(cast(dim_evt_dte_keyasstring),"yyyyMMdd"),'month'),1),1)asend_monthfromold;获取每个月的最后一天？？有月末功能吗？EOMONTH似乎不适用于impala让事情变得复杂:dim_evt_dte是BIGINT:20170210 最佳答案您可以在下面尝试使用last_day()函数selectlast_day(to_timestamp(cast(di

黑斑每月 section code dim_evt_dte_key sql hadoop impala

sql - 黑斑羚 : argument of type 'NoneType' is not iterable

我已经从MySQL导入了一个表到Hive，该表有1000万行，现在在Impala中执行一些操作以检查功能和性能。现在，当我发出以下查询时，出现错误argumentoftype'NoneType'isnotiterable。selectcount(id)frommy_table_name;导入数据后我需要做些什么来解决这个问题吗？我打算主要将Impala用于分析目的，因此它涉及很多SUM和COUNT函数。最佳答案尝试使用refresh命令。这是来自Cloudera文档的引用:Syntax:REFRESH[db_name.]tabl

黑斑 amp section code table sql hadoop hive aggregate-functions impala