草庐IT

ordered_date

全部标签

hadoop - 确定 Hive "order by"子句中的 reducer 数量

我有一个2.6MB大小的CSV文件。我创建了一个配置单元表并在其中加载了csv文件。现在,如果我将查询编写为“select*fromabcorderbya;”,mapreduce使用了1个reducer。它是如何识别reducer的数量为1的呢?它使用默认值“1”还是其他什么?一般来说,hive如何决定在“orderby”、“sortby”或“groupby”子句中使用多少个reducer? 最佳答案 它与数据大小有关,默认为每1GB1个,由此属性调节:hive.exec.reducers.bytes.per.reducer如果你想

date - 配置单元日期转换不起作用

我正在尝试比较不同格式的两个日期。因此,我将它们都转换为unixtimespamp以进行比较,但因为它们具有不同的日期格式。它没有以正确的方式转换。我需要帮助。这是我的查询:selecta.date,b.datefromtable1ajointable2bon(from_unixtime(unix_timestamp(b.date,'MM/dd/yyyyHH:mm:ssa')))=(from_unixtime(unix_timestamp(nvl(a.date,'3050-01-0100:00:00.0'))));日期格式为:a.dateb.date4/12/20165:46:50PM

date - unix_timestamp 函数在 Hive 中将 2 位格式年份转换为 4 位格式年份的逻辑是什么?

例如下面的hive脚本selectfrom_unixtime(unix_timestamp('30-Apr-50','dd-MMM-yy'),'yyyy-MM-dd')asdate1,from_unixtime(unix_timestamp('30-Apr-45','dd-MMM-yy'),'yyyy-MM-dd')asdate2,from_unixtime(unix_timestamp('30-Apr-35','dd-MMM-yy'),'yyyy-MM-dd')asdate3;结果如下date1date2date31950-04-301945-04-302035-04-30将2位数年

date - 验证日期在配置单元中是否有效?

我有日期列,格式为yyyyMMdd。我想检查日期是否有效。在informatica中,该函数可用作CASEWHENIS_DATE(TO_CHAR(DT),'YYYYMMDD')=0THENTO_DATE('99991231','YYYYMMDD')ELSETO_DATE(TO_CHAR(DT),'YYYYMMDD')END作为EFF_DT因为在hive中替代'is_date'函数不可用,如何在hive中实现相同的功能。 最佳答案 使用正则表达式:casewhenregexp_extract(date_column,'(19|20)[

date - 带有 case 语句的 Hive 查询

我正在尝试在我的数据中使用一个名为priority的字段来驱动DATE_ADD函数的数值。从本质上讲,优先级决定了问题超出SLA的天数。我试图通过说来使用这个优先级:伪代码-Ifpriority=p0,DATE_ADD(date,INTERVAL1day)ElseIfpriority=p1,DATE_ADD(date,INTERVAL15day)这是我正在尝试的代码:SELECTjira.jiraidas`JIRA/FR`,jira.priorityas`Priority`,DATE_FORMAT(jira.created,"MM/dd/Y")as`DateJiraCreated`,D

mysql - Hive Order by 不工作

查询:没有函数的列:SELECTACCOUNTIDfromtableorderbyACCOUNTID;(以上查询在HIVE和MYSQL中都工作正常)具有功能的列:SELECTconcat('test_',ACCOUNTID)fromtableorderbyACCOUNTID;在mysql中,上述查询工作正常。在hive中,下面抛出异常失败:SemanticException[错误10004]:第1:59行无效的表别名或列引用“ACCOUNTID”:(可能的列名是:_c0)Mysql:Orderby可以很好地处理函数中涉及的列hive:Orderby不与函数中涉及的列一起工作临时解决方案

hadoop - 使用 Hive 'Order By' 查询时获取无序输出

我试过使用“Orderby”如下:selectfieldA,fieldB,fieldC,fieldDfromtestfilterwherefieldA='000009000002'orderbyfieldA,fieldB,fieldC,fieldD;但是,这会导致像这样的无序输出:00000900000272120236530000090000029999058159000009000002999905815900000900000299990581590000090000029999058159000009000002999905815900000900000299990582400

sql - HIVE SELECT 可以结合 GROUP BY 和 ORDER BY 吗?

我在Hive中做一些相对简单的查询,似乎无法在单个语句中组合GROUPBY和ORDERBY。我可以毫无问题地选择GROUPBY查询的临时表,然后使用ORDERBY在该表上进行选择,但我无法将它们组合起来在一起。例如,我有一个表a,可以执行这个查询:SELECTplace,count(*),sum(weight)fromagroupbyplace;我可以执行这个查询:createtemporarytableresult(placestring,countint,sumweightint);insertoverwritetableresultselectplace,count(*),sum

date - Hadoop 黑斑羚 : Format datatype integer to date/timestamp to use addtime function

我在Impala中使用下表:customer_id|day_id|return_day_idABC2017083020170923BCD2017083020170901不幸的是,day_id和return_day_id字段都是INT而不是日期。如何将它们的数据类型更改为日期,以便我可以在day_id之后的4天内仅使用return_day_id计算不同的customer_id。我是否需要将其转换为日期,然后转换为时间戳,以便我可以使用adddate函数? 最佳答案 其中一条评论正确指出,您需要使用unix_timestamp和from

date - 根据oozie中的日期创建输出文件

我正在使用oozie来运行我的map-reduce作业。我想根据日期创建输出文件。但是它将日期作为字符串并最终打印而不是将日期作为值:/user/skataria/geooutput/$(date+"%m%d%Y%H%M%S")这是oozie属性文件:nameNode=hdfs://localhost:8020jobTracker=localhost:8021date=(date+"%m%d%Y%H%M%S")oozie.wf.application.path=${nameNode}/services/advert/sidinputDir=${nameNode}/user/${user