ordered_date_草庐IT

hadoop - 确定 Hive "order by"子句中的 reducer 数量

我有一个2.6MB大小的CSV文件。我创建了一个配置单元表并在其中加载了csv文件。现在，如果我将查询编写为“select*fromabcorderbya;”,mapreduce使用了1个reducer。它是如何识别reducer的数量为1的呢？它使用默认值“1”还是其他什么？一般来说，hive如何决定在“orderby”、“sortby”或“groupby”子句中使用多少个reducer？最佳答案它与数据大小有关，默认为每1GB1个，由此属性调节:hive.exec.reducers.bytes.per.reducer如果你想

date - 配置单元日期转换不起作用

我正在尝试比较不同格式的两个日期。因此，我将它们都转换为unixtimespamp以进行比较，但因为它们具有不同的日期格式。它没有以正确的方式转换。我需要帮助。这是我的查询:selecta.date,b.datefromtable1ajointable2bon(from_unixtime(unix_timestamp(b.date,'MM/dd/yyyyHH:mm:ssa')))=(from_unixtime(unix_timestamp(nvl(a.date,'3050-01-0100:00:00.0'))));日期格式为:a.dateb.date4/12/20165:46:50PM

配置单 date section code datetime hadoop hive unix-timestamp

date - unix_timestamp 函数在 Hive 中将 2 位格式年份转换为 4 位格式年份的逻辑是什么？

例如下面的hive脚本selectfrom_unixtime(unix_timestamp('30-Apr-50','dd-MMM-yy'),'yyyy-MM-dd')asdate1,from_unixtime(unix_timestamp('30-Apr-45','dd-MMM-yy'),'yyyy-MM-dd')asdate2,from_unixtime(unix_timestamp('30-Apr-35','dd-MMM-yy'),'yyyy-MM-dd')asdate3;结果如下date1date2date31950-04-301945-04-302035-04-30将2位数年

unix_timestamp timestamp 39 SimpleDateFormat date hadoop hive

date - 验证日期在配置单元中是否有效？

我有日期列，格式为yyyyMMdd。我想检查日期是否有效。在informatica中，该函数可用作CASEWHENIS_DATE(TO_CHAR(DT),'YYYYMMDD')=0THENTO_DATE('99991231','YYYYMMDD')ELSETO_DATE(TO_CHAR(DT),'YYYYMMDD')END作为EFF_DT因为在hive中替代'is_date'函数不可用，如何在hive中实现相同的功能。最佳答案使用正则表达式:casewhenregexp_extract(date_column,'(19|20)[

配置单 date code section hadoop hive hiveql

date - 带有 case 语句的 Hive 查询

我正在尝试在我的数据中使用一个名为priority的字段来驱动DATE_ADD函数的数值。从本质上讲，优先级决定了问题超出SLA的天数。我试图通过说来使用这个优先级:伪代码-Ifpriority=p0,DATE_ADD(date,INTERVAL1day)ElseIfpriority=p1,DATE_ADD(date,INTERVAL15day)这是我正在尝试的代码:SELECTjira.jiraidas`JIRA/FR`,jira.priorityas`Priority`,DATE_FORMAT(jira.created,"MM/dd/Y")as`DateJiraCreated`,D

date case section code hadoop hive hiveql

mysql - Hive Order by 不工作

查询:没有函数的列:SELECTACCOUNTIDfromtableorderbyACCOUNTID;(以上查询在HIVE和MYSQL中都工作正常)具有功能的列:SELECTconcat('test_',ACCOUNTID)fromtableorderbyACCOUNTID;在mysql中，上述查询工作正常。在hive中，下面抛出异常失败:SemanticException[错误10004]:第1:59行无效的表别名或列引用“ACCOUNTID”:(可能的列名是:_c0)Mysql:Orderby可以很好地处理函数中涉及的列hive:Orderby不与函数中涉及的列一起工作临时解决方案

mysql Order strong ACCOUNTID section hadoop hive hiveql

hadoop - 使用 Hive 'Order By' 查询时获取无序输出

我试过使用“Orderby”如下:selectfieldA,fieldB,fieldC,fieldDfromtestfilterwherefieldA='000009000002'orderbyfieldA,fieldB,fieldC,fieldD;但是，这会导致像这样的无序输出:00000900000272120236530000090000029999058159000009000002999905815900000900000299990581590000090000029999058159000009000002999905815900000900000299990582400

amp hadoop 000009000002 9999 058 hive

sql - HIVE SELECT 可以结合 GROUP BY 和 ORDER BY 吗？

我在Hive中做一些相对简单的查询，似乎无法在单个语句中组合GROUPBY和ORDERBY。我可以毫无问题地选择GROUPBY查询的临时表，然后使用ORDERBY在该表上进行选择，但我无法将它们组合起来在一起。例如，我有一个表a，可以执行这个查询:SELECTplace,count(*),sum(weight)fromagroupbyplace;我可以执行这个查询:createtemporarytableresult(placestring,countint,sumweightint);insertoverwritetableresultselectplace,count(*),sum

SELECT GROUP code place section sql hadoop hive

date - Hadoop 黑斑羚 : Format datatype integer to date/timestamp to use addtime function

我在Impala中使用下表:customer_id|day_id|return_day_idABC2017083020170923BCD2017083020170901不幸的是，day_id和return_day_id字段都是INT而不是日期。如何将它们的数据类型更改为日期，以便我可以在day_id之后的4天内仅使用return_day_id计算不同的customer_id。我是否需要将其转换为日期，然后转换为时间戳，以便我可以使用adddate函数？最佳答案其中一条评论正确指出，您需要使用unix_timestamp和from

黑斑 date section code day_id hadoop timestamp type-conversion impala

date - 根据oozie中的日期创建输出文件

我正在使用oozie来运行我的map-reduce作业。我想根据日期创建输出文件。但是它将日期作为字符串并最终打印而不是将日期作为值:/user/skataria/geooutput/$(date+"%m%d%Y%H%M%S")这是oozie属性文件:nameNode=hdfs://localhost:8020jobTracker=localhost:8021date=(date+"%m%d%Y%H%M%S")oozie.wf.application.path=${nameNode}/services/advert/sidinputDir=${nameNode}/user/${user

oozie date section code hadoop file-io