草庐IT

some_date

全部标签

date - 在 Hive 中按周计数

我试图每周生成一组完全刷新的数字,从hive中的表中提取。现在我使用这种方法:SELECTCOUNT(DISTINCTcasewhentimestampbetweenTO_DATE("2016-01-28")andTO_DATE("2016-01-30")thenuseridend)asweek_1,COUNT(DISTINCTcasewhentimestampbetweenTO_DATE("2016-01-28")andTO_DATE("2016-02-06")thenuseridend)asweek_2FROMData;我正在尝试获得更多信息:选择月(时间戳)、周(时间戳)、COU

date - Hive:从当前日期减去 1 年

我试图找到从Hive查询中的当前日期减去1年和1个月的最佳方法。使用以下内容,我认为它不会考虑闰年,或者如果月份的天数不同,那么代码最终会被破坏。任何帮助将不胜感激!setmy_date=from_unixtime(unix_timestamp()-365*60*60*24,'yyyy-MM-dd');setmy_date=from_unixtime(unix_timestamp()-30*60*60*24,'yyyy-MM-dd');谢谢!-丽贝卡 最佳答案 如果你在Hive中有像yyyy-MM-ddhh:mm:ss这样的日期格式

date - 配置单元日期转换不起作用

我正在尝试比较不同格式的两个日期。因此,我将它们都转换为unixtimespamp以进行比较,但因为它们具有不同的日期格式。它没有以正确的方式转换。我需要帮助。这是我的查询:selecta.date,b.datefromtable1ajointable2bon(from_unixtime(unix_timestamp(b.date,'MM/dd/yyyyHH:mm:ssa')))=(from_unixtime(unix_timestamp(nvl(a.date,'3050-01-0100:00:00.0'))));日期格式为:a.dateb.date4/12/20165:46:50PM

date - unix_timestamp 函数在 Hive 中将 2 位格式年份转换为 4 位格式年份的逻辑是什么?

例如下面的hive脚本selectfrom_unixtime(unix_timestamp('30-Apr-50','dd-MMM-yy'),'yyyy-MM-dd')asdate1,from_unixtime(unix_timestamp('30-Apr-45','dd-MMM-yy'),'yyyy-MM-dd')asdate2,from_unixtime(unix_timestamp('30-Apr-35','dd-MMM-yy'),'yyyy-MM-dd')asdate3;结果如下date1date2date31950-04-301945-04-302035-04-30将2位数年

date - 验证日期在配置单元中是否有效?

我有日期列,格式为yyyyMMdd。我想检查日期是否有效。在informatica中,该函数可用作CASEWHENIS_DATE(TO_CHAR(DT),'YYYYMMDD')=0THENTO_DATE('99991231','YYYYMMDD')ELSETO_DATE(TO_CHAR(DT),'YYYYMMDD')END作为EFF_DT因为在hive中替代'is_date'函数不可用,如何在hive中实现相同的功能。 最佳答案 使用正则表达式:casewhenregexp_extract(date_column,'(19|20)[

date - 带有 case 语句的 Hive 查询

我正在尝试在我的数据中使用一个名为priority的字段来驱动DATE_ADD函数的数值。从本质上讲,优先级决定了问题超出SLA的天数。我试图通过说来使用这个优先级:伪代码-Ifpriority=p0,DATE_ADD(date,INTERVAL1day)ElseIfpriority=p1,DATE_ADD(date,INTERVAL15day)这是我正在尝试的代码:SELECTjira.jiraidas`JIRA/FR`,jira.priorityas`Priority`,DATE_FORMAT(jira.created,"MM/dd/Y")as`DateJiraCreated`,D

java - 尽管配置相同,但 Cassandra 集群 : some nodes reporting "no other nodes seen",

这个问题不太可能帮助任何future的访问者;它只与一个小的地理区域、一个特定的时间点或一个非常狭窄的情况有关,这些情况并不普遍适用于互联网的全局受众。为了帮助使这个问题更广泛地适用,visitthehelpcenter.关闭10年前。我正在尝试设置一个8节点开发集群。我对配置做了最小的改动。我将其中一个节点设置为所有节点上的种子。3个节点连接到种子,但还有4个不连接。我检查过所有非连接节点都可以访问种子的IP(它们甚至在同一子网上)。我的网络没问题。我验证了所有IP都是正确的。一个非连接节点显然访问了种子:INFO17:30:16,272StartingMessagingServic

date - Hadoop 黑斑羚 : Format datatype integer to date/timestamp to use addtime function

我在Impala中使用下表:customer_id|day_id|return_day_idABC2017083020170923BCD2017083020170901不幸的是,day_id和return_day_id字段都是INT而不是日期。如何将它们的数据类型更改为日期,以便我可以在day_id之后的4天内仅使用return_day_id计算不同的customer_id。我是否需要将其转换为日期,然后转换为时间戳,以便我可以使用adddate函数? 最佳答案 其中一条评论正确指出,您需要使用unix_timestamp和from

date - 根据oozie中的日期创建输出文件

我正在使用oozie来运行我的map-reduce作业。我想根据日期创建输出文件。但是它将日期作为字符串并最终打印而不是将日期作为值:/user/skataria/geooutput/$(date+"%m%d%Y%H%M%S")这是oozie属性文件:nameNode=hdfs://localhost:8020jobTracker=localhost:8021date=(date+"%m%d%Y%H%M%S")oozie.wf.application.path=${nameNode}/services/advert/sidinputDir=${nameNode}/user/${user

python - Spark : pyspark crash for some datasets - ubuntu

我正在使用Ubuntu和本地Spark安装(spark-2.0.2)。我的数据集很小,我的代码运行在我有一个小数据。如果我用更多行增加数据集(txt文件),则会发生错误。我在安装了Hadoop的ClouderaVM上尝试了完全相同的代码,并且运行良好。所以,这一定是我的Ubuntu机器上的一些内存问题或限制。还有一些其他类似的问题,例如:ApacheSpark:pysparkcrashforlargedataset但在我的情况下它没有帮助。我没有Hadoop集群,只有Spark、python2.7和java1.8。它工作正常,只是当有一些更复杂的计算或数据集更大时它崩溃了。有什么线索吗