some_date

date - 在 Hive 中按周计数

我试图每周生成一组完全刷新的数字，从hive中的表中提取。现在我使用这种方法:SELECTCOUNT(DISTINCTcasewhentimestampbetweenTO_DATE("2016-01-28")andTO_DATE("2016-01-30")thenuseridend)asweek_1,COUNT(DISTINCTcasewhentimestampbetweenTO_DATE("2016-01-28")andTO_DATE("2016-02-06")thenuseridend)asweek_2FROMData;我正在尝试获得更多信息:选择月(时间戳)、周(时间戳)、COU

date - Hive:从当前日期减去 1 年

我试图找到从Hive查询中的当前日期减去1年和1个月的最佳方法。使用以下内容，我认为它不会考虑闰年，或者如果月份的天数不同，那么代码最终会被破坏。任何帮助将不胜感激!setmy_date=from_unixtime(unix_timestamp()-365*60*60*24,'yyyy-MM-dd');setmy_date=from_unixtime(unix_timestamp()-30*60*60*24,'yyyy-MM-dd');谢谢!-丽贝卡最佳答案如果你在Hive中有像yyyy-MM-ddhh:mm:ss这样的日期格式

date Hive section date_field hadoop unix-timestamp subtraction

date - 配置单元日期转换不起作用

我正在尝试比较不同格式的两个日期。因此，我将它们都转换为unixtimespamp以进行比较，但因为它们具有不同的日期格式。它没有以正确的方式转换。我需要帮助。这是我的查询:selecta.date,b.datefromtable1ajointable2bon(from_unixtime(unix_timestamp(b.date,'MM/dd/yyyyHH:mm:ssa')))=(from_unixtime(unix_timestamp(nvl(a.date,'3050-01-0100:00:00.0'))));日期格式为:a.dateb.date4/12/20165:46:50PM

配置单 date section code datetime hadoop hive unix-timestamp

date - unix_timestamp 函数在 Hive 中将 2 位格式年份转换为 4 位格式年份的逻辑是什么？

例如下面的hive脚本selectfrom_unixtime(unix_timestamp('30-Apr-50','dd-MMM-yy'),'yyyy-MM-dd')asdate1,from_unixtime(unix_timestamp('30-Apr-45','dd-MMM-yy'),'yyyy-MM-dd')asdate2,from_unixtime(unix_timestamp('30-Apr-35','dd-MMM-yy'),'yyyy-MM-dd')asdate3;结果如下date1date2date31950-04-301945-04-302035-04-30将2位数年

unix_timestamp timestamp 39 SimpleDateFormat date hadoop hive

date - 验证日期在配置单元中是否有效？

我有日期列，格式为yyyyMMdd。我想检查日期是否有效。在informatica中，该函数可用作CASEWHENIS_DATE(TO_CHAR(DT),'YYYYMMDD')=0THENTO_DATE('99991231','YYYYMMDD')ELSETO_DATE(TO_CHAR(DT),'YYYYMMDD')END作为EFF_DT因为在hive中替代'is_date'函数不可用，如何在hive中实现相同的功能。最佳答案使用正则表达式:casewhenregexp_extract(date_column,'(19|20)[

配置单 date code section hadoop hive hiveql

date - 带有 case 语句的 Hive 查询

我正在尝试在我的数据中使用一个名为priority的字段来驱动DATE_ADD函数的数值。从本质上讲，优先级决定了问题超出SLA的天数。我试图通过说来使用这个优先级:伪代码-Ifpriority=p0,DATE_ADD(date,INTERVAL1day)ElseIfpriority=p1,DATE_ADD(date,INTERVAL15day)这是我正在尝试的代码:SELECTjira.jiraidas`JIRA/FR`,jira.priorityas`Priority`,DATE_FORMAT(jira.created,"MM/dd/Y")as`DateJiraCreated`,D

date case section code hadoop hive hiveql

java - 尽管配置相同，但 Cassandra 集群 : some nodes reporting "no other nodes seen",

这个问题不太可能帮助任何future的访问者；它只与一个小的地理区域、一个特定的时间点或一个非常狭窄的情况有关，这些情况并不普遍适用于互联网的全局受众。为了帮助使这个问题更广泛地适用，visitthehelpcenter.关闭10年前。我正在尝试设置一个8节点开发集群。我对配置做了最小的改动。我将其中一个节点设置为所有节点上的种子。3个节点连接到种子，但还有4个不连接。我检查过所有非连接节点都可以访问种子的IP(它们甚至在同一子网上)。我的网络没问题。我验证了所有IP都是正确的。一个非连接节点显然访问了种子:INFO17:30:16,272StartingMessagingServic

nodes Cassandra section blockquote 种子 java hadoop

date - Hadoop 黑斑羚 : Format datatype integer to date/timestamp to use addtime function

我在Impala中使用下表:customer_id|day_id|return_day_idABC2017083020170923BCD2017083020170901不幸的是，day_id和return_day_id字段都是INT而不是日期。如何将它们的数据类型更改为日期，以便我可以在day_id之后的4天内仅使用return_day_id计算不同的customer_id。我是否需要将其转换为日期，然后转换为时间戳，以便我可以使用adddate函数？最佳答案其中一条评论正确指出，您需要使用unix_timestamp和from

黑斑 date section code day_id hadoop timestamp type-conversion impala

date - 根据oozie中的日期创建输出文件

我正在使用oozie来运行我的map-reduce作业。我想根据日期创建输出文件。但是它将日期作为字符串并最终打印而不是将日期作为值:/user/skataria/geooutput/$(date+"%m%d%Y%H%M%S")这是oozie属性文件:nameNode=hdfs://localhost:8020jobTracker=localhost:8021date=(date+"%m%d%Y%H%M%S")oozie.wf.application.path=${nameNode}/services/advert/sidinputDir=${nameNode}/user/${user

oozie date section code hadoop file-io

python - Spark : pyspark crash for some datasets - ubuntu

我正在使用Ubuntu和本地Spark安装(spark-2.0.2)。我的数据集很小，我的代码运行在我有一个小数据。如果我用更多行增加数据集(txt文件)，则会发生错误。我在安装了Hadoop的ClouderaVM上尝试了完全相同的代码，并且运行良好。所以，这一定是我的Ubuntu机器上的一些内存问题或限制。还有一些其他类似的问题，例如:ApacheSpark:pysparkcrashforlargedataset但在我的情况下它没有帮助。我没有Hadoop集群，只有Spark、python2.7和java1.8。它工作正常，只是当有一些更复杂的计算或数据集更大时它崩溃了。有什么线索吗

datasets pyspark spark apache scala python ubuntu hadoop apache-spark

146 147 148149150 151 152