date-difference

sql - HiveQL Date_Add 问题

在使用Hue2.3.1-402时，我注意到HQL的date_add函数在一天后给出结果时存在一些错误，这可能是由于UTC时区问题造成的。运行下面的两个代码会产生不同的结果:SELECTDATE_ADD(TO_DATE('2015-02-22'),25)ASd1_b2015-03-19SELECTDATE_ADD(TO_DATE(d1),25)ASd1_bFROM(SELECT'2015-02-22'asd1)a2015-03-18当date_add函数计算多行数据时，会出现类似的问题。在没有to_date转换的情况下运行(将其保留为字符串)并给出相同的结果。

date - 在 Hive 中按周计数

我试图每周生成一组完全刷新的数字，从hive中的表中提取。现在我使用这种方法:SELECTCOUNT(DISTINCTcasewhentimestampbetweenTO_DATE("2016-01-28")andTO_DATE("2016-01-30")thenuseridend)asweek_1,COUNT(DISTINCTcasewhentimestampbetweenTO_DATE("2016-01-28")andTO_DATE("2016-02-06")thenuseridend)asweek_2FROMData;我正在尝试获得更多信息:选择月(时间戳)、周(时间戳)、COU

date Hive section timestamp 2016 hadoop count

hadoop - 自定义分区程序 : N number of keys to N different files

我的要求是编写自定义分区程序。例如，我有N个来自映射器的键('jsa'、'msa'、'jbac')。长度不固定。事实上，它可以是任何词。我的要求是以这样一种方式编写自定义分区程序，它将所有相同的key数据收集到同一个文件中。键数不固定。在此先感谢您。谢谢，萨提斯。最佳答案因此，您有多个映射器正在输出的键，并且您希望每个键都有不同的缩减器，并且每个键都有一个单独的文件。因此，首先编写Partitioner可能是实现该目标的一种方式。默认情况下，hadoop有自己的内部逻辑，它在键上执行，并根据它调用reducer。因此，如果您想编

自定 different section key hadoop mapreduce

date - Hive:从当前日期减去 1 年

我试图找到从Hive查询中的当前日期减去1年和1个月的最佳方法。使用以下内容，我认为它不会考虑闰年，或者如果月份的天数不同，那么代码最终会被破坏。任何帮助将不胜感激!setmy_date=from_unixtime(unix_timestamp()-365*60*60*24,'yyyy-MM-dd');setmy_date=from_unixtime(unix_timestamp()-30*60*60*24,'yyyy-MM-dd');谢谢!-丽贝卡最佳答案如果你在Hive中有像yyyy-MM-ddhh:mm:ss这样的日期格式

date Hive section date_field hadoop unix-timestamp subtraction

hadoop - DSE 4.0.1 : hive count different than cassandra count

我们正在运行DatastaxEnterprise4.0.1，在向Cassandra中插入行然后在配置单元中查询COUNT(1)时遇到了一个非常奇怪的问题。设置:DSE4.0.01、Cassandra2.0、Hive、全新集群。向Cassandra中插入10,000行，然后:cqlsh:pageviews>selectcount(1)frompageviews_v1limit100000;count-------10000(1rows)cqlsh:pageviews>但是来自Hive:hive>selectcount(1)frompageviews_v1limit100000;Total

count cassandra 39 pageviews hadoop amazon-ec2 hive datastax-enterprise

date - 配置单元日期转换不起作用

我正在尝试比较不同格式的两个日期。因此，我将它们都转换为unixtimespamp以进行比较，但因为它们具有不同的日期格式。它没有以正确的方式转换。我需要帮助。这是我的查询:selecta.date,b.datefromtable1ajointable2bon(from_unixtime(unix_timestamp(b.date,'MM/dd/yyyyHH:mm:ssa')))=(from_unixtime(unix_timestamp(nvl(a.date,'3050-01-0100:00:00.0'))));日期格式为:a.dateb.date4/12/20165:46:50PM

配置单 date section code datetime hadoop hive unix-timestamp

apache-spark - Apache Spark : Differences between client and cluster deploy modes

TL;DR:在SparkStandalone集群中，客户端和集群部署模式有何区别？如何设置我的应用程序要运行的模式？我们有一个包含三台机器的SparkStandalone集群，它们都装有Spark1.6.1:一台主机，也是我们使用spark-submit运行我们的应用程序的地方2台相同的worker机器来自SparkDocumentation，我读到:(...)Forstandaloneclusters,Sparkcurrentlysupportstwodeploymodes.Inclientmode,thedriverislaunchedinthesameprocessasthecl

apache-spark Differences code Spark section apache-spark-standalone

hadoop - 自定义分区程序 : N number of keys to N different files for word count

您好，我正在学习hadoop，我想要一个关于如何使用自定义partioner解决字数统计问题的示例。我希望将缩减器设置为26，以便所有以“A”开头的字符都将转到第一个缩减器，所有字符“B”将转到第二个缩减器，依此类推....公共(public)类PersonPartitioner扩展了Partitioner{@OverridepublicintgetPartition(Textkey,IntWritableVal,intnumOfReducer){Stringline=key.toString();String[]splits=line.trim().replaceAll("[0-9]

自定 different section code hadoop

date - unix_timestamp 函数在 Hive 中将 2 位格式年份转换为 4 位格式年份的逻辑是什么？

例如下面的hive脚本selectfrom_unixtime(unix_timestamp('30-Apr-50','dd-MMM-yy'),'yyyy-MM-dd')asdate1,from_unixtime(unix_timestamp('30-Apr-45','dd-MMM-yy'),'yyyy-MM-dd')asdate2,from_unixtime(unix_timestamp('30-Apr-35','dd-MMM-yy'),'yyyy-MM-dd')asdate3;结果如下date1date2date31950-04-301945-04-302035-04-30将2位数年

unix_timestamp timestamp 39 SimpleDateFormat date hadoop hive

date - 验证日期在配置单元中是否有效？

我有日期列，格式为yyyyMMdd。我想检查日期是否有效。在informatica中，该函数可用作CASEWHENIS_DATE(TO_CHAR(DT),'YYYYMMDD')=0THENTO_DATE('99991231','YYYYMMDD')ELSETO_DATE(TO_CHAR(DT),'YYYYMMDD')END作为EFF_DT因为在hive中替代'is_date'函数不可用，如何在hive中实现相同的功能。最佳答案使用正则表达式:casewhenregexp_extract(date_column,'(19|20)[

配置单 date code section hadoop hive hiveql

170 171 172173174 175 176