草庐IT

date - hive cast string to date in 'dd/MMM/yyyy' format order by and group by issue

我将日期存储为[27/Feb/2016:00:24:31+0530]。我想要27/Feb/2016中的日期格式,并且还想按它排序。我试过了this解决方案,但它以2016-02-27形式返回,并且也正确排序。SELECTTO_DATE(FROM_UNIXTIME(UNIX_TIMESTAMP(SUBSTR(time,2,11),'dd/MMM/yyyy')))ASreal_date,urlFROMcleanned_logsORDERBYreal_dateASC;为了获得所需的格式,我尝试使用date_format()函数。它在1.2.1中不可用,所以我从1.0.1切换到它。SELECT

mysql - 如何在 MySQL my.cnf 中永久设置 sql-mode ="NO_ENGINE_SUBSTITUTION"

更新于2015年1月18日修复在我们最近更新到MySQL5.6.27(来自Ubuntu存储库)之后,此选项现在可以使用。所以这似乎是以前版本的MySQL的问题。原始问题随着对MySQL(5.6.20)的新升级,更新和插入失败,除非我将sql-mode设置为NO_ENGINE_SUBSTITUTION。感谢documentation,我可以从mysql终端运行以下命令并解决问题(暂时):SETGLOBALsql_mode='NO_ENGINE_SUBSTITUTION';SETSESSIONsql_mode='NO_ENGINE_SUBSTITUTION';`但是下次MySQL重新启动时

mysql - 如何在 MySQL my.cnf 中永久设置 sql-mode ="NO_ENGINE_SUBSTITUTION"

更新于2015年1月18日修复在我们最近更新到MySQL5.6.27(来自Ubuntu存储库)之后,此选项现在可以使用。所以这似乎是以前版本的MySQL的问题。原始问题随着对MySQL(5.6.20)的新升级,更新和插入失败,除非我将sql-mode设置为NO_ENGINE_SUBSTITUTION。感谢documentation,我可以从mysql终端运行以下命令并解决问题(暂时):SETGLOBALsql_mode='NO_ENGINE_SUBSTITUTION';SETSESSIONsql_mode='NO_ENGINE_SUBSTITUTION';`但是下次MySQL重新启动时

hadoop - 将 TDCH 用于 hcat 作业类型的异常。不支持 DATE 列

我正在运行的查询是:hadoopcom.teradata.hadoop.tool.TeradataExportTool-urljdbc:teradata://tdx/TMODE=ANSI,CHARSET=UTF8,database=db-usernamexxx-passwordxxx-jobtypehcat-sourcetablecustomers-sourcedatabasexxx-nummappers1-targettablecustomers在运行作业时,我得到这个异常:com.teradata.connector.common.exception.ConnectorExcept

hadoop - Cloudera CDH4 : Can't add a host to my cluster because canonical name is not consistent with hostname

我正在使用Ubuntu12.04LTS在4节点集群上安装CDH4。我能够安装cloudera管理器并在主机上启动单节点集群。但是,一旦我添加了一个新主机,CM就会说它运行状况不佳并抛出以下错误:“从Java进程检查时,此主机的主机名和规范名称不一致。”我修改了master和所有主机上的/etc/hosts的内容,以包含IP地址,后跟每台机器的FQDN。我是否还需要设置一个DNS服务器才能完成这项工作? 最佳答案 您不一定需要设置DNS服务器才能使其正常工作,但正向和反向DNS必须明确匹配Hadoop才能正常运行。Hadoop操作书有

hadoop - 在 Impala 中将 STRING 转换为 DATE。 (可能的错误)

这似乎是我面临的一个有趣的错误/问题。我正在使用CDH5.8(Hadoop的Cloudera发行版)下的Impala和HUE。执行下面的代码select'1709.02.02'asDateString,CAST((from_unixtime(UNIX_TIMESTAMP('1709.02.02','yyyy.MM.dd')))asTIMESTAMP)asDateTimestamp我得到如下输出(这是预期的)datestringdatetimestamp1709.02.021709-02-0200:00:00但是在执行下面的代码时select'1009.02.02'asDateStrin

date - 如何在 HIVE 中的连续日期之间插入行数据?

示例数据:customertxn_datetagA1-Jan-171A2-Jan-171A4-Jan-171A5-Jan-170B3-Jan-171B5-Jan-170需要填写日期范围(2017年1月1日至2017年1月5日)之间每个缺失的txn_date。就像下面这样:输出应该是:customertxn_datetagA1-Jan-171A2-Jan-171A3-Jan-170(inserted)A4-Jan-171A5-Jan-170B1-Jan-170(inserted)B2-Jan-170(inserted)B3-Jan-171B4-Jan-170(inserted)B5-Ja

sql - 从 current_date 获取星期并在 SQL 中创建一个具有动态名称的表

我每周运行一个特定的查询,创建一个包含所需数据的周表。表名格式如下db_name.subscriptions_wk29--为第29周数据创建的表db_name.subscriptions_wk30--为第30周数据创建的表db_name.subscriptions_wk31--为第31周数据创建的表由于这是一项重复性任务,我想安排此查询,使其在特定一周的每个星期一自动运行以获取前一周的数据。我面临的问题是,我不知道如何在每周运行查询时动态更改表名。因此,当我下次运行查询时,它应该会自动创建一个名为db_name.subscriptions_wk32的表。我可以从weekofyear('

hadoop - HbaseTestingUtility : could not start my mini-cluster

我正在尝试使用HbaseTestingUtility测试我的Hbase代码。每次我使用下面的代码片段启动我的迷你集群时,我都会遇到异常。publicvoidstartCluster(){FileworkingDirectory=newFile("./");Configurationconf=newConfiguration();System.setProperty("test.build.data",workingDirectory.getAbsolutePath());conf.set("test.build.data",newFile(workingDirectory,"zooke

sql - Hive 中的 TRUNC 和 TO_DATE 有什么区别

您好,我想找出在Hive中使用TRUNC和TO_DATE之间的区别。目前在oracle中,我针对下面显示的数据编写了以下案例语句:ORDER_NO|NAME|DATE_|TASK_NOABC123|Humpty|07-OCT-1612:30:54|1ABC123|Humpty|07-OCT-1612:30:54|2ABC123|Humpty|07-OCT-1612:32:20|6SELECTORDER_NO,NAME,DATE_,TASK_NO(CASEWHENDATE_-LAG(DATE_)OVER(PARTITIONBYORDER_NO,NAME,TRUNC(DATE_)ORDER