UNIX_TIMESTAMP

apache-spark - Hive unix_timestamp 在源列中的毫秒数不起作用

我正在使用Hive1.1a_ingestion_dtm中最后六位代表毫秒。但是如果我也指定模式，unix_timestamp配置单元函数会给我相同的结果那么我如何获得包含毫秒的unix_timestamp结果selecta_ingestion_dtm,unix_timestamp(a_ingestion_dtm)fromomegalimit10;+-----------------------------+-------------+--+|a_ingestion_dtm|_c1|+-----------------------------+-------------+--+|2019

java - 在 Java 程序中从 Unix 路径读取一个 hadoop 配置文件

我正在开发一个Java应用程序，这个应用程序正在将结果数据保存到HDFS。Java应用程序应该在我的Windows机器上运行。截至目前，我已将核心站点、hdfs-site.xml等Hadoop配置文件复制到我的Windows机器中并进行测试。下面是我的配置代码片段。config.addResource(newPath("C:\\Hadoop\\core-site.xml"));config.addResource(newPath("C:\\Hadoop\\hdfs-site.xml"));config.addResource(newPath("C:\\Hadoop\\mapred-si

hadoop java addResource section config hadoop2

date - unix_timestamp 函数在 Hive 中将 2 位格式年份转换为 4 位格式年份的逻辑是什么？

例如下面的hive脚本selectfrom_unixtime(unix_timestamp('30-Apr-50','dd-MMM-yy'),'yyyy-MM-dd')asdate1,from_unixtime(unix_timestamp('30-Apr-45','dd-MMM-yy'),'yyyy-MM-dd')asdate2,from_unixtime(unix_timestamp('30-Apr-35','dd-MMM-yy'),'yyyy-MM-dd')asdate3;结果如下date1date2date31950-04-301945-04-302035-04-30将2位数年

unix_timestamp timestamp 39 SimpleDateFormat date hadoop hive

unix - 配置单元 time_stamp 转换为 UTC 与 time_offset in UTC

我有2列:time_stamp和time_offset。两者都是STRING数据类型。我们如何借助UTC中的第二列将一列值转换为UTC？他们是将time_stamp列转换为UTC的任何配置单元还是来自unix的解决方案？hive>selecttime_stampfromtable1limit2;OK20170717-22:31:57.34820170719-21:10:15.393[yyyymmdd-hh:mm:ss.msc]thiscolumnisinlocaltimehive>selecttime_offsetfromtable1limit2;OK-05:00+05:00[‘+hh

配置单 time code time_stamp unix hadoop hive apache-pig hadoop2

hadoop - Hive unix_timestamp 函数计算不匹配

我正在尝试编写一个Hive查询，它将6小时添加到时间戳值，然后将其与其他时间戳进行比较。我使用的方法是使用unix_timestamp()函数转换时间戳，然后加上21600秒，使最终值比初始值提前6小时。hive>selectunix_timestamp('2014-11-0200:58:20')fromunix_tmplimit1;OK14149079001414907900+6*60*60=1414929500hive>selectfrom_unixtime(1414929500)fromunix_tmplimit1;OK2014-11-0205:58:20我认为小时值应该是06而

数计 unix_timestamp timestamp code blockquote hadoop hive bigdata

date - Hadoop 黑斑羚 : Format datatype integer to date/timestamp to use addtime function

我在Impala中使用下表:customer_id|day_id|return_day_idABC2017083020170923BCD2017083020170901不幸的是，day_id和return_day_id字段都是INT而不是日期。如何将它们的数据类型更改为日期，以便我可以在day_id之后的4天内仅使用return_day_id计算不同的customer_id。我是否需要将其转换为日期，然后转换为时间戳，以便我可以使用adddate函数？最佳答案其中一条评论正确指出，您需要使用unix_timestamp和from

黑斑 date section code day_id hadoop timestamp type-conversion impala

unix - Unix 中的用户无法运行 hadoop 命令

我安装了Hadoop并创建了一个名为hduser的用户，并将hadoop文件夹的所有者更改为hduser。安装Hadoop后，我尝试执行hadoop命令来检查它是否已安装，但它给出“hadoop”命令未找到。然后我将hduser的执行权限授予了hadoop文件夹中所有文件的执行权限，包括bin文件夹但输出仍然相同。当我以root身份尝试使用相同的hadoop命令时，它工作正常。我认为它与unix命令有关。请帮助我给我的用户授予执行hadoop命令的权限。还有一件事，如果我切换到root，那么hadoop命令可以正常工作。最佳答案

hadoop unix code section installation

java - 运行第一个 Hadoop(在 unix 上)程序(在 Windows 7 上)

我有VMWare和运行Hadoop的UNIX机器，在同一台机器上我有在Windows7上使用Java运行的示例代码。代码是从这里得到的:http://pragmaticintegrator.wordpress.com/2013/08/16/writing-a-hadoop-mapreduce-task-in-java/我只是想运行一个mapreduce的例子，我还是不明白程序是如何连接到Hadoop实例的，我的代码中需要在哪里定义它？实际上，我的问题是我需要如何连接两者？是否有任何我需要使用Hadoop凭据更新的数据源文件？还是我做错了什么？最佳答案

Windows Hadoop section java unix virtual-machine vmware

sql - 从配置单元表或 unix 中删除垃圾字符

我们在hive中有如下表，我们在生成时从hive数据生成平面文件，我们发现数据中有垃圾字符，如下所示，我们在许多列中有许多字符，任何人都可以帮助我们从配置单元表或unix文件中删除那些垃圾字符？ÿ,ä,í,ã这里的问题是，相同的数据在加载到那里的数据库时需要发送到下游，它显示为双美元，但我们将代码设计为双美元作为列分隔符。最佳答案基本概念hive>selectregexp_replace('Hÿelloäíworlãd','[^a-zA-Z]','');OKHelloworld演示从整个表中删除不需要的字符并将其导出到文件。cr

配置单 unix code 39 pre sql regex hadoop hive hiveql

scala - Hadoop FileUtils 无法从 Scala 在本地(Unix)文件系统上写入文件

我正在尝试使用org.apache.hadoop.fs的文件系统库将文件写入本地FileSystem。下面是我在大scala代码中的一个线性代码，它应该这样做，但事实并非如此。fs.copyToLocalFile(false,hdfsSourcePath,newPath(newFile.getAbsolutePath),true)newFile的值为:valnewFile=newFile(s"${localPath}/fileName.dat")localPath只是一个包含本地磁盘上完整路径的变量。hdfsSourcePath是HDFS位置的完整路径。作业正常执行，但我没有看到在本地

FileUtils Hadoop code section amp scala apache-spark