草庐IT

datetime-format

全部标签

c# - 如何在查询中将 .net DateTime.Ticks 转换为 Hive DateTime?

我的日志文件在DateTime.Ticks(635677577653488758)中有一个列,我正在尝试将其转换为HadoopHive中的日期。首先,我在MySql上尝试了下面的代码块,它成功了。但是相同的代码在Hive中不起作用,因为date_add函数适用于INT。SELECTDATE_ADD('2001-01-0100:00:00',INTERVAL(MAX(f.date)-631139040000000000)/10MICROSECOND);然后我会这样格式化...SELECTDATE_FORMAT(MyDateFromTicks,'%Y-%m-%dT%T.%fZ');我怎样才

datetime - 从时间戳到现在的 Apache Pig

我正在尝试使用amabari中的apachepig分析一些数据在这种特定情况下,我遇到了问题...我有一列时间戳以这种特定格式编写14333061460001422814565122使用在线转换器,如果我输入1433306146000,输出是08/30/47389@12:06pm(UTC)但事实并非如此,事实上,如果我手动删除最后3个数字(1433306146),结果是06/03/2015@凌晨4:35(UTC)。那么,pig中有一种方法可以删除时间戳列中的最后3个数字吗?还有一个主要问题是:使用函数GetDay(datetime)如果我传递时间戳,它会起作用吗?或者有不同的方法从时间

Hadoop MapReduce : Custom Input Format

我有一个文件,其中包含文本和“^”之间的数据:一些文字^在这里^还有一些^更多到这里我正在编写自定义输入格式以使用“^”字符分隔行。即映射器的输出应该是这样的:一些文字去这里还有一些更多内容在这里我编写了一个扩展FileInputFormat的自定义输入格式,还编写了一个扩展RecordReader的自定义记录阅读器。下面给出了我的自定义记录阅读器的代码。我不知道如何处理这段代码。在WHILE循环部分使用nextKeyValue()方法时遇到问题。我应该如何从拆分中读取数据并生成自定义键值?我正在使用所有新的mapreduce包而不是旧的mapred包。publicclassMyRec

datetime - 创建具有不规则日期/时间格式列的 Hive 表

我必须从csv创建一个Hive表,其中两列有一个日期/时间字段,格式如下:11/28/20188:35:23PM或11/30/20185:02:17AM等例如:responseidprocess_startprocess_endstatus2611/28/20188:35:23PM11/30/20185:02:17AMcomplete我知道我可以先将这些字段创建为字符串,然后再执行如下操作:insertintotablenewtableselectprocess_start,from_unixtime(unix_timestamp(process_start,'dd-MM-yyyyHH

java - 运行 bin/hadoop namenode -format 时出现 fatal error

运行bin/hadoopnamenode-format时出现fatalerror使用Windows7操作系统,在C:\cygwin\usr\local\hadoop-0.20.203.0\conf下编辑hadoop-env.sh文件,#exportJAVA_HOME=C:/ProgramFiles/Java/jdk1.6.0_24exportJAVA_HOME=C:/jdk1.6.0_24.我将我的Java类路径设置为C:/jdk1.6.0_24。FatalError]hdfs-site.xml:5:2:Themarkupinthedocumentfollowingtherootele

hadoop - Apache pig : Can we convert a custom Writable object to Pig format?

我们有一个自定义可写值对象的SequenceFile,该对象本质上等同于Pig中的复杂包数据类型。有没有一种方便的方法,我们可以编写自定义函数将hadoopWritable对象转换为bag数据类型,然后使用pig脚本对其进行处理? 最佳答案 一种选择是查看elephant-bird-如果你向下滚动这个github页面到README部分,它有一个关于Pig的部分:PigIncludesconverterinterfaceforturningTuplesintoWritablesandviceversa我从来没有用过它,我想你必须自己实

java - 如何为Hadoop Input Format中的一个输入行生成多个键值对?

这是背景。我的MapReduce作业(示例)有以下输入:ApacheHadoopApacheLuceneStackOverflow....(实际上每一行代表一个用户查询。这里不重要。)我希望我的RecordReader类读取一行,然后将几个键值对传递给映射器。例如,如果RecordReader获取ApacheHadoop,那么我希望它生成以下键值对并将其传递给映射器:ApacheHadoop-1ApacheHadoop-2ApacheHadoop-3(“-”是这里的分隔符。)我发现RecordReader在next()方法中传递键值:next(key,value);每次调用Record

java - $ bin/hadoop namenode -format STARTUP_MSG : host = java.net.UnknownHostException:

我目前正在通过http://tecadmin.net/steps-to-install-hadoop-on-centosrhel-6/学习Hadoop在第5步,当我应用此命令时$bin/hadoopnamenode-format我收到以下错误我还检查了这些链接以解决我的问题"hadoopnamenode-format"returnsajava.net.UnknownHostExceptionjava.net.UnknownHostException:Invalidhostnameforserver:local我不知道配置文件中的域名在哪里可以用localhost替换它。我还去了/etc

hadoop - 执行 hdfs namenode -format 时出错

我是hadoop、hdfs的新手..我已经完成了接下来的步骤:我已经在三个名称节点中启动了zookeeper:*vagrant@172:~$zkServer.shstart我可以看到状态:*vagrant@172:~$zkServer.shstatus结果状态:JMXenabledbydefaultUsingconfig:/opt/zookeeper-3.4.6/bin/../conf/zoo.cfgMode:follower用jps命令只出现jps有时也会出现quaroom:*vagrant@172:~$jps2237Jps我也运行下一个命令。*vagrant@172:~$hdfsz

datetime - hdfs 文件时间戳

我想获取hdfs上文件的最后修改时间。我检查了HDFSshell指南,但没有得到任何可用的相关命令。Hadoop版本为2.4.0。谁能建议我如何获取hdfs文件的last_modification时间?提前致谢 最佳答案 您可以从hadoopls命令检索时间戳并使用awk解析它。文件/目录时间戳有模式。对于文件,它是permissionsnumber_of_replicasuseridgroupidfilesizemodification_datemodification_timefilename它是目录permissionsuse