unix_date_草庐IT

date - 如何在配置单元中将字符串格式转换为日期格式

我的表中有时间戳和日期列。我的日期和时间戳列是字符串类型。我需要将其转换为DATE和TIMESTAMP格式。但我数据中的格式是2/4/20173:03。因此，当我将其转换为TIMESTAMP数据类型时，它会给出NULL。我们可以做些什么来解决这个问题？这是我的示例日期和时间列数据。2/3/201723:372/3/201723:372/3/201723:402/3/201723:502/3/201723:512/3/201723:532/3/201723:552/4/20170:082/4/20170:57提前致谢最佳答案 cre

配置单何在 2017 00 23 date hadoop hive hiveql datetime-format

hadoop - 如何在 Hive 中将 array<date> 转换为 array<string>

我想将数组转换为数组字符串，这样["2016-06-02","2016-06-02"]变成2016-06-02|2016-06-02 最佳答案使用concat_ws(stringdelimiter,array)连接数组的函数:selectconcat_ws(',',collect_set(date))fromtable;如果日期字段不是字符串，则将其转换为字符串:concat_ws(',',collect_set(cast(dateasstring))) 关于hadoop-如何在Hiv

amp array section code string hadoop hive hiveql

unix - 我们可以在 linux 中使用 hadoop fsck 命令时跳过文件检查吗？

我想使用hadoopfsck命令跳过指定路径上的文件检查。我们能做到吗？我正在使用以下命令:hadoopfsck>/output.txt我也检查了hdfs指南，但是没有什么可以从上面的命令中排除路径。请帮忙。最佳答案从Hadoop2.9.0开始，无法在hadoopfsck命令中指定排除路径。但是您可以使用WebHDFSRESTAPI获取与fsck相同的文件系统健康信息。使用此API，我们可以使用LISTSTATUSapi获取目录内所有文件的信息，或使用GETFILESTATUSapi获取单个文件的信息。对于目录:curl-i"h

hadoop linux 34 section modificationTime unix hdfs

date - Hive 数据类型混淆

我有大量数据，其中一个字段类似于WedSep1519:17:44+01002010，我需要将该字段插入到Hive中。我为选择数据类型而烦恼。我尝试了时间戳和日期，但从CSV文件加载时得到空值。最佳答案数据类型是字符串，因为它是文本。如果你想转换它，我建议使用TIMESTAMP。但是，您需要在加载数据时或之后(甚至更好)自己进行此转换。要转换为时间戳，可以使用以下语法:CAST(FROM_UNIXTIME(UNIX_TIMESTAMP(,'FORMAT'))asTIMESTAMP)虽然您的格式看起来很复杂。我的建议是将它作为字符串

混淆 date section TIMESTAMP strong datetime hadoop hive

unix - 使用 SCP 将文件从 Windows 桌面移动到 vmware 上的 hadoop 沙箱

我认为这很简单，但非常感谢您的帮助。我的Windows桌面上有一个zip文件“RECEIPTS_LAB.zip”，我在vmware上运行一个hadoop沙箱。沙箱是我用mapr注册的培训类(class)的一部分，但我是初学者，不确定如何将zip文件从Windows移动到沙箱中的目录“/user/user01/3”手册使用如下代码scpRECEIPTS_LAB.zipuser01@node-ip:/user/user01/3node-ip是我在启动沙箱时得到的ip地址，假设它是192.168.88.128当我编写以下命令时:scpRECEIPTS_LAB.zipuser01@192.16

沙箱 Windows section user unix hadoop mapr

unix - Hive 变量替换在 hive -e 命令中不起作用

我正在尝试使用Hive变量。如果我登录Hive并使用:hive>seta=test_table;hive>describe${hiveconf:a};但是如果从Shell尝试相同的命令，它会给出:ParseError1:1cannotrecognizeinputnear...$>hive-e"seta=test_table;describe${hiveconf:a};"ParseError1:1cannotrecognizeinputnear 最佳答案 ParameterExpansionThe`$'characterintrodu

unix Hive parameter section code hadoop

hadoop - 在 cloudera impala 1.2.3 中使用 date_sub() udf 从 View 查询时出现连接重置错误

我已经编写了一个查询来在Impala中创建一个View。该View包含一个字段record_date，它是格式为yyyy-MM-ddhh:mm:ss的字符串数据类型。在尝试执行使用date_sub('2014-01-3000:00:00',1)提取先前日期记录的查询时，我收到如下错误:错误:与impalad通信时出错:TSocket读取0个字节。如果我尝试对创建的表而不是View执行相同的查询，我会得到正确的输出。感谢任何帮助。谢谢最佳答案这是一个错误，请升级到最新版本的Impala，因为它似乎从1.2.3开始就已修复，这是很旧

时出 cloudera 00 2009 01 hadoop impala

linux - 如何通过 unix utils 或 nmon 使用 hadoop fs 获取磁盘信息？

我已经安装了带有mfs(基于hadoopfs)的mapr和一些使用df、dfisk和nmon日志文件从文件系统获取信息的脚本。root@spbswgvml10:/opt/nmon#df-hFilesystemSizeUsedAvailUse%Mountedon/dev/sda18.8G4.4G4.0G53%/none4.0K04.0K0%/sys/fs/cgroupudev2.0G4.0K2.0G1%/devtmpfs396M464K395M1%/runnone5.0M05.0M0%/run/locknone2.0G02.0G0%/run/shmnone100M0100M0%/run/

hadoop linux cgroup type bytes unix mapr

mongodb - 带有 $date 的 mongo.input.query 不过滤输入到 hadoop

我有一个分片输入集合，我想在将其发送到我的hadoop集群以进行mapreduce计算之前对其进行过滤。我的$hadoopjar-命令中有这个参数mongo.input.query='{_id.uuid:"device-964693"}'并且有效。输出不会mapreduce任何不满足此查询的数据。但这不起作用:mongo.input.query='{_id.day:{\\$lt:{\\$date:1388620740000}}}'没有数据作为输出产生。1388620740000表示日期WedJan01201423:59:00GMT+0000(GMT)。该设置使用的是hadoop2.2、

mongodb hadoop section mongo mongodb-hadoop

unix - 如何将hadoop命令的搜索结果写入文件

我只想从hadoop中的目录中获取文件名并将其保存到hadoop或本地计算机中的不同位置。我的文件夹中有超过1000个文件，我想知道文件的名称。我尝试了以下命令，但无法将其保存到某个位置。中的文件名hadoopfs-ls/base/base1|awk'{print$NF}'|grep.json$|tr'\n''';回声$文件名；完成最佳答案 hadoopfs-ls/base/base1|awk'{print$NF}'|grep.json$|tr'\n'''>somefile.txt 关

hadoop unix section code