草庐IT

LOG_DATE

全部标签

hadoop - Apache pig : Calculate number of days between a date and current date

我有一个格式为(#,title,year,rating,duration)的电影列表:1,TheNightmareBeforeChristmas,1993,3.9,45682,TheMummy,1932,3.5,43883,OrphansoftheStorm,1921,3.2,90624,TheObjectofBeauty,1991,2.8,61505,NightTide,1963,2.8,51266,OneMagicChristmas,1985,3.8,53337,Muriel'sWedding,1994,3.5,63238,Mother'sBoys,1994,3.4,57339,N

python - 使用 Spark 的默认 log4j 配置文件 : org/apache/spark/log4j-defaults. 属性将默认日志级别设置为 "WARN"

我是spark的新手,我将spark2.1.0与python2.7一起使用,但无法正常工作。我一直在寻找一个星期来找到我的问题的解决方案,但没有成功。当我在commmadLine中运行pyspark时出现以下错误:Python2.7.13(v2.7.13:a06454b1afa1,Dec172016,20:42:59)[MSCv.150032bit(Intel)]onwin32Type"help","copyright","credits"or"license"formoreinformation.UsingSpark'sdefaultlog4jprofile:org/apache/s

date - 如何在配置单元中将字符串格式转换为日期格式

我的表中有时间戳和日期列。我的日期和时间戳列是字符串类型。我需要将其转换为DATE和TIMESTAMP格式。但我数据中的格式是2/4/20173:03。因此,当我将其转换为TIMESTAMP数据类型时,它会给出NULL。我们可以做些什么来解决这个问题?这是我的示例日期和时间列数据。2/3/201723:372/3/201723:372/3/201723:402/3/201723:502/3/201723:512/3/201723:532/3/201723:552/4/20170:082/4/20170:57提前致谢 最佳答案 cre

hadoop - 如何在 Hive 中将 array<date> 转换为 array<string>

我想将数组转换为数组字符串,这样["2016-06-02","2016-06-02"]变成2016-06-02|2016-06-02 最佳答案 使用concat_ws(stringdelimiter,array)连接数组的函数:selectconcat_ws(',',collect_set(date))fromtable;如果日期字段不是字符串,则将其转换为字符串:concat_ws(',',collect_set(cast(dateasstring))) 关于hadoop-如何在Hiv

hadoop - AWS Athena 在分区加载后创建缩进并将值移动到错误的列中

我遇到了以下问题:我在没有分区的HDFS中的EMR集群中创建了一个Hive表并向其加载数据。我根据第1段中的表,但带有日期时间的分区列:PARTITIONEDBY(年STRING,月STRING,日STRING)。我将非分区表中的数据加载到分区表中并获得有效结果。我创建了一个Athena数据库和具有与Hive表相同结构的表。我从本地HDFS复制分区文件,并通过awss3sync将所有文件传输到S3空存储桶中。所有文件均已无误地传输,并且传输顺序与HDFS中Hive目录中的顺序相同。我通过MSCKREPAIRTABLE加载分区并且在输出中没有得到任何错误。之后我发现很多值都有缩进,例如需

java - 如何使用 log4j.properties 使日志文件根据大小旋转并压缩

主题-RollingFileAppender,以及如何压缩旋转的文件RollingfileAppender根据文件大小旋转日志文件。MaxFileSize表示文件的最大大小,而MaxBackupIndex表示要保存在日志文件夹中的文件数量。示例属性文件如下:1log4j.rootLogger=INFO,fileLogger2log4j.appender.fileLogger=org.apache.log4j.RollingFileAppender3log4j.appender.fileLogger.layout=org.apache.log4j.PatternLayout4log4j.

date - Hive 数据类型混淆

我有大量数据,其中一个字段类似于WedSep1519:17:44+01002010,我需要将该字段插入到Hive中。我为选择数据类型而烦恼。我尝试了时间戳和日期,但从CSV文件加载时得到空值。 最佳答案 数据类型是字符串,因为它是文本。如果你想转换它,我建议使用TIMESTAMP。但是,您需要在加载数据时或之后(甚至更好)自己进行此转换。要转换为时间戳,可以使用以下语法:CAST(FROM_UNIXTIME(UNIX_TIMESTAMP(,'FORMAT'))asTIMESTAMP)虽然您的格式看起来很复杂。我的建议是将它作为字符串

hadoop - 在 cloudera impala 1.2.3 中使用 date_sub() udf 从 View 查询时出现连接重置错误

我已经编写了一个查询来在Impala中创建一个View。该View包含一个字段record_date,它是格式为yyyy-MM-ddhh:mm:ss的字符串数据类型。在尝试执行使用date_sub('2014-01-3000:00:00',1)提取先前日期记录的查询时,我收到如下错误:错误:与impalad通信时出错:TSocket读取0个字节。如果我尝试对创建的表而不是View执行相同的查询,我会得到正确的输出。感谢任何帮助。谢谢 最佳答案 这是一个错误,请升级到最新版本的Impala,因为它似乎从1.2.3开始就已修复,这是很旧

java - Apache Flume/var/log/flume-ng/flume.log(权限被拒绝)

我正在尝试从/home/cloudera/Documents/flume/读取日志文件并使用apacheflume将其写入hdfs。我使用以下命令在hdfs中创建flumeLogTest文件夹:sudo-uhdfshadoopfs-mkdirflumeLogTestsudo-uhdfshadoopfs-chownflume:flumeflumeLogTest我的配置文件是:agent.sources=srcagent.channels=chagent.sinks=snkagent.sources.src.type=execagent.sources.src.command=tail-f

hadoop - 登录 Hive,log4j 文件

我正在尝试通过命令窗口访问Hive。我只是在适当的目录中运行“Hive”,但出现错误“登录被拒绝”。我读过log4j用于登录,但我不知道我是否必须创建一个帐户并在那里写入我的用户数据。非常感谢 最佳答案 Hive服务现在应该可以正常工作了。从您自己的FI-LAB虚拟机,您只需使用您的Cosmos凭据登录到头节点(如果您没有Cosmos凭据,请通过注册here获取):[root@your_filab_vm]$sshcosmos.lab.fi-ware.org登录到头节点后,键入以下命令:[your_cosmos_username@co