datetime-local

hadoop - Data locality 概念是否也适用于 Reducers？

我的理解:数据局部性的概念仅适用于Mapper，因为它处理输入文件。Reducers在处理时是否也会使用Datalocality概念？数据局部性:数据局部性是指通过对数据进行计算而不是从其位置请求数据来处理数据所在的位置。在计算数据时，Mappers和Reducers会工作。映射器在计算数据时使用数据局部性。Reducers将输入作为Mappers的输出。假设Mappers输出(中间数据)存储在不同的数据节点。Reducers在计算时是否使用数据局部性？最佳答案不，数据局部性概念仅适用于MAPPERS。Reducer是根据par

c# - 如何在查询中将 .net DateTime.Ticks 转换为 Hive DateTime？

我的日志文件在DateTime.Ticks(635677577653488758)中有一个列，我正在尝试将其转换为HadoopHive中的日期。首先，我在MySql上尝试了下面的代码块，它成功了。但是相同的代码在Hive中不起作用，因为date_add函数适用于INT。SELECTDATE_ADD('2001-01-0100:00:00',INTERVAL(MAX(f.date)-631139040000000000)/10MICROSECOND);然后我会这样格式化...SELECTDATE_FORMAT(MyDateFromTicks,'%Y-%m-%dT%T.%fZ');我怎样才

DateTime c#section code pre hadoop hive amazon-emr

datetime - 从时间戳到现在的 Apache Pig

我正在尝试使用amabari中的apachepig分析一些数据在这种特定情况下，我遇到了问题...我有一列时间戳以这种特定格式编写14333061460001422814565122使用在线转换器，如果我输入1433306146000，输出是08/30/47389@12:06pm(UTC)但事实并非如此，事实上，如果我手动删除最后3个数字(1433306146)，结果是06/03/2015@凌晨4:35(UTC)。那么，pig中有一种方法可以删除时间戳列中的最后3个数字吗？还有一个主要问题是:使用函数GetDay(datetime)如果我传递时间戳，它会起作用吗？或者有不同的方法从时间

datetime Apache section timestamp ToDate hadoop apache-pig hortonworks-data-platform ambari

java - 从 Windows 机器加载 Hive 表(Load data local inpath)

我正在尝试使用来自Windows的文件加载Hive表。但是我收到以下错误:java.sql.SQLException:Errorwhilecompilingstatement:FAILED:IllegalArgumentExceptionjava.net.URISyntaxException:Expectedscheme-specificpartatindex2:C:我正在使用TalendETL工具来处理文件。下面是Talend生成的代码:Stringpath_tHiveLoad_1="file:///C:/employee.txt";Stringtablename_tHiveLoad

Windows inpath section tHiveLoad 34 java hadoop hive talend

datetime - 创建具有不规则日期/时间格式列的 Hive 表

我必须从csv创建一个Hive表，其中两列有一个日期/时间字段，格式如下:11/28/20188:35:23PM或11/30/20185:02:17AM等例如:responseidprocess_startprocess_endstatus2611/28/20188:35:23PM11/30/20185:02:17AMcomplete我知道我可以先将这些字段创建为字符串，然后再执行如下操作:insertintotablenewtableselectprocess_start,from_unixtime(unix_timestamp(process_start,'dd-MM-yyyyHH

不规则 datetime code section process hadoop hive hiveql simpledateformat

hadoop - 执行 Pig 脚本 -x local script.pig 和 just script.pig 之间的区别

目前我正在执行我的脚本:/usr/bin/pig/somepath/myscript.pig出于某种原因，pig总是卡在这个阶段。2014-01-2816:49:31,328[main]INFOorg.apache.pig.backend.hadoop.executionengine.mapReduceLayer.MapReduceLauncher-0%complete如果我用`/usr/bin/pig-xlocal/somepath/myscript.pig`出于某种原因提示路径:Input(s):Failedtoreaddatafrom"file:///path_from_root

script pig strong code hadoop apache-pig

hadoop - "LOAD DATA LOCAL INPATH"如何到远程hiveserver

我想使用“LOADDATALOCALINPATH..”在本地机器上导入文件但是，我不能导入$beeline-ujdbc:hive2://example:10000-e"LOADDATALOCALINPATH'tmp/file_20161024.dat'OVERWRITEINTOTABLEsome_tablePARTITION(dt=20161024);"Connectingtojdbc:hive2://example:10000Connectedto:ApacheHive(version2.1.0)Driver:HiveJDBC(version1.2.1)Transactionisol

hiveserver amp 20161024 code section hadoop hive beeline

datetime - hdfs 文件时间戳

我想获取hdfs上文件的最后修改时间。我检查了HDFSshell指南，但没有得到任何可用的相关命令。Hadoop版本为2.4.0。谁能建议我如何获取hdfs文件的last_modification时间？提前致谢最佳答案您可以从hadoopls命令检索时间戳并使用awk解析它。文件/目录时间戳有模式。对于文件，它是permissionsnumber_of_replicasuseridgroupidfilesizemodification_datemodification_timefilename它是目录permissionsuse

datetime hdfs section hadoop modification

java - Jobtracker API 错误 - 调用 localhost/127.0.0.1 :50030 failed on local exception: java. io.EOFException

我正在尝试使用Java连接我的jobtracker。下面显示的是我正在尝试执行的程序publicstaticvoidmain(Stringargs[])throwsIOException{Configurationconf=newConfiguration();conf.addResource(newPath("/home/user/hadoop-1.0.3/conf/core-site.xml"));conf.addResource(newPath("/home/user/hadoop-1.0.3/conf/hdfs-site.xml"));conf.addResource(newP

java EOFException hadoop conf mapreduce hdfs

hadoop - 在 Hive 中， "Load data local inpath"是覆盖现有数据还是追加？

我希望在cron上运行到Hive的导入，并且希望只使用“将数据本地输入路径‘/tmp/data/x’加载到表X”到表中就足够了。后续命令会覆盖表中已有的内容吗？还是会追加？最佳答案本站http://wiki.apache.org/hadoop/Hive/LanguageManual在处理Hive时是你的friend。:)解决将数据加载到Hive的页面是http://wiki.apache.org/hadoop/Hive/LanguageManual/DML该页面指出iftheOVERWRITEkeywordisusedthent

amp hadoop section Hive the hbase hdfs

65 66 676869 70 71