草庐IT

DateTime-Local

全部标签

hadoop - MrJob 花费大量时间 Copy local files into hdfs

我遇到的问题是:已经将我的input.txt(50MBytes)文件放入HDFS,我正在运行python./test.pyhdfs:///user/myself/input.txt-rhadoop--hadoop-bin/usr/bin/hadoopMrJob似乎花了很多时间将文件复制到hdfs(又是?)Copyinglocalfilesintohdfs:///user/myself/tmp/mrjob/test.myself.20150927.104821.148929/files/这符合逻辑吗?它不应该直接从HDFS使用input.txt吗?(使用Hadoop版本2.6.0)

hadoop - 批处理模式中的 livy 抛出错误 Error : Only local python files are supported: Parsed arguments

我尝试通过提交python文件以批处理模式执行livy但它不起作用,我尝试了两种方法-从本地文件系统运行py文件,同时通过将它复制到那里在hdfs上运行它......但它不工作......请帮忙hduser@tarun-ubuntu:/home/tarun/spark/examples/src/main/python$curl-XPOST-H"Content-Type:application/json"tarun-ubuntu:8998/batches--data'{"file":"file:///home/tarun/spark/examples/src/main/python/pi

hadoop - 使用 tera gen 时从 kv.local/172.20.12.168 调用 localhost :8020 failed on connection exception,

我正在使用hadoopteragen检查hadoopmapreduce与terasort的基准测试。但是当我运行以下命令时,hadoopjar/Users/**/Documents/hadoop-2.6.4/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.4.jarteragen-Dmapreduce.job.maps=1001trandom-data我得到以下异常,17/06/0115:09:21WARNutil.NativeCodeLoader:Unabletoloadnative-hadooplibraryforyourp

datetime - Hue 中的 Hive 变量

在尝试声明变量时,然后在Hive(Web客户端)上的Hive中使用该变量运行查询。它不起作用。setMAX_DATE='2017-05-2207:35:25';select*fromtableawheredatetime=${hivevar:Max_Date}limit1出现以下错误信息:Errorwhilecompilingstatement:FAILED:ParseExceptionline1:83cannotrecognizeinputnear'$''{''hivevar'inexpressionspecification 最佳答案

hadoop - 阻止 sqoop 将 datetime 转换为 bigint

最近我注意到,每当我使用Sqoop从SQL数据库中提取数据时,所有日期时间字段都会转换为bigint(epoch*1000)而不是字符串。重要提示:我存储为Parquet。我一直在尝试一堆sqoop标志,例如"--map-column-java"但我不想为数千个表中的数百列手动定义它。我缺少什么标志来防止这种sqoop行为?sqoop在明文存储的时候好像没有这样做 最佳答案 我决定不让sqoop在我的table上施展神秘魔法,而是决定执行以下操作:提取到临时表,以文本形式存储。像临时表一样创建一个表(如果不存在),存储为parque

datetime - Apache Cassandra 时区问题

我正在尝试使用人才将数据从MSSQL移动到cassandra,但是我遇到了timezone问题,因为MSSQL在CST时区,而Cassandra有时区Etc/协调世界时。尝试更改以下配置文件Location:/opt/apache-cassandra-3.9/conf/文件:cqlshrc.sample从:timezone=Etc/UTC更改为:timezone=CST但cqlsh仍然显示UTC时间戳cqlsh>selecttoTimestamp(now())fromsystem.local;系统.totimestamp(system.now())2017-01-0406:38:45.

Hadoop : java. io.IOException : No valid local directories in property: mapred. local.dir

当我运行hadoop作业时,它失败并显示以下堆栈跟踪:11/10/0613:12:49INFOmapred.FileInputFormat:Totalinputpathstoprocess:111/10/0613:12:49INFOmapred.JobClient:Cleaningupthestagingareahdfs://localhost:54310/app/hadoop/tmp/mapred/staging/Har/.staging/job_201110051450_000711/10/0613:12:49ERRORstreaming.StreamJob:ErrorLaunch

hadoop - 如何在配置单元中将 bigint 转换为 datetime?

我使用sqoop导入命令将数据从teradatasqoop到Hive。对于teradata中的一个表,我有一个日期字段。sqooping之后,我的日期字段显示为bigint数据类型的时间戳。但我需要日期字段作为配置单元表中的日期数据类型。任何人都可以建议我实现这一目标吗? 最佳答案 selectto_date(from_unixtime(yourtimestamp));example:selectto_date(from_unixtime(1490985000));output:2017-04-01我希望它能奏效。如果我错了,请告诉

Hadoop on CentOS streaming example with python - permission denied on/mapred/local/taskTracker

我已经能够使用python映射器和缩减器设置流式示例。mapred文件夹位置是/mapred/local/taskTrackerroot和mapred用户都拥有此文件夹和子文件夹的所有权然而,当我运行我的流式传输时,它会创建map但不会减少并给出以下错误无法运行程序/mapred/local/taskTracker/root/jobcache/job_201303071607_0035/attempt_201303071607_0035_m_000001_3/work/./mapper1.py权限被拒绝我注意到,虽然它为mapred/local/taskTracker及其所有子目录提供

hadoop - 如何覆盖 mapred-site.xml 中的 mapred.local.dir?

我没有对mapred-site.xml中mapred.local.dir指定的目录的写入权限(也没有对mapred-site.xml的写入权限)有没有一种方法可以在每个session基础上覆盖此属性用于我的Hive作业? 最佳答案 您可以尝试通过执行以下查询在Hivesession中设置它:setmapred.local.dir='somedir';这应该有效。另一种选择是更改Hive引用的mapred-site.xml。确保配置未标记为最终配置。在这种情况下,它不能被覆盖。 关于had