草庐IT

calendar_event_path

全部标签

java - 如何从 HDFS 中的 Path 获取绝对路径

我是HDFS的新手,遇到了以下问题:org.apache.hadoop.fs.Path没有类似getAbsolutePath的方法返回字符串。toString方法没有正确记录,因此使用它是否可靠? 最佳答案 org.apache.hadoop.fs.Path应该返回完整路径。是的,toString方法几乎没有任何文档,但它可以正常工作!也许这也行:Pathp=fs.getFileStatus(newPath(".")).getPath();URI(p.toString()).getPath();引用:http://lucene.47

hadoop - Hive 安装失败,出现错误 "Relative path in absolute URI"

这是我尝试运行Hive时得到的结果:SLF4J:ClasspathcontainsmultipleSLF4Jbindings.SLF4J:Foundbindingin[jar:file:/usr/local/hive/lib/log4j-slf4j-impl-2.4.1.jar!/org/slf4j/impl/StaticLoggerBinder.class]SLF4J:Foundbindingin[jar:file:/home/techdevabhi/hadoop-2.7.2/share/hadoop/common/lib/slf4j-log4j12-1.7.10.jar!/org/

scala - org.apache.spark.sql.AnalysisException : Reference 'dattim' is ambiguous, 可能是 : dattim#6, event_dattim#55.;

我有一个连接的数据帧,其中包含一个where子句,表明dataStampe在一个范围内:valstartTime=newTimestamp(NewDate.atStartOfDay.toEpochSecond(ZoneOffset.UTC)*1000)valendTime=newTimestamp(NewDate.plusDays(1).atStartOfDay.toEpochSecond(ZoneOffset.UTC)*1000)valjoinedTable=table1.join(table2,table1("date")===table1("key")&&....).where(

java - hadoop 日志中的 "complete event for unknown container id"是什么意思?

我正在尝试对集群中的多个文件运行一个简单的作业(wordcount示例),但大多数map都失败了。当我引用任务日志时,我只看到这样的错误:ERROR[RMCommunicatorAllocator]org.apache.hadoop.mapreduce.v2.app.rm.RMContainerAllocator:Containercompleteeventforunknowncontaineridcontainer_1388066512888_0001_01_000026有什么想法吗?更新:我多次检查作业,有时由于map故障而失败,有时由于减少故障而在极少数情况下成功完成。但在任何情

java - dfs.data.dir : Failed to set permissions of path:\tmp\hadoop-user\dfs\data to 0755 中的无效目录

我是hadoop框架的新手,目前我正在处理大数据项目,在Windows7中使用cygwin、hadoop-0.19.1、eclipse-3.3.1(Europa)。现在我正在尝试从hadoop-0.19进行更改.1到hadoop-1.2.1version.i如下配置hadoop-1.2.1核心站点.xml:fs.default.namehdfs://localhost:9100hdfs.xmldfs.replication1mapred-site.xmlmapred.job.trackerlocalhost:9101但是我在启动数据节点时出错,如下所示$bin/hadoopdatano

scala - Spark : Calculate event end time on 30-minute intervals based on start time and duration values in previous rows

我有一个带有event_time字段的文件,每条记录每30分钟生成一次,并指示事件持续了多少秒。示例:Event_time|event_duration_seconds09:00|80009:30|180010:00|270012:00|100013:00|1000我需要将连续的事件转换为一个具有持续时间的事件。输出文件应如下所示:Event_time_start|event_time_end|event_duration_seconds09:00|11:00|530012:00|12:30|100013:00|13:30|1000ScalaSpark中是否有一种方法可以将数据帧记录与

linux - 修改 hadoop 作业中的 LD_LIBRARY_PATH JAVA_LIBRARY 和 CLASSPATH

在集群上运行hadoop作业之前,我需要修改LD_LIBRARY_PATHJAVA_LIBRARY_PATH和CLASSPATH。在LD_LIBRARY_PATH和JAVA_LIBRARY_PATH中,我需要添加运行作业时所需的一些jar的位置,因为这些jar在我的集群中可用,类似于CLASSPATH。我有一个3节点集群,我需要修改所有3个数据节点的LD_LIBRARY_PATH和CLASSPATH,以便将我的集群节点上可用的jar添加到类路径,以便在运行时可以使用以下jar作业,因为我在运行作业时避免jar分发以使用集群节点上所有可用的jar。我已经尝试了下面给出的选项1.我试过修改

hadoop - HDFS:FileSystem.exists(path) 在现有资源上返回 false?

我在本地运行的HadoopHDFS(我的工作站是名称/数据节点)中遇到文件访问困难。在我的HDFS中,我有一个位于文件夹"/huser/data.txt"中的文件我可以用hdfsdfs-ls/huser确认该文件存在。我通过调用FileSystem.get(uri,config)创建文件系统,uri是hdfs://localhost:9000如果我调用org.apache.hadoop.fs.FileSystem的exist方法,我总是得到一个false作为返回值。我尝试了各种参数组合,但我想知道我做错了什么:fs.exists(newPath("hdfs:/huser/data.tx

java - 无法解压 snappy 文件,即使指定了 -Djava.library.path=/*/*/

线程“main”中的异常java.lang.RuntimeException:nativesnappylibrarynotavailable:thisversionoflibhadoopwasbuiltwithoutsnappysupport.atorg.apache.hadoop.io.compress.SnappyCodec.checkNativeCodeLoaded(SnappyCodec.java:65)atorg.apache.hadoop.io.compress.SnappyCodec.getDecompressorType(SnappyCodec.java:193)ato

Java nio Path 与常规 java File API

这个问题是关于java.nio包的,特别是Path类。我一直使用标准的JavaFileAPI,以及FileUtils来进行基于文件的操作、读取、写入、检查可用性等……而且我从来没有遇到过太大的问题……...但是,我最近看到很多人在java.nio包中使用Path类。似乎PathAPI中没有与旧文件API的明确链接。因此我有3个问题,希望它们能帮助我重新定位自己与PathAPI的精神。1)我们是否正在朝着弃用或减少使用java.ioFile类的方向发展?2)采用java.nioPath类进行文件操作的好处/原因是什么?和3)(不太重要,但知道真的很有帮助...)java.nio路径和or