草庐IT

custom-formatting

全部标签

hadoop - 如何让EMR先执行customer jar

因为hadoop1.0.3不支持bzip2解压缩,所以我从hadoop2.2复制相同的类到我的项目中,但是我的项目(或者我们称之为jar)仍然在hadoop1.0.3集群上运行。我发现hadoop仍然执行1.0.3中的类,即新类没有被执行。我如何配置才能首先使用我自己的jar中的类。我知道我们可以使用类似的东西:hadoopjarcollect_log.jarcom.TestCol-Dmapreduce.task.classpath.user.precedence=true但是现在我正在使用EMR,所以我不知道如何在EMR中设置优先级。非常感谢! 最佳答案

java - hadoop java.io.IOException : while running namenode -format on OSX 错误

我在格式化namenode时遇到以下错误,我已经尝试使用sudosu,正如其他一些堆栈溢出解决方案中提到的那样,但我仍然遇到此错误,请协助。14/01/1616:10:41INFOutil.GSet:ComputingcapacityformapINodeMap14/01/1616:10:41INFOutil.GSet:VMtype=64-bit14/01/1616:10:41INFOutil.GSet:1.0%maxmemory=889MB14/01/1616:10:41INFOutil.GSet:capacity=2^20=1048576entries14/01/1616:10:4

regex - Hadoop Hive SerDe Row Format for String Quoted Space delimited file

我正在尝试为具有以下格式的日志文件创建一个Hive表。日志文件:#Software:1#Version:1#Start-Date:xx#Date:xx#Fields:datetimetime-takenc-ipcs-usernamecs-auth-groupx-exception-idsc-filter-resultcs-categoriescs(Referer)sc-statuss-actioncs-methodrs(Content-Type)cs-uri-schemecs-hostcs-uri-portcs-uri-pathcs-uri-querycs-uri-extensionc

unit-testing - MR单元 : Tests fail with custom writable

我正在尝试使用MRUnit为我的hadoop作业实现单元测试.对于我自己的Writable,断言在withOutput(K2k2,V2v2)失败。我已经尝试覆盖Object的equals(Objecto)方法,但这没有帮助。当两个Writable实际上相同时,有什么想法可以告诉MRUnit吗? 最佳答案 为了使runTest()成功,必须覆盖inthashCode()。 关于unit-testing-MR单元:Testsfailwithcustomwritable,我们在StackOve

linux - 从主节点执行命令 "hadoop namenode -format "时出错?

我已经配置了hadoop(多节点设置)。在启动hadoop之前,我想为此格式化名称节点,我运行以下命令-->>hadoopnamenode-format它给出了一个错误-->/home/sandip/project/hadoop-1.1.2/bin/hadoop:line320:/usr/lib/jvm/java-6-openjdk-i386/jre/bin/java/bin/java:Notadirectory/home/sandip/project/hadoop-1.1.2/bin/hadoop:line390:/usr/lib/jvm/java-6-openjdk-i386/jr

java - Apache 紧缩 : how to create custom counters

我想添加自定义counters到我的ApacheCrunch使用org.apache.hadoop.mapreduce.Reducer.Context.getCounterAPI的作业。有人知道如何从Crunch管道访问上下文吗? 最佳答案 最明显的地方是org.apache.crunch.DoFn#getCounter你猜怎么着?它在那里... 关于java-Apache紧缩:howtocreatecustomcounters,我们在StackOverflow上找到一个类似的问题:

java - 亚马逊电子病历 : Passing java system property to custom jar

AmazonEMR是否允许将系统属性传递给自定义jar,例如hadoopjar-Dkey=valuemyjob.jar?(上面的key,value在应用程序本身的初始化期间使用,而不是属于hadoop的Configuration对象。)相关话题Howtospecifymapredconfigurations&javaoptionswithcustomjarinCLIusingAmazon'sEMR?讨论了仅通过引导操作将系统属性传递给hadoop守护进程的方法,显然,这不允许对java入口点类执行相同的操作。 最佳答案 如果您不想将

hadoop - 使用哪个 : Custom datatype or TwoDArrayWritable

为了发出2个矩阵作为键值对:Key-MatrixA值-矩阵B。我应该创建一个自定义数据类型还是可以直接使用TwoDArrayWritable?那么自定义类中的compareTo()方法呢? 最佳答案 您肯定需要为您的Key编写一个自定义类,因为TwoDArrayWritable没有实现WritableComparable(即使您只是扩展TwoDArrayWritable类添加接口(interface)和compareTo方法)。至于是否应该在自定义类上使用TwoDArrayWritable-取决于几个因素(在我看来):您的数组的大小

Hadoop 配置单元 SQL : Create External Table from an oddly formatted file

目前我有一个初始系统在工作,它读取一个文件,每行格式如下所示:REVISION1230364918Anarchism2005-12-06T17:44:47ZRJII141644使用此代码:CREATEEXTERNALTABLEmytable(typeSTRING,aidBIGINT,ridBIGINT,titleSTRING,tsSTRING,unameSTRING,uidSTRING)ROWFORMATDELIMITEDFIELDSTERMINATEDBY''STOREDASTEXTFILELOCATION'/my/local/path/to/file';但是现在我有一个文件,每一行

java - "cannot execute binary file: Exec format error"hdfs 命令

当我尝试运行命令时hdfsnodename-format我收到此错误消息:/usr/local/hadoop/bin/hdfs:line304:/usr/local/Java/jdk1.7.0_79/bin/java:cannotexecutebinaryfile:Execformaterror/usr/local/hadoop/bin/hdfs:line304:/usr/local/Java/jdk1.7.0_79/bin/java:Success现在,我打开了hdfs文件,这是第304行:exec"$JAVA"-Dproc_$COMMAND$JAVA_HEAP_MAX$HADOOP