草庐IT

custom_text

全部标签

java - 亚马逊电子病历 : Passing java system property to custom jar

AmazonEMR是否允许将系统属性传递给自定义jar,例如hadoopjar-Dkey=valuemyjob.jar?(上面的key,value在应用程序本身的初始化期间使用,而不是属于hadoop的Configuration对象。)相关话题Howtospecifymapredconfigurations&javaoptionswithcustomjarinCLIusingAmazon'sEMR?讨论了仅通过引导操作将系统属性传递给hadoop守护进程的方法,显然,这不允许对java入口点类执行相同的操作。 最佳答案 如果您不想将

java - 在 hadoop 中将 String 对象转换为 TEXT 对象

如何在不使用构造函数的情况下将字符串对象转换为hadoop中的文本对象?有可用的TexttoString方法,但我找不到StringtoText方法。 最佳答案 Texttext=newText("your-string");或Texttext=newText();text.set("your-string"); 关于java-在hadoop中将String对象转换为TEXT对象,我们在StackOverflow上找到一个类似的问题: https://stac

hadoop - 使用哪个 : Custom datatype or TwoDArrayWritable

为了发出2个矩阵作为键值对:Key-MatrixA值-矩阵B。我应该创建一个自定义数据类型还是可以直接使用TwoDArrayWritable?那么自定义类中的compareTo()方法呢? 最佳答案 您肯定需要为您的Key编写一个自定义类,因为TwoDArrayWritable没有实现WritableComparable(即使您只是扩展TwoDArrayWritable类添加接口(interface)和compareTo方法)。至于是否应该在自定义类上使用TwoDArrayWritable-取决于几个因素(在我看来):您的数组的大小

java - 如何在 Mapreduce 程序中遍历 Text 值的迭代器两次?

在我的MapReduce程序中,我有一个reducer函数,它计算文本值迭代器中的项目数,然后对于迭代器中的每个项目,将项目输出为键,将计数输出为值。因此我需要使用迭代器两次。但是一旦迭代器到达终点,我就无法从第一个迭代器开始迭代。我该如何解决这个问题?我为我的reduce函数尝试了以下代码:publicstaticclassReduceAextendsMapReduceBaseimplementsReducer{publicvoidreduce(Textkey,Iteratorvalues,OutputCollectoroutput,Reporterreporter)throwsIO

hadoop - Caused by : java. lang.ClassCastException : org. apache.hadoop.io.LongWritable cannot be cast to org.apache.hadoop.io.Text

我正在尝试编译以下github项目https://github.com/DigitalPebble/behemoth/tree/master/uima我收到以下错误java.lang.ClassCastException:org.apache.hadoop.io.LongWritablecannotbecasttoorg.apache.hadoop.io.Text代码定义了以下输出键和值类。其中BehemothDocument是定义的自定义类job.setInputFormat(SequenceFileInputFormat.class);job.setOutputFormat(Seq

Hadoop:hdfs dfs -text 的倒数

在Hadoop中,hdfsdfs-text和hdfsdfs-getmerge命令允许人们从命令行轻松读取HDFS中压缩文件的内容,包括管道到其他命令进行处理(例如wc-l/dev/null))。这些命令是否有相互关系,允许从命令行将内容推送到HDFS,同时支持与上述命令相同的压缩和格式功能?hdfsdfs-put似乎只是将本地文件的原始副本复制到HDFS,而无需压缩或更改容器格式。也欢迎建议使用命令行工具来操作此类格式和压缩算法的答案。我通常会在CompressedStream中看到Snappy压缩数据,但不知道如何从命令行将纯旧文本文件(每行一个数据)转换为此类文件。我试了一下snz

Scala:类型不匹配 MapFunction[Tuple2[Text, Text], NotInferedR]

我尝试执行以下操作:env.readHadoopFile(newTeraInputFormat(),classOf[Text],classOf[Text],inputPath).map(tp=>tp)但随后我在编辑器中收到类型不匹配错误:Expected:MapFunction[Tuple2[Text,Text],NotInferedR],actual:(Nothing)=>Nothing我该如何解决这个问题?这是完整的代码:importorg.apache.flink.api.common.functions.Partitionerimportorg.apache.flink.api

java - 如何设置一个 reducer 来发送 <Text, IntWritable> 和一个 mapper 来接收 <Text, IntWritable>?

我正在使用ma​​preduce在hadoop上开发一些代码,它使用了两个映射器和两个缩减器。我被告知要使用SequenceFileInputFormat和SequenceFileOutputFormat使第一个reducer的输出和第二个mapper的输入一起工作。问题是我正在记录一个错误,在googleing很多之后我不知道为什么。错误:java.lang.Exception:java.io.IOException:Typemismatchinkeyfrommap:expectedorg.apache.hadoop.io.IntWritable,receivedorg.apache

eclipse - IOException : Type mismatch in key from map: Text, 收到 LongWritable

我知道这个话题过去已经讨论过。但不幸的是我没能解决这个问题。我不断收到相同的IOException错误。我是Java和Hadoop的新手,这是我第一次尝试WordCount练习。对于任何语法错误或格式问题,我深表歉意。请让我知道我哪里出错了。Error:java.lang.Exception:java.io.IOException:Typemismatchinkeyfrommap:expectedorg.apache.hadoop.io.Text,receivedorg.apache.hadoop.io.LongWritable这是我的代码:MyDriverpackagep1;impo

hadoop - java.io.IOException : Type mismatch in value from map: expected org. apache.hadoop.io.IntWritable,收到 org.apache.hadoop.io.Text

我在主block中配置了Mapper、reducer类以及map输出键值类。我不明白抛出错误的代码有什么问题Typemismatchinvaluefrommap:expectedorg.apache.hadoop.io.IntWritable,recievedorg.apache.hadoop.io.Text有人可以帮忙吗?谢谢。代码是:importjava.io.IOException;importjava.lang.String;importorg.apache.hadoop.fs.Path;importorg.apache.hadoop.io.IntWritable;import