草庐IT

text-type

全部标签

java - 映射 : expected org. apache.hadoop.io.Text 中的键类型不匹配,收到 org.apache.hadoop.io.IntWritable

我正在尝试在java中运行一个mapreducer,以获取一个逗号分隔的文件,该文件包含有关坠机的AIRLINE的数据。数据包含以下列,还提供了示例数据:passengerid,survived(s=0,d=1),pclass,name,sex,age,sibsp,parch,ticket,fare,cabin,embarked1,0,3,"BraundMr.OwenHarris",male,22,1,0,A/521171,7.25,,S,2,1,1,"CumingsMrs.JohnBradley(FlorenceBriggsThayer)",female,38,1,0,PC17599

sql - Impala 查询错误 - AnalysisException : operands of type INT and STRING are not comparable

我正在尝试在Impala中执行查询并收到以下错误(AnalysisException:INT和STRING类型的操作数不可比较:B.COMMENT_TYPE_CD='100')有人可以帮我解决这个问题:查询:SELECTORDER_ID,L1.LONG_TEXTFROMDB.ORDER_COMMENTA,DB.SHORT_TEXTL1WHEREACTION_SEQUENCE=(SELECTMAX(ACTION_SEQUENCE)FROMDB.ORDER_COMMENTBWHEREB.COMMENT_TYPE_CD='100'ANDA.ORDER_ID=B.ORDER_ID)ANDCOM

apache-spark - Yarn 的 "Application Type"在哪里/如何定义?

如果向ApacheYARN集群提交新作业,状态页面通常会指示作业实际是如何提交的(除其他事项外):ApplicationType:SPARK这表明用户很可能使用spark-submit向资源管理器发布了一个新作业。是否可以像更改应用程序名称一样通过参数更改该字符串的值? 最佳答案 应用类型在Spark设置yarn应用上下文时设置。AFAIK,无法更改某些配置的方式。如果它真的很重要,您将不得不在源代码中覆盖它。下面的实现,https://github.com/apache/spark/blob/01c3dfab158d40653f8

Hadoop IO 错误 : Type mismatch in key from map : expected org. apache.hadoop.io.Text,收到 RegexMatcher.CustomKey

我收到以下错误:java.lang.Exception:java.io.IOException:Typemismatchinkeyfrommap:expectedorg.apache.hadoop.io.Text,receivedRegexMatcher.CustomKeyatorg.apache.hadoop.mapred.LocalJobRunner$Job.runTasks(LocalJobRunner.java:462)atorg.apache.hadoop.mapred.LocalJobRunner$Job.run(LocalJobRunner.java:522)Caused

hadoop - Hadoop 中的 (key,value) 对总是 ('text' ,1) 吗?

我是Hadoop新手。你能说说(键/值)对吗?值总是一个吗?reduce步骤的输出总是一个(键/值)对吗?如果是,该(键/值)数据将如何进一步使用?请帮帮我。 最佳答案 我猜你问的是由于wordcount导致的(key,values)对的“一个”值Hadoop教程中的示例。所以,答案是否定的,它并不总是“一个”。MapReduce的Hadoop实现通过在整个工作流中传递(键,值)对来工作,从输入到输出:映射步骤:一般来说(还有其他特殊情况,取决于输入格式),映射器逐行处理分配给它们的拆分内的数据;这些行作为(key,value)对传

java - Map Reduce 程序抛出异常 IOException "Type mismatch in key from map"

您好,请在下面找到我的代码,它抛出异常。packageHadoopMapReduce;importjava.io.IOException;importjava.util.Iterator;importorg.apache.hadoop.conf.Configuration;importorg.apache.hadoop.fs.FileSystem;importorg.apache.hadoop.fs.Path;importorg.apache.hadoop.io.IntWritable;importorg.apache.hadoop.io.Text;importorg.apache.h

java - 在 reduce 函数的参数中将 HashSet<Text> 作为 Iterable<Text> 传递 - HADOOP

我有一个HashMap,我想通过重载run方法将它的值传递给hadoop中的reduce函数。reduce函数接受Iterable。有没有办法做到这一点?预先感谢您的帮助。 最佳答案 HashSet(如文章标题)已经是可迭代的。通过它。如果您按照帖子正文所述使用map,则可以通过任何合适的:yourMap.keySet();//setofKyourMap.valueSet();//setofVyourMap.entrySet();//setofMap.Entry 关于java-在redu

java - 如何解决预期的 org.apache.hadoop.io.Text,在 mapreduce 作业中收到 org.apache.hadoop.io.LongWritable

我正在尝试编写一个可以分析来自youtube数据集的一些信息的工作。我相信我已经在驱动程序类中正确地设置了来自map的输出键,但是我仍然遇到上述错误我正在发布代码而这里的异常(exception),映射器publicclassYouTubeDataMapperextendsMapper{privatestaticfinalIntWritableone=newIntWritable(1);privateTextcategory=newText();publicvoidmapper(LongWritablekey,Textvalue,Contextcontext)throwsIOExcep

java - Text.getBytes() 返回意外结果

我从Text构造函数中得到一些实际上没有任何意义的行为。基本上,如果我从String构造一个Text对象,它不等于我从字节构造的另一个Text对象,即使getBytes()为两个对象返回相同的值。所以我们得到了这样奇怪的东西://ThissucceedsassertEquals(newText("ACTACGACCA_0"),newText("ACTACGACCA_0"));//ThissucceedsassertEquals((newText("ACTACGACCA_0")).getBytes(),(newText("ACTACGACCA_0")).getBytes());//Thi

hadoop - 如何使用 Java API 远程运行 "hadoop fs -text ."?

基本上,我想要的是使用HadoopJavaAPI从本地调用远程Hadoop集群。我想让Hadoop集群执行它应该大致等同于“sshuser@remote'hadoopfs-text.'” 最佳答案 首先,如果您想要的正是hadoopfs-text给您的,那么您当然可以在本地机器上安装hadoop客户端,然后在那里运行,确保指定完整路径:hadoopfs-texthdfs://remote.namenode.host:9000/my/file但是如果你确实有理由从java中做到这一点,基本的答案是这样的:Configurationco