草庐IT

hadoop - Pig-0.10.0 : CSVLoader cannot be cast to org. apache.pig.StoreFuncInterface

我似乎无法弄清楚我哪里出了问题。该脚本非常适用于PigStorage,但为CSVLoader提供了这个ClassCastException。我检查了文档,但没有帮助。这是堆栈跟踪:PigStackTrace---------------ERROR1200:Pigscriptfailedtoparse:pigscriptfailedtovalidate:java.lang.ClassCastException:org.apache.pig.piggybank.storage.CSVLoadercannotbecasttoorg.apache.pig.StoreFuncInterfaceo

hadoop - Apache Flume : cannot commit transaction. 达到堆空间限制

我正在尝试使用Flume将一些数据流式传输到HDFS,并将单个代理配置为具有netcat源、内存channel和HDFS接收器。配置如下:a1.sources=src1a1.channels=ch1a1.sinks=snk1#SOURCESCONFIGURATIONa1.sources.src1.type=netcata1.sources.src1.bind=0.0.0.0a1.sources.src1.port=99999a1.sources.src1.ack-every-event=false#SOURCE->CHANNELa1.sources.src1.channels=ch1#

amazon-web-services - AWS Glue - Avro snappy 压缩读取错误 - HIVE_CANNOT_OPEN_SPLIT : Error opening Hive split

在使用AWSGlue在S3中使用snappy压缩(gzip/bzip2压缩也有同样的错误)保存Avro文件后,当我尝试使用AWSCrawler读取athena中的数据时,我收到以下错误-HIVE_CANNOT_OPEN_SPLIT:打开Hive时出错拆分-使用org.apache.hadoop.hive.ql.io.avro.AvroContainerInputFormat:不是数据文件。知道为什么我会收到此错误以及如何解决吗? 最佳答案 谢谢。通过在执行期间将原生sparkavrojar文件附加到胶水作业并使用原生spark读/写

java - 象夫 : Cannot convert into sequence file

我正在尝试将一些文本文件转换为象夫序列文件。所以我愿意mahoutseqdirectory-iinputFolder-ooutputFolder但我总是遇到这个异常java.lang.Exception:java.lang.RuntimeException:java.lang.reflect.InvocationTargetExceptionatorg.apache.hadoop.mapred.LocalJobRunner$Job.run(LocalJobRunner.java:403)Causedby:java.lang.RuntimeException:java.lang.refl

java - Hadoop MultipleOutputs.addNamedOutput 抛出 "cannot find symbol"

我正在使用Hadoop0.20.203.0。我想输出到两个不同的文件,所以我试图让MultipleOutputs工作。这是我的配置方法:publicstaticvoidmain(String[]args)throwsException{Configurationconf=newConfiguration();String[]otherArgs=newGenericOptionsParser(conf,args).getRemainingArgs();if(otherArgs.length!=2){System.err.println("Usage:indycascade");Syste

Eclipse MapReduce 插件错误 : Server IPC version 7 cannot cannot communicate with client version 3

当我尝试连接到MapReduce位置时,我的笔记本电脑(我有我的eclipse和mapreduce插件)是一个namenode和datanode的集群,我得到错误:服务器IPC版本7无法与客户端版本3通信。我试图在谷歌上找到一些信息,但找不到太多。是不是因为我的mapreduceeclipse插件使用旧版本的IPC而hadoop集群有更新的版本。所以只是我使用的是过时的插件?如何找到我的eclipse插件使用的IPC版本?有什么想法吗? 最佳答案 是的,这听起来像是版本不兼容。假设您的hadoop发行版有源代码,您可以为该版本重新编

java - PIG : Cannot cast java. lang.String to org.apache.avro.util.Utf8 with AvroStorage inside STORE

我正在使用ApachePIG来减少最初以CSV格式存储的数据,并希望以Avro格式输出。我的PIG脚本的一部分调用了一个javaUDF,它将一些字段附加到输入元组并将修改后的元组传回。执行此操作时,我正在修改输出、PIG、架构:SchemaoutSchema=newSchema(input).getField(1).schema;SchemarecSchema=outSchema.getField(0).schema;recSchema.add(newFieldSchema("aircrafttype",DataType.CHARARRAY));在我的UDF的publicSc​​hem

hadoop - 错误 1128 : Cannot find field dryTemp

我的pig运行代码temperature而我报错,把代码和报错放在下面,方便理解我的问题发生了。错误在第38行第15列,尝试删除dryTemp,又报错。代码:--Loadfilesintorelationsmonth1=LOAD'hdfs:/data/big/data/weather/weather/201201hourly.txt'USINGPigStorage(',');month2=LOAD'hdfs:/data/big/data/weather/weather/201202hourly.txt'USINGPigStorage(',');month3=LOAD'hdfs:/dat

hadoop - Sqoop增量导入 "Cannot append files to target dir"

我在使用Sqoop将数据从MySQL导入Hive时遇到问题...这个查询:sqoopimport--connectjdbc:mysql://xx.xx.xx.xx/database\--usernamesqoop--passwordsqoop--tabledatatable\--target-dir/home/cloudera/user/hive/warehouse/database.db/datatable\--as-parquetfile-m1--append返回这个错误:15/01/1416:27:28WARNutil.AppendUtils:Cannotappendfilest

java - hadoop2.7.2 :cannot find java

我正在使用Hadoop2.7.2和CentOS7。当我尝试在终端中运行它时,出现了这个错误:/usr/hadoop/bin/hdfs:line304:/usr/lib/jvm/java-1.8.0-openjdk/bin/java:nosuchfileordirectory当我echo$JAVA_HOME时:/usr/lib/jvm/java-1.8.0-openjdk在/etc/profileexportJAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdkexportCLASSPATH=.:$CLASSPATH:$JAVA_HOME/lib:$JAVA_