Custom_Exception

hadoop - 与 HDFS 通信 : Exception in thread "main" java. io.IOException : Failed on local exception: java. io.EOFException

publicstaticvoidmain(String[]args)throwsIOException{Configurationconf=newConfiguration();conf.addResource(newPath("/home/myname/hadoop-1.2.1/conf/core-site.xml"));conf.addResource(newPath("/home/myname/hadoop-1.2.1/conf/hdfs-site.xml"));System.out.println("AttemptinginitializationofFileSystem");

java - 获取 E0902 : Exception occured:[Server IPC version 9 cannot communicate with client version 4]

我的hadoop版本是2.7.1，我的oozie版本是3.3.2。我已经创建了oozie.war文件成功。但是，当我尝试使用以下命令在hdfs中创建共享库时，oozie-setup.shsharelibcreate-fshdfs://training-21:54310我得到以下异常，Stacktracefortheerrorwas(fordebugpurposes):--------------------------------------org.apache.oozie.service.HadoopAccessorException:E0902:Exceptionoccured:[

version communicate gt lt hadoop java oozie

hadoop - AmazonS3Exception 错误请求 : distcp from frankfurt s3 to emr hdfs failing

我正在尝试将文件从法兰克福(eu-central-1)的s3存储桶复制到我在爱尔兰(eu-west-1)通过EMR托管的hdfs。我尝试在以下位置执行的复制命令:hdfsdfs-cp"s3a:///"/user/hadoop/和s3-dist-cp--src"s3a:///"--desthdfs:///user/hadoop/--srcPattern和hadoopdistcp"s3a:///"/user/hadoop/在所有情况下(以及关于所有这些命令的额外选项和s3、s3a、s3n的各种排列)我确实得到类似以下异常的信息:16/01/1511:48:24ERRORtools.Dist

AmazonS3Exception 3Exception hadoop java apache amazon-web-services amazon-s3 emr

hadoop - 选择 : Hadoop custom jars, Hadoop Streaming、Pig 或 Mahout 中的哪一个？

我正在从事一个NLP项目，该项目可以创建实体集并计算大型语料库的成对相似性。目前我正在使用hadoopstreaming并在Python中实现了所有映射器和缩减器。由于算法需要多轮map-reduce，我使用Shell脚本来链接作业。现在这是我的顾虑和我接下来想做的事情:[问题1]。作业链和作业控制。链接hadoop流作业是有问题的。如果作业序列(job1-job2-job3)中的作业2失败，我必须手动删除输出文件夹，调整启Action业的脚本文件并从中间重新运行作业序列。我真的希望找到一种更聪明的方法来做到这一点。由于我需要经常调整算法的参数和逻辑，我不想一次又一次地重复这些步骤。[

Hadoop Streaming strong section 自定 mapreduce apache-pig mahout hadoop-streaming

xml - Spark master 不调用 Custom InputFormat

我正在尝试探索ApacheSpark，作为其中的一部分，我想自定义InputFormat。就我而言，我想阅读xml文件并转换每次出现的到新记录。我确实写了定制TextInputFormat(XMLRecordInputFormat.java)返回自定义**XMLRecordReaderextendsorg.apache.hadoop.mapreduce.RecordReader**但我不明白为什么Sparkmaster不调用自定义输入格式(XMLRecordInputFormat.class)？由于某种原因，它继续表现得像普通的分线器。代码如下:importjava.util.Iter

InputFormat Custom import apache hadoop xml apache-spark

java - Hadoop Java 错误 : Exception in thread "main" java. lang.ClassNotFoundException : com. packt.ch3.etl.ParseWeblogs

我是Hadoop的新手。我按照一些教程尝试在版本为2.7.0的hadoop集群中运行示例，不幸的是我得到如下错误:$javac*.java$jarcvfmyjar.jar*.class$hadoopjar./myjar.jarcom.packt.ch3.etl.ParseWeblogs/user/hadoop/apache_clf.txt/user/hadoop/apache_clf_tsvExceptioninthread"main"java.lang.ClassNotFoundException:com.packt.ch3.etl.ParseWeblogsatjava.net.UR

ClassNotFoundException java hadoop weblogJob import mapreduce bigdata data-processing

hadoop - 错误 2997 : Unable to recreate exception from backed error: while using CSVExcelStorage

错误2997:无法从支持的错误中重新创建异常。在这里，我已经解析了apache日志文件，但是当我试图将其导出为csv格式时，会发生此错误。代码和错误:grunt>STORElogsINTO'/home/cloudera/workspace/Test_log.csv'USINGorg.apache.pig.piggybank.storage.CSVExcelStorage(',','NO_MULTILINE','NOCHANGE');2015-12-2410:50:44,821[main]INFOorg.apache.pig.tools.pigstats.ScriptState-Pigf

CSVExcelStorage exception apache 2015 hadoop apache-pig

java - Hbase 映射减少 : how to use custom class as value for the mapper and/or reducer?

我正在尝试熟悉Hadoop/HbaseMapReduce作业，以便能够正确编写它们。现在我有一个Hbase实例，其中包含一个名为dns的表，其中包含一些DNS记录。我试图制作一个简单的唯一域计数器来输出文件并且它有效。现在，我只使用IntWritable或Text，我想知道是否可以为我的Mapper/Reducer使用自定义对象。我试着自己做，但我得到了Error:java.io.IOException:Initializationofallthecollectorsfailed.Errorinlastcollectorwas:nullatorg.apache.hadoop.mapre

reducer custom code MapTask IntWritable java hadoop mapreduce hbase

exception-handling - 如何处理在 map/reduce 期间死亡的数据节点

当map/reduce使用的数据节点出现故障时会发生什么？不应该将作业重定向到另一个数据节点吗？我的代码应该如何处理这种异常情况？最佳答案如果datanode宕机，运行在该节点上的任务(假设您也将其用作tasktracker)将失败，这些失败的任务将被分配给其他tasktracker以重新执行。在死数据节点中丢失的数据block将在其他数据节点中可用，因为将跨集群复制数据。因此，即使数据节点出现故障，除了重新执行失败任务的非常短暂的延迟外，不会有任何损失。所有这些都将由框架来处理。您的代码无需担心这一点。

exception-handling exception section 点中 stackoverflow hadoop mapreduce

hadoop - FAILED : Error in metadata: MetaException(message:Got exception: java.net.ConnectException 调用 localhost/127.0.0.1:54310 失败

我使用的是Ubuntu12.04、hadoop-0.23.5、hive-0.9.0。我将我的metastore_db分别指定到hive-site.xml中的其他地方$HIVE_HOME/my_db/metastore_dbHadoop运行良好，jps给出ResourceManager,NameNode,DataNode,NodeManager,SecondaryNameNodeHive完美启动，metastore_db和derby.log也创建，所有hive命令运行成功，我可以创建数据库、表等。但是几天后，当我运行showdatabases或showtables时，出现以下错误FAIL

ConnectException MetaException code section metastore hadoop hive

127 128 129130131 132 133