report_callback_exception

hadoop - 亚马逊 EMR 和 Hive : Getting a "java.io.IOException: Not a file" exception when loading subdirectories to an external table

我正在使用AmazonEMR。我在s3中有一些日志数据，都在同一个桶中，但在不同的子目录下喜欢:"s3://bucketname/2014/08/01/abc/file1.bz""s3://bucketname/2014/08/01/abc/file2.bz""s3://bucketname/2014/08/01/xyz/file1.bz""s3://bucketname/2014/08/01/xyz/file3.bz"我正在使用:Sethive.mapred.supports.subdirectories=true;Setmapred.input.dir.recursive=true

Hadoop map 作业因 com.datastax.driver.core.exceptions.NoHostAvailableException 而失败

我正在尝试使用hadoopmap-reduce对存储在cassandra中的数据运行分析。为此，我使用了可通过Maven依赖项cassandra-all获得的类CqlInputFormat。目前我们在生产环境中一直使用这个依赖的2.0.10版本。此外，我们正在使用版本为2.1.1的caassandra-driver-core。现在，当我向我的jobtracker提交一个简单的map-reduce作业时，我的所有映射器任务都会失败，并出现以下异常。这里要注意的另一个重要事项是，如果我使用cassandra-all2.0.6中可用的CqlPagingInputFormat，一切正常。但是这

NoHostAvailableException exceptions driver datastax java hadoop mapreduce cassandra

sql - 具有 Union All 的 Nullpointer Exception Hive

我有一个查询，它使用unionall合并来自两个表的数据。unionall之前的第一个查询返回记录，但第二个查询不返回任何记录(仅此运行为零记录。我们可能有下一次加载的记录)。问题是当我没有来自第二个查询的任何记录时，配置单元会抛出空指针异常。selectcol1,col2,col3fromAunionallselectcol1,col2,col3fromB我在A表中有记录。但是，B表中的记录数可能会因每次加载而异。当B表中有记录时，查询工作完美。我知道这是0.12版之前hive中的一个错误。但我使用的是0.14版。任何想法可能是根本原因。注意:我的B表是分区的。当我删除分区时，我没有

Nullpointer Exception section col select sql hadoop hive

java - Hadoop : java. io.IOException : Call to localhost/127. 0.0.1 :54310 failed on local exception: java. io.EOFException

我是hadoop的新手，今天才开始使用它，我想将文件写入hdfshadoop服务器，我正在使用服务器hadoop1.2.1，当我在cli中给出jps命令时，我能够看到所有节点都在运行，31895Jps29419SecondaryNameNode29745TaskTracker29257DataNode这是我将文件写入hdfs系统的示例客户端代码publicstaticvoidmain(String[]args){try{//1.GettheinstanceofCOnfigurationConfigurationconfiguration=newConfiguration();confi

java EOFException hadoop apache filesystems hdfs hadoop-streaming

python - Hadoop 流 : reporting error

在使用Python脚本的Hadoop流中报告异常的最佳实践是什么？我的意思是:假设我有一个无法理解其输入的映射器脚本，我如何向Hadoop发出信号以终止作业并报告错误消息？我是否使用logging并以sys.exit结束？最佳答案如果您想发出错误信号，请从您的Python脚本中返回一个非零代码。您可以将任何日志记录写入stderr，hadoop会将其捕获到任务日志中。您还可以通过在stderr行前加上reporter:status:来向报告者和计数器发送状态。或reporter:counter:,,

reporting python section code Hadoop amazon-web-services amazon-emr

exception - 格式化 HDFS 时出现 UnknownHostException

我已经使用以下命令在伪分布式模式下的CentOS6.364位上安装了CDH4instructions.Hadoop配置文件中的所有内容都设置为localhost。但是，当我格式化名称节点时，仍然会出现以下异常。当我将192.168.1.101CentOSHost条目添加到/etc/hosts文件时，异常消失，我能够运行格式化/启动HDFS并运行MR作业。即使没有连接到网络，我也想在/etc/hosts文件中添加条目的情况下运行MR作业。如何完成这项工作？12/08/2722:17:15WARNnet.DNS:Unabletodetermineaddressofthehost-falli

时出 UnknownHostException code section java exception hadoop hdfs

hadoop - 从 quickstart.cloudera/172.17.0.2 调用 quickstart.cloudera :8020 failed on connection exception: java.net.ConnectException: Connection refused

我是Docker和Hadoop系统的新手。我已经在Ubuntu16.04中安装了Docker，并在一个新的Docker容器中运行来自Cloudera的Hadoop镜像。但是当我尝试在hdfs中运行任何命令时，错误消息显示为:CallFromquickstart.cloudera/172.17.0.2toquickstart.cloudera:8020failedonconnectionexception:java.net.ConnectException:Connectionrefused;我不知道如何解决这个问题。我期待您的帮助。最佳答案

quickstart cloudera section 中运 code hadoop docker dockerfile

hadoop - 错误 org.apache.hadoop.hdfs.server.namenode.SecondaryNameNode : Exception in doCheckpoint

我在集群设置中使用Hadoop2.2.0，我反复收到以下错误，异常是在文件/opt/dev/hadoop/2.2.0/logs/下的名称节点olympus中产生的hadoop-deploy-secondarynamenode-olympus.log例如2014-02-1216:19:59,013INFOorg.mortbay.log:StartedSelectChannelConnector@olympus:500902014-02-1216:19:59,013INFOorg.apache.hadoop.hdfs.server.namenode.SecondaryNameNode:We

hadoop SecondaryNameNode namenode

scala - Spark 和 Scala : saveAsTextFile() exception

我是Spark&Scala的新手，调用saveAsTextFile()后出现异常。希望有人能帮忙...这是我的输入.txt:HelloWorld,I'maprogrammerHelloWorld,I'maprogrammer这是在CMD上运行“spark-shell”后的信息:C:\Users\NhanTran>spark-shellSettingdefaultloglevelto"WARN".Toadjustlogginglevelusesc.setLogLevel(newLevel).ForSparkR,usesetLogLevel(newLevel).SparkcontextWe

saveAsTextFile exception apache scala org apache-spark hadoop apache-spark-sql bigdata

hadoop - IO异常 : Filesystem closed exception when running oozie workflow

我们在oozie中运行一个工作流。它包含两个操作:第一个是在hdfs中生成文件的mapreduce作业，第二个是将文件中的数据复制到数据库的作业。两个部分都成功完成，但oozie在最后抛出一个异常，将其标记为失败的过程。这是异常(exception)情况:2014-05-2017:29:32,242ERRORorg.apache.hadoop.security.UserGroupInformation:PriviledgedActionExceptionas:lpinsight(auth:SIMPLE)cause:java.io.IOException:Filesystemclosed

Filesystem exception hadoop apache java oozie

156 157 158159160 161 162