草庐IT

report_callback_exception

全部标签

hadoop - 亚马逊 EMR 和 Hive : Getting a "java.io.IOException: Not a file" exception when loading subdirectories to an external table

我正在使用AmazonEMR。我在s3中有一些日志数据,都在同一个桶中,但在不同的子目录下喜欢:"s3://bucketname/2014/08/01/abc/file1.bz""s3://bucketname/2014/08/01/abc/file2.bz""s3://bucketname/2014/08/01/xyz/file1.bz""s3://bucketname/2014/08/01/xyz/file3.bz"我正在使用:Sethive.mapred.supports.subdirectories=true;Setmapred.input.dir.recursive=true

Hadoop map 作业因 com.datastax.driver.core.exceptions.NoHostAvailableException 而失败

我正在尝试使用hadoopmap-reduce对存储在cassandra中的数据运行分析。为此,我使用了可通过Maven依赖项cassandra-all获得的类CqlInputFormat。目前我们在生产环境中一直使用这个依赖的2.0.10版本。此外,我们正在使用版本为2.1.1的caassandra-driver-core。现在,当我向我的jobtracker提交一个简单的map-reduce作业时,我的所有映射器任务都会失败,并出现以下异常。这里要注意的另一个重要事项是,如果我使用cassandra-all2.0.6中可用的CqlPagingInputFormat,一切正常。但是这

sql - 具有 Union All 的 Nullpointer Exception Hive

我有一个查询,它使用unionall合并来自两个表的数据。unionall之前的第一个查询返回记录,但第二个查询不返回任何记录(仅此运行为零记录。我们可能有下一次加载的记录)。问题是当我没有来自第二个查询的任何记录时,配置单元会抛出空指针异常。selectcol1,col2,col3fromAunionallselectcol1,col2,col3fromB我在A表中有记录。但是,B表中的记录数可能会因每次加载而异。当B表中有记录时,查询工作完美。我知道这是0.12版之前hive中的一个错误。但我使用的是0.14版。任何想法可能是根本原因。注意:我的B表是分区的。当我删除分区时,我没有

java - Hadoop : java. io.IOException : Call to localhost/127. 0.0.1 :54310 failed on local exception: java. io.EOFException

我是hadoop的新手,今天才开始使用它,我想将文件写入hdfshadoop服务器,我正在使用服务器hadoop1.2.1,当我在cli中给出jps命令时,我能够看到所有节点都在运行,31895Jps29419SecondaryNameNode29745TaskTracker29257DataNode这是我将文件写入hdfs系统的示例客户端代码publicstaticvoidmain(String[]args){try{//1.GettheinstanceofCOnfigurationConfigurationconfiguration=newConfiguration();confi

python - Hadoop 流 : reporting error

在使用Python脚本的Hadoop流中报告异常的最佳实践是什么?我的意思是:假设我有一个无法理解其输入的映射器脚本,我如何向Hadoop发出信号以终止作业并报告错误消息?我是否使用logging并以sys.exit结束? 最佳答案 如果您想发出错误信号,请从您的Python脚本中返回一个非零代码。您可以将任何日志记录写入stderr,hadoop会将其捕获到任务日志中。您还可以通过在stderr行前加上reporter:status:来向报告者和计数器发送状态。或reporter:counter:,,

exception - 格式化 HDFS 时出现 UnknownHostException

我已经使用以下命令在伪分布式模式下的CentOS6.364位上安装了CDH4instructions.Hadoop配置文件中的所有内容都设置为localhost。但是,当我格式化名称节点时,仍然会出现以下异常。当我将192.168.1.101CentOSHost条目添加到/etc/hosts文件时,异常消失,我能够运行格式化/启动HDFS并运行MR作业。即使没有连接到网络,我也想在/etc/hosts文件中添加条目的情况下运行MR作业。如何完成这项工作?12/08/2722:17:15WARNnet.DNS:Unabletodetermineaddressofthehost-falli

hadoop - 从 quickstart.cloudera/172.17.0.2 调用 quickstart.cloudera :8020 failed on connection exception: java.net.ConnectException: Connection refused

我是Docker和Hadoop系统的新手。我已经在Ubuntu16.04中安装了Docker,并在一个新的Docker容器中运行来自Cloudera的Hadoop镜像。但是当我尝试在hdfs中运行任何命令时,错误消息显示为:CallFromquickstart.cloudera/172.17.0.2toquickstart.cloudera:8020failedonconnectionexception:java.net.ConnectException:Connectionrefused;我不知道如何解决这个问题。我期待您的帮助。 最佳答案

hadoop - 错误 org.apache.hadoop.hdfs.server.namenode.SecondaryNameNode : Exception in doCheckpoint

我在集群设置中使用Hadoop2.2.0,我反复收到以下错误,异常是在文件/opt/dev/hadoop/2.2.0/logs/下的名称节点olympus中产生的hadoop-deploy-secondarynamenode-olympus.log例如2014-02-1216:19:59,013INFOorg.mortbay.log:StartedSelectChannelConnector@olympus:500902014-02-1216:19:59,013INFOorg.apache.hadoop.hdfs.server.namenode.SecondaryNameNode:We

scala - Spark 和 Scala : saveAsTextFile() exception

我是Spark&Scala的新手,调用saveAsTextFile()后出现异常。希望有人能帮忙...这是我的输入.txt:HelloWorld,I'maprogrammerHelloWorld,I'maprogrammer这是在CMD上运行“spark-shell”后的信息:C:\Users\NhanTran>spark-shellSettingdefaultloglevelto"WARN".Toadjustlogginglevelusesc.setLogLevel(newLevel).ForSparkR,usesetLogLevel(newLevel).SparkcontextWe

hadoop - IO异常 : Filesystem closed exception when running oozie workflow

我们在oozie中运行一个工作流。它包含两个操作:第一个是在hdfs中生成文件的mapreduce作业,第二个是将文件中的数据复制到数据库的作业。两个部分都成功完成,但oozie在最后抛出一个异常,将其标记为失败的过程。这是异常(exception)情况:2014-05-2017:29:32,242ERRORorg.apache.hadoop.security.UserGroupInformation:PriviledgedActionExceptionas:lpinsight(auth:SIMPLE)cause:java.io.IOException:Filesystemclosed