草庐IT

WSA_IO_PENDING

全部标签

hadoop - HBase 中的 org.apache.hadoop.hbase.io.ImmutableBytesWritable 异常

我们尝试测试以下用于访问HBase表(Spark-1.3.1、HBase-1.1.1、Hadoop-2.7.0)的示例代码:importsysfrompysparkimportSparkContextif__name__=="__main__":iflen(sys.argv)!=3:print>>sys.stderr,"""Usage:hbase_inputformatRunwithexamplejar:./bin/spark-submit--driver-class-path/path/to/example/jar\/path/to/examples/hbase_inputforma

python-2.7 - java.io.IOException : Broken pipe on increasing number of mappers/reducers, 很多

我在6个节点的hadoop集群上运行MapReduce作业,配置了4个映射任务和10个缩减任务。Mapper/Reducer在增加map/reduce任务数量时失败很多,如下所示,我遇到以下错误:标准错误日志java.lang.RuntimeException:PipeMapRed.waitOutputThreads():subprocessfailedwithcode143atorg.apache.hadoop.streaming.PipeMapRed.waitOutputThreads(PipeMapRed.java:362)atorg.apache.hadoop.streamin

hadoop - 在配置单元配置 : Couldn't create directory ${system:java. io.tmpdir}\${hive.session.id}_resources 上应用授权策略时出错

我在Windows上运行Hadoop3.0.0-alpha1并向其中添加了Hive2.1.1。当我尝试使用hive命令打开配置单元直线时,出现错误:Errorapplyingauthorizationpolicyonhiveconfiguration:Couldn'tcreatedirectory${system:java.io.tmpdir}\${hive.session.id}_resources怎么了?我运行mysql作为Hive的元存储,并在HDFS中添加了所需的文件:hadoopfs-mkdir/user/hivehadoopfs-mkdir/user/hive/wareho

java - Hadoop : java. io.IOException : Call to localhost/127. 0.0.1 :54310 failed on local exception: java. io.EOFException

我是hadoop的新手,今天才开始使用它,我想将文件写入hdfshadoop服务器,我正在使用服务器hadoop1.2.1,当我在cli中给出jps命令时,我能够看到所有节点都在运行,31895Jps29419SecondaryNameNode29745TaskTracker29257DataNode这是我将文件写入hdfs系统的示例客户端代码publicstaticvoidmain(String[]args){try{//1.GettheinstanceofCOnfigurationConfigurationconfiguration=newConfiguration();confi

java - Hadoop 错误 .ClassCastException : org. apache.hadoop.io.LongWritable 无法转换为 org.apache.hadoop.io.Text

我的程序如下:publicstaticclassMapClassextendsMapper{publicvoidmap(Textkey,Textvalue,Contextcontext)throwsIOException,InterruptedException{//yourmapcodegoeshereString[]fields=value.toString().split(",");for(Stringstr:fields){context.write(newText(str),newLongWritable(1L));}}}publicintrun(Stringargs[])t

hadoop - 为什么 spark 抛出带有序列文件的 NotSerializableException org.apache.hadoop.io.NullWritable

为什么spark使用序列文件抛出NotSerializableExceptionorg.apache.hadoop.io.NullWritable?我的代码(非常简单):importorg.apache.hadoop.io.{BytesWritable,NullWritable}sc.sequenceFile[NullWritable,BytesWritable](in).repartition(1000).saveAsSequenceFile(out,None)异常org.apache.spark.SparkException:Jobaborted:Task1.0:66hadanot

java.io.InvalidClassException : org. apache.spark.internal.io.HadoopMapReduceCommitProtocol;本地类不兼容

语境我正在Spark集群上执行Spark工具(如果有兴趣,this是Spark工具)。该工具正在从HDFS读取输入文件,并将在HDFS中生成输出文件。我有2个AzureVM,带有一个SparkMaster容器、一个Namenode容器、两个SparkWorker容器和两个Datanode容器(还有两个容器以提供该工具所需的文件,但我认为这不重要),配备DockerSwarm。这是我用来运行Spark工具的Bash命令:/gatk/gatkBwaAndMarkDuplicatesPipelineSpark\--inputhdfs://namenode:8020/PFC_0028_SW_C

java - 弹性 map 减少超时java.io.IOException : Unexpected end of stream

我正在运行MAPreduce作业(ElasticmapreduceEMR)服务。该作业适用于小型数据集,但对于大型数据集(文件大小400MB)存在以下异常使用相同的大输入文件运行另一个作业工作正常但是。为什么这样呢?Error:java.io.IOException:Unexpectedendofstreampos=19520590contentLength=458603265atorg.apache.hadoop.fs.s3native.NativeS3FileSystem$NativeS3FsInputStream.read(NativeS3FileSystem.java:313)

java.io.IOException : ensureRemaining: Only 0 bytes remaining, 试图读取 1

我在使用giraph中的自定义类时遇到了一些问题。我制作了VertexInput和Output格式,但我总是收到以下错误:java.io.IOException:ensureRemaining:Only*bytesremaining,tryingtoread*在“*”所在的位置具有不同的值。这是在单节点集群上测试的。当vertexIterator执行next()并且没有更多的顶点时,会发生此问题。这个迭代器是从flush方法调用的,但我基本上不明白为什么“next()”方法失败。这里有一些日志和类...我的日志如下:15/09/0800:52:21INFObsp.BspService:

java - 错误值类 : class org. apache.hadoop.io.Text 不是类 org.apache.hadoop.io.IntWritable

我使用了一个映射器、一个缩减器和一个组合器类,但出现如下错误:java.io.IOException:wrongvalueclass:classorg.apache.hadoop.io.Textisnotclassorg.apache.hadoop.io.IntWritableatorg.apache.hadoop.mapred.IFile$Writer.append(IFile.java:199)atorg.apache.hadoop.mapred.Task$CombineOutputCollector.collect(Task.java:1307)atorg.apache.hado