草庐IT

minor_contains

全部标签

hadoop - Spark YARN 配置问题 : Container keep failing

我正在尝试将数据框保存为文本文件,但即使是小数据也需要很多时间。我相信我的配置有问题。有人可以告诉我我在这里做错了什么吗?spark.default.parallelism640spark.hadoop.fs.s3.cse.plaintextLength.enabledfalsespark.hadoop.fs.s3n.filestatuscache.enabletruespark.hadoop.mapreduce.input.fileinputformat.split.maxsize33554432spark.executor.iddriverspark.executor.instan

hadoop - "Container is running beyond physical memory limits"

我正在从事一项工作,其中Hive查询使用R文件,分布在集群上以在每个节点上运行。像那样:ADDFILEShdfs://path/reducers/my_script.RSEThive.mapred.reduce.tasks.speculative.execution=false;SETmapred.reduce.tasks=80;INSERTOVERWRITETABLEfinal_output_tablePARTITION(partition_column1,partition_column2)SELECTselected_column1,selected_column2,partit

java - Hadoop:不支持的 major.minor 版本 52.0

这个问题在这里已经有了答案:Howtofixjava.lang.UnsupportedClassVersionError:Unsupportedmajor.minorversion(50个答案)关闭2年前。在阅读我的问题之前,您应该知道它与我已经阅读过的Stackoverflow上的所有其他类似问题并不重复!我使用Eclipse在Windows10(开发机器)上开发(并构建和编译)了一个Hadoop程序。该程序读取WARC文件并以JSON格式重写它们。它使用theseclassestooverridetheWritableformat:WarcFileInputFormat.javaW

hadoop - "the container format for fields in a row"对文件格式意味着什么?

来自Hadoop:权威指南:TherearetwodimensionsthatgoverntablestorageinHive:therowformatandthefileformat.Therowformatdictateshowrows,andthefieldsinaparticularrow,arestored.InHiveparlance,therowformatisdefinedbyaSerDe,aportmanteauwordforaSerializer-Deserializer.Whenactingasadeserializer,whichisthecasewhenque

hadoop - 警告 org.apache.hadoop.yarn.server.nodemanager.DefaultContainerExecutor : Exit code from container container_1494943588964_0010_01_000001 is : 143

我在Ubuntu16.04上以独立模式安装了hadoop2.7.3。我已经安装了Hive2.1.1并在HQL上工作。大多数查询都会触发MR作业。当我运行触发MR作业的查询时,系统会通过终止所有进程自动注销。当我检查节点管理器的日志时,我可以看到导致问题的语句是,WARNorg.apache.hadoop.yarn.server.nodemanager.DefaultContainerExecutor:Exitcodefromcontainercontainer_1494943588964_0010_01_000001is:1432017-05-1619:48:08,263ERRORor

java - hadoop 日志中的 "complete event for unknown container id"是什么意思?

我正在尝试对集群中的多个文件运行一个简单的作业(wordcount示例),但大多数map都失败了。当我引用任务日志时,我只看到这样的错误:ERROR[RMCommunicatorAllocator]org.apache.hadoop.mapreduce.v2.app.rm.RMContainerAllocator:Containercompleteeventforunknowncontaineridcontainer_1388066512888_0001_01_000026有什么想法吗?更新:我多次检查作业,有时由于map故障而失败,有时由于减少故障而在极少数情况下成功完成。但在任何情

java - hadoop map reduce 程序未运行不受支持的 major.minor 版本

当我像那样运行我的MapReduce程序时:bin/hadoopjar/usr/local/hadoop/share/hadoop/mapreduce/mapreduceprog.jarproblemdata/problemdata/input2/problemdata/output5我得到以下输出:Exceptioninthread"main"java.lang.UnsupportedClassVersionError:mapreduceprog:Unsupportedmajor.minorversion52.0atjava.lang.ClassLoader.defineClass1

JAVA 运行时错误 : java. lang.UnsupportedClassVersionError。不支持的 major.minor 版本 51.0

我正在尝试运行PUMA基准测试集(PurdueMapreduceBenchmarksSuite:用于hadoop)。我适本地运行了一个应用程序(wordcount),但无法运行另一个应用程序(invertedindex)。运行时发生错误,它说线程“main”中的异常java.lang.UnsupportedClassVersionError:org/apache/hadoop/examples/InvertedIndex:不支持的major.minor版本51.0google了一下,发现是java版本的问题。我检查了java版本并重新编译代码然后运行它。但是对于invertedinde

java - 在 AWS EMR 上运行 Java 1.8 时不支持 major.minor 版本 52.0

这个问题在这里已经有了答案:Howtofixjava.lang.UnsupportedClassVersionError:Unsupportedmajor.minorversion(50个答案)关闭6年前。我正在尝试通过AWSEMR运行Java1.8MapReduce作业。我已将编译合规性和JRE版本设置为1.8。但在运行时仍然出现以下错误。因为我使用的是一个stanfordAPI,所以我无法切换到较低的Java版本。有人可以在这里帮助我吗?Exceptioninthread"main"java.lang.UnsupportedClassVersionError:org/neu/mr/

hadoop - yarn : get containers by applicationId

我想列出为特定MR作业运行容器的节点。我只有application_id。是否可以使用HadoopRESTAPI和/或通过命令行来完成? 最佳答案 这可以使用yarn来完成命令。运行yarnapplicationattempt-list获取应用尝试ID运行yarncontainer-list获取容器ID运行yarncontainer-status获取任何特定容器的主机。如果你想在bash脚本中使用它,或者想要获取具有大量容器的应用程序的每个主机,你可能想要解析出尝试/容器ID和主机,但这至少是一个开始。