草庐IT

task-execution-settings

全部标签

java - Hadoop 作业 : Task fail to report status for 601 seconds

在伪节点上运行hadoop作业时,任务失败并被杀死。错误:任务尝试_未能报告状态601秒但相同的程序正在通过Eclipse运行(本地作业)。任务:大约有25K个关键字,输出将是所有可能的组合(一次两个),即大约25K*25K个整体可能是什么问题? 最佳答案 由于某种原因,任务在您的伪节点上执行时没有进行。您可以增加mapred-site.xml中的设置“mapred.task.timeout”。mapred-default.xml中相同的默认值为:mapred.task.timeout600000Thenumberofmillise

R+Hadoop : How to read CSV file from HDFS and execute mapreduce?

在下面的例子中:small.ints=to.dfs(1:1000)mapreduce(input=small.ints,map=function(k,v)cbind(v,v^2))mapreduce函数的数据输入是一个名为small.ints的对象,它引用了HDFS中的block。现在我有一个CSV文件已经存储在HDFS中"hdfs://172.16.1.58:8020/tmp/test_short.csv"如何为它获取一个对象?据我所知(这可能是错误的),如果我想将CSV文件中的数据作为mapreduce的输入,我必须首先在R中生成一个表,其中包含CSV文件中的所有值。我确实有这样的

java - Spark 异常 : Task failed while writing rows

我正在读取文本文件并将它们转换为parquet文件。我正在使用Spark代码来做这件事。但是当我尝试运行代码时出现以下异常org.apache.spark.SparkException:Jobabortedduetostagefailure:Task2instage1.0failed4times,mostrecentfailure:Losttask2.3instage1.0(TID9,XXXX.XXX.XXX.local):org.apache.spark.SparkException:Taskfailedwhilewritingrows.atorg.apache.spark.sql.

hadoop - java.lang.OutOfMemoryError : unable to create new native thread for big data set 错误

我运行的hive查询对于小型数据集运行良好。但我正在运行2.5亿条记录,我在日志中遇到的错误低于此FATALorg.apache.hadoop.mapred.Child:Errorrunningchild:java.lang.OutOfMemoryError:unabletocreatenewnativethreadatjava.lang.Thread.start0(NativeMethod)atjava.lang.Thread.start(Thread.java:640)atorg.apache.hadoop.mapred.Task$TaskReporter.startCommuni

java - 由于 Task attempt failed to report status 600 秒,reduce 失败。杀戮!解决方案?

作业的reduce阶段失败并显示:失败的Reduce任务超出了允许的限制。每个任务失败的原因是:任务attempt_201301251556_1637_r_000005_0未能报告状态达600秒。杀!问题详情:Map阶段接收格式为:time,rid,data的每条记录。数据的格式为:数据元素及其计数。例如:a,1b,4c,7对应一条记录的数据。映射器为每个数据元素输出每条记录的数据。例如:key:(time,a,),val:(rid,data)键:(时间,b,),val:(删除,数据)key:(time,c,),val:(rid,data)每一个reduce从所有的记录中接收同一个ke

streaming - Hadoop 流作业失败 : Task process exit with nonzero status of 137

几天来我一直在努力解决这个问题,希望有人能提供一些见解。我用perl编写了一个流式映射缩减作业,很容易让一个或两个缩减任务花费极长的时间来执行。这是由于数据中的自然不对称性:一些reduce键有超过一百万行,而大多数只有几十行。我以前遇到过长任务的问题,我一直在递增计数器以确保mapreduce不会超时。但是现在他们失败了,并显示了一条我以前从未见过的错误消息:java.io.IOException:Taskprocessexitwithnonzerostatusof137.atorg.apache.hadoop.mapred.TaskRunner.run(TaskRunner.jav

Hadoop安装错误, "error : cannot execute hdfs-config.sh."

我正在关注this在我的电脑上安装hadoop的教程。据我所知,在source~/.profile之前,我一直完全按照说明操作,但是当我尝试通过输入hdfsnamenode-format来格式化HDFS时,它给了我以下错误:ERROR:Cannotexecute/usr/local/Cellar/hadoop/3.0.0/libexec/hdfs-config.sh我尝试了很多方法在互联网上寻找解决方案,但没有找到解决方案。 最佳答案 @BIKI我刚遇到同样的问题,Hadoop版本3.0.0有一个奇怪的文件结构,不能按照您认为的方式

java - (HBase) 错误 : JAVA_HOME is not set and Java could not be found

我已经阅读了一些关于设置JAVA_HOME的评论。因为我是这方面的初学者,所以我没有在不知道自己在做什么的情况下编辑任何东西。我不想把事情搞得更糟。因此,如果您能指导我解决这个问题并告诉我我的编码有什么问题,我将不胜感激。我一直在尝试安装Hadoop,然后安装HBase。在解决了很多困难和错误之后,我终于可以安装Hadoop,并在运行start-all.sh时得到这个输出,一切似乎都很好。>hduser@CSLAP106:~$/usr/local/hadoop/bin/start-all.sh>hduser@CSLAP106:~$jps>3005NameNode>3404JobTrac

php - Symfony2 和 Blueimp jQuery-File-Upload : where to set the "server/php" directory

我将使用BlueimpjQuery-File-Upload的基本版本用于文件上传的库。在PHP框架中,此Javascript库依赖于位于“server/php”目录中的PHP类“index.php”的执行。如图tutorialpage,“操作”必须指向该目录。在Symfony2应用程序中使用此库时,应该将“server/php”目录放在哪里?我应该使用哪个路径?在实践中如何让它发挥作用?PS:我知道有一些像Punkave的“symfony2-file-uploader-bundle”这样的Symfony2包,但是我在教程中遗漏了一些东西,我不希望再回到Symfony2表格-

php - 自动生成 Doctrine 的 get set 方法

我正在使用Doctrine我必须制作很多模型,如果我不必手动完成所有操作就好了。我这样设置和属性:/***@varstring$name**@Column(name="Name",type="string",length=100,nullable=false)*/private$name;get&set方法由信息组成,这些信息完全包含在属性声明中。那么有没有人知道有什么工具可以从属性声明中生成如下所示的getset方法。/***Setname**@paramstring$name*@returnUser*/publicfunctionsetName($name){$this->name