草庐IT

task_info

全部标签

hadoop - pig 0.13 错误 2998 : Unhandled internal error. org/apache/hadoop/mapreduce/task/JobContextImpl

刚刚安装了Pig0.13,我正在尝试将它与Hadoop1.1.2一起使用。(Pig文档指出Pig0.13与Hadoop1.1.2兼容)。根据Pig安装说明,我设置了$PIG_CLASSPATH指向定义了core-site.xml、hdfs-site.xml和mapred-site.xml的/etc/hadoop。Hadoop集群功能正常,可以很好地处理非Pig作业。根据下面的错误描述,我了解到Pig无法找到它正在寻找的JobContextImpl类。根据Hadoop1.1.2API文档,我不认为“任务”是“mapreduce”包的子包。我尝试将hadoop-core-1.1.2.jar

map - 如何限制并发运行的 map task ?

我的hadoop版本是1.0.2。现在我最多同时运行10个maptask。我发现了2个与这个问题相关的变量。a)mapred.job.map.capacity但在我的hadoop版本中,这个参数似乎被放弃了。b)mapred.jobtracker.taskScheduler.maxRunningTasksPerJob(http://grepcode.com/file/repo1.maven.org/maven2/com.ning/metrics.collector/1.0.2/mapred-default.xml)我像下面这样设置这个变量:Configurationconf=newCo

scala - 如何在 Spark 中获取 map task 的 ID?

有没有办法在Spark中获取maptask的ID?例如,如果每个map任务调用一个用户定义函数,我能否从该用户定义函数中获取该map任务的ID? 最佳答案 我不确定您所说的maptaskID是什么意思,但您可以使用TaskContext访问任务信息:importorg.apache.spark.TaskContextsc.parallelize(Seq[Int](),4).mapPartitions(_=>{valctx=TaskContext.getvalstageId=ctx.stageIdvalpartId=ctx.parti

hadoop - 错误修复后仍然得到 "Unable to load realm info from SCDynamicStore"

我使用brewinstallhadoop和brewinstallpig安装了Hadoop和Pig。我读了here您将收到UnabletoloadrealminfofromSCDynamicStore错误消息,除非您添加:exportHADOOP_OPTS="-Djava.security.krb5.realm=OX.AC.UK-Djava.security.krb5.kdc=kdc0.ox.ac.uk:kdc1.ox.ac.uk"到你的hadoop-env.sh文件,我有。但是,当我运行hadoopnamenode-format时,我仍然看到:java[1548:1703]Unable

Hadoop Datanode、namenode、secondary-namenode、job-tracker 和 task-tracker

我是hadoop的新手,所以我有一些疑问。如果主节点发生故障,hadoop集群会发生什么?我们能否在没有任何损失的情况下恢复该节点?是否可以保留一个辅助主节点在当前主节点发生故障时自动切换为主节点?我们有namenode(Secondarynamenode)的备份,所以我们可以在Secondarynamenode发生故障时从中恢复namenode。这样,当datanode发生故障时,我们如何恢复datanode中的数据呢?Secondarynamenode只是namenode的备份而不是datenode,对吧?如果一个节点在作业完成之前发生故障,那么作业跟踪器中有待处理的作业,该作业是

hadoop - 如何修复 "Task attempt_201104251139_0295_r_000006_0 failed to report status for 600 seconds."

我编写了一个mapreduce作业来从数据集中提取一些信息。该数据集是用户对电影的评价。用户数约250K,电影数约300k。map的输出是*>and*>.在reducer中,我将处理这些对。但是当我运行作业时,mapper按预期完成,但reducer总是提示Taskattempt_*failedtoreportstatusfor600seconds.我知道这是由于无法更新状态,所以我添加了对context.progress()的调用在我的代码中是这样的:intcount=0;while(values.hasNext()){if(count++%100==0){context.progr

macos - OSX 上的 Hadoop "Unable to load realm info from SCDynamicStore"

我在OSX10.7上启动Hadoop时遇到此错误:UnabletoloadrealminfofromSCDynamicStoreput:org.apache.hadoop.hdfs.server.namenode.SafeModeException:Cannotcreatedirectory/user/travis/input/conf.Namenodeisinsafemode.它似乎不会导致Hadoop的功能出现任何问题。 最佳答案 MatthewBuckett在HADOOP-7489中的建议对我有用。将以下内容添加到您的hado

Nginx + PHP FPM : PATH_INFO always empty

我在Debian上配置了nginxstable(1.4.4)+PHP(使用FastCGI、php-fpm)。效果很好:location~*^/~(.+?)(/.*\.php)${fastcgi_split_path_info^(.+?\.php)(/.*)$;alias/home/$1/public_html$2;fastcgi_passunix:/var/run/php5-fpm.sock;includefastcgi_params;fastcgi_paramSCRIPT_FILENAME$request_filename;fastcgi_indexindex.php;autoind

php - 在 Opencart admin 'Order Info' 页面上添加自定义字段

我想在opencart管理订单页面上添加自定义字段。比较值,例如如果oc_order.order_id=oc_custom_table.order_id然后在管理订单列表上显示oc_custom_table.comment。在管理订单信息页面上显示相同的内容。我在admin_model_order.php页面中添加了一个自定义函数,其中包含所有查询。publicfunctiongetCustomTable($order_id){$query=$this->db->query("SELECT*FROM".DB_PREFIX."custom_tableWHEREorder_id='".(i

php - 获取 PATH_INFO 的便携且安全的方法

我正在寻找一种便携方式来接收(方便的)$_SERVER['PATH_INFO']变量。看了一会儿,发现PATH_INFO源自CGI/1.1,我并不总是出现在所有配置中。获取该变量的最佳(主要是安全方面)方法是什么-除了手动提取它(安全问题)。 最佳答案 好吧,我(几乎)确定如果不使用$_SERVER超全局键,提供另一种方法来找出PATH_INFO是不可能的,那被说letsfirstlistallofthe$_SERVERkeys我们可能可能使用:'PHP_SELF'“QUERY_STRING”'SCRIPT_FILENAME''PA