草庐IT

packaged_task

全部标签

一文教你完美解决Linux中Unable to locate package xxx问题,解决不了你打我!

项目场景:使用Ubuntu系统进行开发问题描述这两天跟着一门网课学把html的网页部署到云服务器,于是租了个Ubuntu云服务器,照着网课的代码去执行,然后一直出现这个问题,各种包都找不到,以及之前用Ubuntu的时候也出现过这个问题,从网上搜了30个中文的回答,解决方案大抵一致,全都试了一遍无果,于是开始利用google搜索引擎,还有bing搜索的国际版(全英文),然后令我大吃一惊,第一个搜索到的内容就成功解决了我的问题!不得不说,计算机的问题还得是用google搜索,或者bing国际版,去看英文的回答比较准确,为什么呢,因为一是中文的回答大多都是转载,内容雷同较高,虽然能解决我们平时的大部

xml - 改变 mapred.reduce.tasks

我应该在哪个文件中设置reducer的数量和设置mapred.reduce.tasks参数?我的conf文件夹中只有以下文件,没有一个有这个参数:ubuntu@group-3-vm1:~/conf$lscapacity-scheduler.xmlhdfs-site.xmlmapred-site.xmlyarn-site.xmlcore-site.xmlhive-site.xmltez-site.xml 最佳答案 所有Hadoop配置属性都分为以下几组。Hadoop-1.X.X:核心-core-site.xmlhdfs-hdfs-si

hadoop - Mapper 或 Reducer Task 中未处理的异常会使任务失败?

我想知道mapper任务(或reducer任务)中未处理的异常是否会使任务失败,或者仅忽略时间的特定输入对?我想是前者,但不太确定。 最佳答案 这取决于错误。无论哪种方式,我总是强调用try-catchblock包装map和减少逻辑。出现错误时,我递增一个计数器,其名称派生自异常类名。这不仅可以保护hadoop的其余部分免受逻辑错误的影响,还可以让您仅通过查看日志就知道出了多少问题。 关于hadoop-Mapper或ReducerTask中未处理的异常会使任务失败?,我们在StackOv

hadoop - 启动的 reduce task 和减少调用函数的次数之间的区别?

我刚刚开始学习hadoop,并使用自定义分区器和比较器运行hadoopmap-reduce程序(首先在单节点环境中尝试,稍后将部署在集群上),奇怪的行为(因为我不知道到底是什么正在进行)我观察到根据我的分区器和比较器,调用了五次reduce方法,因为我也从日志中对它进行了交叉检查。但是在控制台上,已启动的reduce任务的计数仍然是“1”。我非常怀疑这五个函数调用是否并行运行?如果不是,那么我将如何为这些reduce函数调用实现分布式计算的优势,因为这些reduce函数调用收集的数据会很大。请澄清,我缺少什么概念? 最佳答案 red

java - HIPI API : does it process 1 image per map task?

我正在阅读与Hadoop的HIPI图像处理API相关的论文,网址为:http://cs.ucsb.edu/~cmsweeney/papers/undergrad_thesis.pdf在解释其中的协方差示例时,该论文说“因为HIPI为每个映射任务分配一个图像,所以很容易随机抽取100个补丁的图像并执行此计算”。但是论文中显示的第一个图描绘了一个架构,其中多个图像被输入到一个maptask中!令人惊讶的是,他们写道一张图像由一个maptask处理,因为它会产生太多maptask,因为他们也在解决小文件问题。如果这是真的,那么带有MultithreadedMapper的序列文件是一个更好的选

hadoop - 运行 Hadoop 示例时出现错误 : package org. apache.hadoop.conf 不存在

我已经使用exportCLASSPATH=${CLASSPATH}:/~Downloads/hadoop-1.0.4/*.jar将hadoopjars添加到类路径中,但我仍然我收到找不到包的错误。我正在使用Java1.7.0_17。有人知道如何正确设置hadoopjar的类路径吗? 最佳答案 您要将它们设置到的不是CLASSPATH,而是HADOOP_CLASSPATH。我喜欢使用以下命令添加当前目录和lib目录中的所有jar依赖项:exportHADOOP_CLASSPATH=$HADOOP_CLASSPATH:`echo*.ja

windows - mapred.JobClient : Error reading task output http:. .. 在 Windows 操作系统上从 Cygwin 运行 hadoop 时

我在Windows上运行来自Cygwin的“MahoutinAction”一书中的“从文档生成向量”样本。Hadoop仅在本地计算机上启动。下面是我的运行命令:$bin/mahoutseq2sparse-ireuters-seqfiles/-oreuters-vectors-ow但是下面显示java.io.IOException,有谁知道这个问题是什么原因造成的?提前致谢!Runningonhadoop,usingHADOOP_HOME=my_hadoop_pathHADOOP_CONF_DIR=my_hadoop_conf_path13/05/1318:38:03WARNdriver

Hadoop - map task 在 reduce task 完成后继续

我在大约500个节点的集群上运行Hadoop版本1.0.0。我的工作有大约3000个map任务和10个reduce任务。maptask在大约4小时后完成(如预期)。每个reduce任务都很快完成,结果都在我的输出目录中。然而,jobtracker然后认为某些map任务失败并开始重新执行它们。正在执行和挂起的reduce任务的数量保持为零。最终大约8小时后,这些maptask中的最后一个终于成功完成,作业被标记为成功完成。有什么想法吗???以下是部分jobtracker日志文件的摘录://maptasksallcomplete,eg:2013-05-2010:50:59,742INFOo

hadoop - Cloudera Hadoop MapReduce 错误 : Task process exit with nonzero status of 65

我有PentahoMapReduce作业(基本上是Java作业),它将HBase数据作为map输入。工作流非常适合少量数据(例如100行数据),但在几十万条记录上运行时会失败。两个映射器作业被提交到集群,它们正在做简单的数据聚合(大约400000行在两个HBase区域中分开)。它接缝任务无法在600秒内报告其状态,这是由mapred-site.xml中的mapred.task.timeout设置规定的。我不确定如何在Hadoop的Cloudera4.1.4发行版中更改此设置?同样在以下错误日志中,您可以看到一些其他错误:MetaVERSION="1".JobJOBID="job_201

python - 不同数量的 map task (1、2、4 ..)之间没有性能差异

我是hadoop的新手,正在测试不同数量的map任务和reduce任务之间的性能差异。文件大小约为5GB,hadoop安装在4核/8核机器(超线程)上。map和reduce是用python写的,所以我用-Dmapred.map.tasks=2指定map任务数,用-D指定reduce任务数mapred.reduce.tasks=2.问题问题是结果没有显示不同数量的maptask之间的任何性能差异..结果+----------+----------+----------+|map|reduce|time|+----------+----------+----------+|1|1|47m0