草庐IT

作业队

全部标签

java - map 和 reduce 作业可以在不同的机器上吗?

我正在研究一个非常独特的计算卸载解决方案,我可以使用c++/java中的自定义编程很好地完成这项工作,但我正在寻找可以在hadoop或任何其他框架中完成的相同方法吗?我搜索了很多,但没有找到任何有值(value)的东西。正如我们所知,正常的hadoop作业由Map和Reduce阶段组成,其中两者都在具有几乎相同功率的机器上运行,对于map阶段我们不需要power并且可以卸载到像RaspberryPI这样的廉价商品硬件上,而reduce应该在强大的机器上运行。那么是否有可能将这2个阶段隔离开来并使它们具有机器感知能力? 最佳答案 在每

Hadoop Map Reduce 作业 : Class org. 找不到 apache.hive.hcatalog.mapreduce.HCatInputFormat

我正在使用kylin.它是一个数据仓库工具,它使用hadoop、hive和hbase。它附带示例数据,以便我们可以测试系统。我正在构建这个样本。这是一个多步骤过程,其中许多步骤都是map-reduce作业。第二步是ExtractFactTableDistinctColumns,这是一个MR作业。如果没有在hadoop日志中写入任何内容,这项工作就会失败。深入挖掘后,我在logs/userlogs/application_1450941430146_0002/container_1450941430146_0002_01_000004/syslog中发现了一个异常2015-12-2407

hadoop - 将 Hadoop 作业输出重定向到文件

我正在运行Hadoop作业,输出显示在控制台上。有没有办法将输出重定向到文件。我尝试了以下命令来重定向输出,但它不起作用。hduser@vagrant:/usr/local/hadoop$hadoopjarshare/hadoop/mapreduce/hadoop*examples*.jarwordcount/user/hduser/gutenberg/user/hduser/gutenberg-output>joboutput 最佳答案 您可以将错误流重定向到文件,这是hadoop作业的输出。那就是使用;hadoopjarshar

java - 使用 java 运行 Hadoop map reduce 作业时抛出空指针异常

提前致谢...我正在运行Hadoop版本0.20.0和HBase0.94。我有一个聚合逻辑,它将使用调度程序每晚12点运行。我们正处于无法升级HBase和Hadoop的阶段。在运行MapReduce作业时,它抛出如下异常,java.lang.NullPointerExceptionatorg.apache.hadoop.conf.Configuration.getLocalPath(Configuration.java:877)atorg.apache.hadoop.mapred.JobConf.getLocalPath(JobConf.java:280)atorg.apache.ha

hadoop - oozie 作业的 yarn user on/user/yarn 的访问异常

我正在运行一个包含sqoop命令的oozie工作流。通过终端提交时,sqoop命令运行良好。但是oozie工作流给出了以下异常:Exceptioninthread"main"java.lang.RuntimeException:org.apache.hadoop.security.AccessControlException:Permissiondenied:user=yarn,access=WRITE,inode="/user/yarn":hdfs:hdfs:drwxr-xr-x请指出可能存在的问题。工作流中的Sqoop命令:import--connect"jdbc:sqlserve

hadoop - 启动 Pig 作业时出现 oozie 错误

我正尝试从oozie启动一个pig作业,但它失败了。Oozie堆栈跟踪:java.lang.RuntimeException:java.lang.ClassNotFoundException:找不到类org.apache.oozie.action.hadoop.PigMain在org.apache.hadoop.conf.Configuration.getClass(Configuration.java:1897)在org.apache.oozie.action.hadoop.LauncherMapper.map(LauncherMapper.java:224)在org.apache.

java - 为什么 Oozie 在运行 MapReduce 作业时分配更多内存?

我正在使用oozie运行MapReduce作业。从工作流中我只是调用MapReduce驱动程序类,除此之外别无其他。但是对于这个oozie工作流程需要大量内存。它需要至少2GB的容器大小来调用驱动程序类。下面是workflow.xml${jobTracker}${nameNode}mapred.job.queue.name${jobQueue}${jobScript}${arguments}${queueName}${wf:id()}myPath/MyDriver.sh#MyDriver.shJobfailedfailed:[${wf:errorMessage(wf:lastError

Hadoop 作业 : Error injecting constructor, JAXBException

在ApacheCrunch管道中实现的MapReduce作业失败并显示错误消息Errorinjectingconstructor,javax.xml.bind.JAXBException:property"retainReferenceToInfo"isnotsupported。Crunch管道与其他功能管道非常相似;有没有人对下面看到的错误有任何理论或直觉?感谢您的帮助。可以在下面找到应用程序日志的摘录:2016-02-1613:34:31,925INFO[main]org.mortbay.log:Extractjar:file:/data7/hadoop/yarn/local/fi

hadoop - Oozie 作业被挂起并且未到达 YARN

我正在尝试通过cli启动OozieShell操作作业:ooziejob-configjobprops/jos.prioperties-runJob开始,它给了我一个唯一的Id,我可以在OozieUI中看到Job。但是,Yarn控制台显示没有提交的作业,并且在oozie中检查日志时我收到以下消息:Errorstartingaction[folder-structure].ErrorType[TRANSIENT],ErrorCode[JA009]Message[JA009:Permissiondenied:user=vikas.r,access=WRITE,inode="/":hdfs:h

hadoop - 当 NameNode 宕机时,hadoop 作业会发生什么?

在Hadoop1.2.1中,我想对以下这些问题有一些基本的了解谁接收hadoop作业?是NameNode还是JobTracker?如果有人在NameNode宕机时提交Hadoop作业会发生什么情况?hadoop作业会失败吗?还是进入Hold状态?如果有人在JobTracker宕机时提交Hadoop作业,会发生什么情况?hadoop作业是否失败?还是进入Hold状态? 最佳答案 对于Hadoop作业,您可能指的是MapReduce作业。如果您的NN出现故障,并且您没有备用的(在HA设置中),您的HDFS将无法工作,并且依赖于此HDFS