作业队

java - map 和 reduce 作业可以在不同的机器上吗？

我正在研究一个非常独特的计算卸载解决方案，我可以使用c++/java中的自定义编程很好地完成这项工作，但我正在寻找可以在hadoop或任何其他框架中完成的相同方法吗？我搜索了很多，但没有找到任何有值(value)的东西。正如我们所知，正常的hadoop作业由Map和Reduce阶段组成，其中两者都在具有几乎相同功率的机器上运行，对于map阶段我们不需要power并且可以卸载到像RaspberryPI这样的廉价商品硬件上，而reduce应该在强大的机器上运行。那么是否有可能将这2个阶段隔离开来并使它们具有机器感知能力？最佳答案在每

Hadoop Map Reduce 作业 : Class org. 找不到 apache.hive.hcatalog.mapreduce.HCatInputFormat

我正在使用kylin.它是一个数据仓库工具，它使用hadoop、hive和hbase。它附带示例数据，以便我们可以测试系统。我正在构建这个样本。这是一个多步骤过程，其中许多步骤都是map-reduce作业。第二步是ExtractFactTableDistinctColumns，这是一个MR作业。如果没有在hadoop日志中写入任何内容，这项工作就会失败。深入挖掘后，我在logs/userlogs/application_1450941430146_0002/container_1450941430146_0002_01_000004/syslog中发现了一个异常2015-12-2407

HCatInputFormat mapreduce apache hadoop org hive kylin

hadoop - 将 Hadoop 作业输出重定向到文件

我正在运行Hadoop作业，输出显示在控制台上。有没有办法将输出重定向到文件。我尝试了以下命令来重定向输出，但它不起作用。hduser@vagrant:/usr/local/hadoop$hadoopjarshare/hadoop/mapreduce/hadoop*examples*.jarwordcount/user/hduser/gutenberg/user/hduser/gutenberg-output>joboutput 最佳答案您可以将错误流重定向到文件，这是hadoop作业的输出。那就是使用；hadoopjarshar

hadoop section hduser

java - 使用 java 运行 Hadoop map reduce 作业时抛出空指针异常

提前致谢...我正在运行Hadoop版本0.20.0和HBase0.94。我有一个聚合逻辑，它将使用调度程序每晚12点运行。我们正处于无法升级HBase和Hadoop的阶段。在运行MapReduce作业时，它抛出如下异常，java.lang.NullPointerExceptionatorg.apache.hadoop.conf.Configuration.getLocalPath(Configuration.java:877)atorg.apache.hadoop.mapred.JobConf.getLocalPath(JobConf.java:280)atorg.apache.ha

java Hadoop apache hbase bigdata

hadoop - oozie 作业的 yarn user on/user/yarn 的访问异常

我正在运行一个包含sqoop命令的oozie工作流。通过终端提交时，sqoop命令运行良好。但是oozie工作流给出了以下异常:Exceptioninthread"main"java.lang.RuntimeException:org.apache.hadoop.security.AccessControlException:Permissiondenied:user=yarn,access=WRITE,inode="/user/yarn":hdfs:hdfs:drwxr-xr-x请指出可能存在的问题。工作流中的Sqoop命令:import--connect"jdbc:sqlserve

yarn user section oozie hadoop hadoop-yarn sqoop

hadoop - 启动 Pig 作业时出现 oozie 错误

我正尝试从oozie启动一个pig作业，但它失败了。Oozie堆栈跟踪:java.lang.RuntimeException:java.lang.ClassNotFoundException:找不到类org.apache.oozie.action.hadoop.PigMain在org.apache.hadoop.conf.Configuration.getClass(Configuration.java:1897)在org.apache.oozie.action.hadoop.LauncherMapper.map(LauncherMapper.java:224)在org.apache.

时出 hadoop apache java apache-pig oozie oozie-coordinator

java - 为什么 Oozie 在运行 MapReduce 作业时分配更多内存？

我正在使用oozie运行MapReduce作业。从工作流中我只是调用MapReduce驱动程序类，除此之外别无其他。但是对于这个oozie工作流程需要大量内存。它需要至少2GB的容器大小来调用驱动程序类。下面是workflow.xml${jobTracker}${nameNode}mapred.job.queue.name${jobQueue}${jobScript}${arguments}${queueName}${wf:id()}myPath/MyDriver.sh#MyDriver.shJobfailedfailed:[${wf:errorMessage(wf:lastError

时分 MapReduce lt gt name java hadoop hadoop-yarn oozie

Hadoop 作业 : Error injecting constructor, JAXBException

在ApacheCrunch管道中实现的MapReduce作业失败并显示错误消息Errorinjectingconstructor,javax.xml.bind.JAXBException:property"retainReferenceToInfo"isnotsupported。Crunch管道与其他功能管道非常相似；有没有人对下面看到的错误有任何理论或直觉？感谢您的帮助。可以在下面找到应用程序日志的摘录:2016-02-1613:34:31,925INFO[main]org.mortbay.log:Extractjar:file:/data7/hadoop/yarn/local/fi

JAXBException constructor java hadoop apache mapreduce jaxb guice apache-crunch

hadoop - Oozie 作业被挂起并且未到达 YARN

我正在尝试通过cli启动OozieShell操作作业:ooziejob-configjobprops/jos.prioperties-runJob开始，它给了我一个唯一的Id，我可以在OozieUI中看到Job。但是，Yarn控制台显示没有提交的作业，并且在oozie中检查日志时我收到以下消息:Errorstartingaction[folder-structure].ErrorType[TRANSIENT],ErrorCode[JA009]Message[JA009:Permissiondenied:user=vikas.r,access=WRITE,inode="/":hdfs:h

hadoop Oozie section strong DefaultAuthorizationProvider mapreduce cloudera-cdh

hadoop - 当 NameNode 宕机时，hadoop 作业会发生什么？

在Hadoop1.2.1中，我想对以下这些问题有一些基本的了解谁接收hadoop作业？是NameNode还是JobTracker？如果有人在NameNode宕机时提交Hadoop作业会发生什么情况？hadoop作业会失败吗？还是进入Hold状态？如果有人在JobTracker宕机时提交Hadoop作业，会发生什么情况？hadoop作业是否失败？还是进入Hold状态？最佳答案对于Hadoop作业，您可能指的是MapReduce作业。如果您的NN出现故障，并且您没有备用的(在HA设置中)，您的HDFS将无法工作，并且依赖于此HDFS

hadoop 机时 section mapreduce

142 143 144145146 147 148