oozie-anth-W

java - EMR 上的 Oozie - 任务永远卡在 PREP 状态

我使用3.0.4AMI(Hadoop2.2.0)在ElasticMapreduce上运行Oozie4.0.1。我已经从源代码构建了Oozie，一切都已安装并且似乎正常工作，直到安排Hive作业为止。也就是说，我可以连接到Web控制台，使用“oozie”命令等提交和终止作业。但是......我发现任务(到目前为止我已经尝试过“Hive”和“Shell”)进入PREP状态(根据OozieWeb控制台)但从未真正开始。我已经尝试了协调器(cron)作业和基本工作流作业，并且在这两种情况下都得到了相同的行为。它到达hive任务节点，或shell任务节点，然后挂起。对于基本的工作流任务，jo

Oozie java gt lt 34 hadoop hive elastic-map-reduce

java - Hadoop:如何远程调试单个 oozie java 工作流

我无法将调试器连接到javaworkflow.我不希望打开整个hadoop作业进行调试(如许多地方所指定，例如Howtodebughadoopmapreducejobsfromeclipse?或REMOTEDEBUGGINGOFHADOOPJOBWITHECLIPSE等...)。我希望调试单个(!)工作流程。我有一个小型集群(3台机器)，我希望在这个模拟的开发环境中进行调试。我曾尝试在工作流程中指定以下内容:mapred.child.java.opts-agentlib:jdwp=transport=dt_socket,server=y,suspend=y,address=12121但

java Hadoop section gt lt debugging oozie

hadoop - Oozie map-reduce 作业永远停留在 PREP 状态

我正在尝试运行wordcountmap-reduce示例，引用https://support.pivotal.io/hc/en-us/articles/203355837-How-to-run-a-Map-Reduce-jar-using-Oozie-workflow.我在集群设置中使用hadoop2.2.0问题是我的ooziemap-reduce作业一直在运行。它没有给出任何错误，但没有成功完成。没有错误消息。也没有创建输出目录(这是假设发生的)。下面是workflow.xml${jobTracker}${nameNode}mapred.mapper.new-apitruemapre

map-reduce hadoop gt lt property mapreduce oozie

shell - 使用 Oozie 执行 shell 脚本，作业始终仅处于运行状态

我需要oozie的帮助，我正在尝试运行一个创建HDFS文件夹的脚本，当我执行Oozie时它仅显示在运行状态，任何人都可以帮助我确定我的workflow.xml是否有问题或乔.属性。我尝试验证workflow.xml，它没有显示任何错误。workflow.xml${jobTracker}${nameNode}/user/nathalok/run.sh/user/nathalok/run.sh#run.shScriptfailed,errormessage[${wf:errorMessage(wf:lastErrorNode())}]Job.propertiesnameNode=hdfs:

shell 处于 oozie lt gt hadoop

hadoop - 通过 Oozie 4.1.0.3 在 Spark 中运行 Hive 查询

使用Oozie版本4.1.0.3在Spark中运行Hive查询时获取表未找到异常，作为java操作。从hdfs路径复制hive-site.xml和hive-default.xml使用的workflow.xml:${jobTracker}${nameNode}${nameNode}/user/${wf:user()}/${appRoot}/env/devbox/hive-site.xmloozie.hive.defaults${nameNode}/user/${wf:user()}/${appRoot}/env/devbox/hive-default.xmlpool.name${etlP

中运 hadoop gt lt arg spark-hive

hadoop - 如何解决 Oozie 错误 : JA009: Cannot initialize Cluster. 检查 mapreduce.framework.name 的配置

我一直在使用oozie来安排spark作业。尝试使用Oozie中可用的spark操作在2.x集群中部署spark作业。在我的job.properties中，我有以下内容`nameNode=hdfs://hostname:8020jobTracker=hostname:8050master=yarn-clusterqueueName=defaultoozie.use.system.libpath=true`当我提交oozie作业时，我一直收到此错误错误:错误代码[JA009]，消息[JA009:无法初始化集群。请检查您的mapreduce.framework.name配置和相应的服务器地

initialize framework oozie section apache hadoop oozie-coordinator

hadoop - 运行 oozie fork 时出现 LeaseExpiredException

我们正在尝试运行一个Oozie工作流，其中3个子工作流使用fork并行运行。子工作流包含一个运行原生mapreduce作业的节点，以及随后运行一些复杂的PIG作业的两个节点。最后，三个子工作流被连接到一个end节点。当我们运行这个工作流时，我们得到LeaseExpiredException。异常在运行PIG作业时随机发生。它发生的时间没有确定的位置，但是每次我们运行WF时都会发生。此外，如果我们删除fork并按顺序运行子工作流，它会正常工作。然而，我们的期望是让它们在某些执行时间内并行运行。能否请您帮助我理解这个问题以及一些关于我们可能出错的地方的指示。我们从hadoop开发开始，以前

时出 LeaseExpiredException gt lt name hadoop apache-pig hdfs oozie

hadoop - 获取 OOZIE 错误 E0900 : Jobtracker [localhost:8021] not allowed, 不在 Oozies 白名单中]

我正在尝试在CDH虚拟机上运行Oozie示例。我正在运行ClouderaManager并执行以下命令:ooziejob-ooziehttp://localhost:11000/oozie-configexamples/apps/map-reduce/job.properties-run当我检查状态时，我得到了HadoopAccessorException。我检查了oozie日志，我看到了以下堆栈跟踪:2013-07-2214:25:56,179WARNorg.apache.oozie.command.wf.ActionStartXCommand:USER[cloudera]GROUP[

Jobtracker localhost oozie strong section hadoop

hadoop - Oozie 和 Hue : why am I getting "permission denied" error while playing oozie workflow?

我是Hue和Oozie的新手。我安装了一个带有Hue的Cloudera5集群。我以Thomas的身份登录Hue，并创建了一个仅运行Hive脚本的Oozie仪表板。但是，当我启动仪表板时，出现以下错误，声称无法在inode/tmp/hadoop-yarn上写入:2015-06-1213:36:01,014WARNActionStartXCommand:523-SERVER[cdh-master]USER[thomas]GROUP[-]TOKEN[]APP[My_Workflow]JOB[0000000-150612132534763-oozie-oozi-W]ACTION[0000000

permission amp hadoop DefaultAuthorizationProvider gt oozie

java - 如何将 Jar 文件传递给 OOZIE shell 节点中的 shell 脚本

您好，我在oozieshell操作工作流中执行的脚本中运行java程序时出现以下错误。Stdoutput2015-08-2503:36:02,636INFO[pool-1-thread-1](ProcessExecute.java:68)-Exceptioninthread"main"java.io.IOException:Erroropeningjobjar:/tmp/jars/first.jarStdoutput2015-08-2503:36:02,636INFO[pool-1-thread-1](ProcessExecute.java:68)-atorg.apache.hadoo

shell 点中 java gt lt hadoop hdfs oozie

38 39 404142 43 44