一个目录下可以有两个oozieworkflow.xml文件吗?如果是这样,我如何指示oozierunner运行哪一个? 最佳答案 您可以有两个工作流文件(只需给它们唯一的名称),然后您可以通过在配置文件中设置oozie.wf.application.path值来选择要调用的文件:oozie.wf.application.path=hdfs://namenode:9000/path/to/job/wf-1.xml#oozie.wf.application.path=hdfs://namenode:9000/path/to/job/wf
我们正在考虑将apachespark集成到我们的计算过程中,我们最初想使用apacheoozie和标准MR或MO(仅限map)作业。经过一些研究后,仍然存在几个问题:是否可以使用apacheoozie编排apachespark进程?如果是,怎么做?oozie是否不再必要,或者spark可以自行处理编排?(统一似乎是spark的主要关注点之一)请在回答时考虑以下场景:每4小时执行一次工作流程在特定数据可访问时执行工作流触发工作流并使用参数配置提前感谢您的回答。 最佳答案 Oozie4.2支持Spark作为操作类型,请参阅docs.您提
我正在尝试创建Ooize协调器。问题是我已经有了等待使用oozie处理的暂存数据。想象一下这样的情况。当前日期是:01.03.2013(2013年3月1日)我确实有这些输入目录:/staging/landing/source/xvlr/2013/02/01/00(2013年二月一日,一天的第一个小时)/staging/landing/source/xvlr/2013/02/01/01/staging/landing/source/xvlr/2013/02/01/02/staging/landing/source/xvlr/2013/02/01/03/staging/landing/so
Oozie有一个名为oozie.launcher.action.main.class的配置属性,您可以在其中为map-reduce操作(或shell操作)传入“主类”的名称,如下所示:oozie.launcher.action.main.classcom.company.MyCascadingClass但是我需要将参数传递给我的主类,但找不到实现它的方法。有什么想法吗?我问这个问题是因为我正尝试从Oozie中启动一个级联类/流,但到目前为止我尝试过的所有选项都失败了。如果有人从Oozie获得了Cascading功能,请告诉我,我会发布另一个问题来特别询问这个问题。
基于OoozieXML的工作流定义容易出错,并且在运行时难以调试。此外,在生产环境中运行它们存在一定风险。1)是否有一种简单的方法来测试基于oozie的工作流/应用程序;通过嵌入式服务器或其他模拟环境?2)关于oozie开发是否有任何完善的IDE/TDD习语? 最佳答案 MiniOozie可能会有所帮助。还使用-dryrun允许打印1个具体化的已解析xml并进行语法检查-http://oozie.apache.org/docs/3.3.2/DG_CommandLineTool.html#Dryrun_of_Coordinator_J
我正在尝试使用以下命令重新运行oozie协调器操作。ooziejob-rerun-action-Doozie.wf.rerun.fail.nodes=true但它是从头开始执行Action,而不是从故障节点开始执行。协调器忽略了“oozie.wf.rerun.fail.nodes=true”选项。我想念提供一些选择吗? 最佳答案 对于OozieCoordinator重新运行,使用-failed标志重新运行在-action中传递的协调器操作的失败工作流操作。ooziejob-rerun-failed-action属性-Doozie.w
我在HDFS中有一个shell脚本。我已使用以下工作流程在oozie中安排此脚本。工作流程:Actionfailed,errormessage[${wf:errorMessage(wf:lastErrorNode())}]${jobTracker}${nameNode}shell.sh${input_file}HADOOP_USER_NAME=${wf:user()}/user/xxxx/shell_script/lib/shell.sh#shell.sh/user/xxxx/args/${input_file}#${input_file}工作性质nameNode=xxxxxxxxxx
我在hadoop2.2集群上安装了oozie4.0.1。之后,我尝试运行oozie作业(java操作)。一切似乎都很好:当我运行job.properties时,它会像往常一样给出作业ID。当我检查oozie控制台作业处于运行状态时。它运行java代码。然而,oozie突然停止并显示以下错误。ACTION[0000001-140526105244150-oozie-labu-W@javaMainAction]Exceptionincheck().Message[java.net.ConnectException:CallFromlabuser-VirtualBox/127.0.1.1to
我有一个oozie用例,用于检查输入数据的可用性并根据数据的可用性触发mapreduce作业。所以我写了一个shell脚本来检查输入数据,并在oozie中为它创建了一个ssh操作,输入数据检查的重试次数和重试间隔应该是可配置的,并且在每次重试后如果数据仍然丢失我必须发送警报,在指定的重试次数后mapreduce作业可以从可用数据开始我写了一个工作流程如下:${sshUserHost}${Oozieutilsscript}${(wf:actionData('datacheck')['datatransfer']=="complete")}${(wf:actionData('datache
我得到以下oozie.log:org.apache.oozie.service.ServiceException:E0104:Couldnotfullyinitializeservice[org.apache.oozie.service.ShareLibService],Notabletocachesharelib.AnAdminneedstoinstallthesharelibwithoozie-setup.shandissuethe'oozieadmin'CLIcommandtoupdatethesharelib我运行以下命令:oozie-setup.shsharelibcreat