草庐IT

oozie-workflow

全部标签

hadoop - 如何使用简单的输入事件设置 Oozie 协调器?

如何设置可以存在或不存在的Oozie协调器输入事件?请填写???对于以下内容:-130FIFO/time-independent/path/that/may/or/maynot/be/there???${myAppPath}myInput${coord:dataIn('myInput')}谢谢,阿尔瓦罗 最佳答案 数据集频率值将为${coord:days(1)},因为您希望将其安排在每天。starttime将是您要开始作业时的值。例如。2017-01-22T12:00Z.因此,更新后的协调器xml将如下所示:-130FIFO/tim

java - Oozie:同一自定义 Java 操作的多个版本

我使用的是Oozie4.1.0。我部署了一个扩展Java操作的自定义操作。现在我需要部署除此之外的另一个版本。XSD将是相同,但操作代码有变化。我会将更新后的操作放入自定义包中,并对操作XSD进行版本控制。我想在自定义操作的构造函数中也应该更改类型名称,因为根据我对代码的判断,这需要是唯一的。但是,我如何才能在使用新版本的工作流XML中引用相同的操作名称?处理版本的推荐方法是什么? 最佳答案 解决这个问题的步骤:应该将新版本的jar(操作)部署到Oozie应将新的XSD版本添加到oozie-site.xml下oozie.servic

mysql - 如何将 shell 脚本参数传递给 oozie

我有一个shell脚本可以将数据从MySQL导入到hdfs即sqoopshell脚本。我想使用oozie来安排sqoop导入作业。脚本有以下sqoop查询sqoopimport--connect${domain}:${port}/${database}--username${username}--password${password}--query"select*from${table}where\$CONDITIONS"-m1--hive-import--hive-database${hivedatabase}--hive-table${table}--target-dir/user

hadoop - 使用 oozie 工作流的 s3 服务器端加密

我有一个将数据写入s3存储桶的sqoop作业。如果我从命令行运行此作业,它会加密s3文件。但是,如果我使用相同的jar文件通过oozie工作流运行sqoop作业,那么它会将数据推送到s3,但不会发生加密。下面是我的oozie工作流程。${jobTracker}${nameNode}com.aa.datalake.ingest.util.SqoopIngestUtilrootroottestavrosqoop-demo在jar中,我们使用distcp命令将数据从hdfs复制到s3。那么如何使用oozie工作流对s3文件进行服务器端加密? 最佳答案

hadoop - oozie中执行 Action 后删除hdfs路径

执行类似于在操作前删除的prepare标记的操作后,如何删除hdfs路径。...[JOB-TRACKER][NAME-NODE]......[JOB-XML-FILE][PROPERTY-NAME][PROPERTY-VALUE]...[PIG-SCRIPT][PARAM-VALUE]...[PARAM-VALUE][ARGUMENT-VALUE]...[ARGUMENT-VALUE][FILE-PATH]...[FILE-PATH]...... 最佳答案 pig行动中没有等价物。你基本上有两个选择:在您的pig脚本中添加删除命令添

hadoop - Oozie EL 函数中的动态变量

我正在编写一个基于频率的协调器工作流程。配置存储在一些oozie.wf.properties文件中:--javapropertiesconfigmyFrequencyDays=1协调器定义如下:${appLocation}/application.workflow.xml然而,由于${coord:days($myFrequencyDays)},这会因EL解析错误而失败有实现此目标的想法吗? 最佳答案 您将无法在OozieEL函数内部使用属性中的参数。解决方案是使用chronsyntax在协调器功能规范中进行了描述。因此,在您的属性文

shell - 在oozie工作流中获取oozie作业信息

通过在命令行上使用以下命令,我们可以获得oozie作业的作业详细信息,即使它仍在进行中。exportOOZIE_URL=http://..../oozieooziejob-info0177204-172227110941438-oozie-oozi-Woozie工作流正在运行,在最后一个shell操作中,我试图将作业信息详细信息捕获到一个文件中。job.sh------------job_id=${1}exportOOZIE_URL=http://..../oozieooziejob-infojob_id>>/tmp/job_id.txt但是上面的命令不起作用。有没有办法,我们如何在正

java - 如何单独测试作为 oozie 工作流一部分的 hadoop MapReduce java 操作(带有文件标签)?

我正在尝试在java中单独测试MapReduce作业,这是oozie工作流的一部分。我能够通过使用以下命令在Java中成功测试MapReduce作业。hadoopjar/tmp/lib/Example.jarcom.example.MRDrivermapper=com.example.DataTransformMapper挑战是当标记作为ooziejava操作的一部分时。请告知如何使用file标签模拟或测试此MapReduce作业。${hbase_site_xml}com.example.MRDriver-Dsun.security.krb5.debug=truemapper=com.

hadoop - 使用 Oozie 运行级联

我正在尝试使用Oozie运行级联作业。我得到一个java.lang.ClassNotFoundException:cascading.tap.hadoop.MultiInputSplit我在工作流库中包含了级联jar,但是当级联启动m/r作业时它没有被包含。有人在使用Cascading和Oozie吗? 最佳答案 您应该将级联jar与您自己的jar结合起来,并将其提供给workflow/lib。 关于hadoop-使用Oozie运行级联,我们在StackOverflow上找到一个类似的问题

hadoop - 子工作流失败时如何中止oozie工作流?

我在主工作流中创建了子工作流,它们按顺序调用,这意味着当一个完成时,下一个子工作流将被触发,但在子工作流失败时,我的主工作流没有得到中止并触发下一个子工作流程。下面给出了主要工作流程示例hdfs://link/abc.xmlautoReconnecttrueTableNameabctargetDirPath${targetDirPath}hdfs://def.xmlautoReconnecttrueTableNamedeftargetDirPath${targetDirPath}Actionfailed,errormessage[${wf:errorMessage(wf:lastErr