草庐IT

hadoop - 使用 oozie 工作流的 s3 服务器端加密

我有一个将数据写入s3存储桶的sqoop作业。如果我从命令行运行此作业,它会加密s3文件。但是,如果我使用相同的jar文件通过oozie工作流运行sqoop作业,那么它会将数据推送到s3,但不会发生加密。下面是我的oozie工作流程。${jobTracker}${nameNode}com.aa.datalake.ingest.util.SqoopIngestUtilrootroottestavrosqoop-demo在jar中,我们使用distcp命令将数据从hdfs复制到s3。那么如何使用oozie工作流对s3文件进行服务器端加密? 最佳答案

hadoop - oozie中执行 Action 后删除hdfs路径

执行类似于在操作前删除的prepare标记的操作后,如何删除hdfs路径。...[JOB-TRACKER][NAME-NODE]......[JOB-XML-FILE][PROPERTY-NAME][PROPERTY-VALUE]...[PIG-SCRIPT][PARAM-VALUE]...[PARAM-VALUE][ARGUMENT-VALUE]...[ARGUMENT-VALUE][FILE-PATH]...[FILE-PATH]...... 最佳答案 pig行动中没有等价物。你基本上有两个选择:在您的pig脚本中添加删除命令添

hadoop - Oozie EL 函数中的动态变量

我正在编写一个基于频率的协调器工作流程。配置存储在一些oozie.wf.properties文件中:--javapropertiesconfigmyFrequencyDays=1协调器定义如下:${appLocation}/application.workflow.xml然而,由于${coord:days($myFrequencyDays)},这会因EL解析错误而失败有实现此目标的想法吗? 最佳答案 您将无法在OozieEL函数内部使用属性中的参数。解决方案是使用chronsyntax在协调器功能规范中进行了描述。因此,在您的属性文

shell - 在oozie工作流中获取oozie作业信息

通过在命令行上使用以下命令,我们可以获得oozie作业的作业详细信息,即使它仍在进行中。exportOOZIE_URL=http://..../oozieooziejob-info0177204-172227110941438-oozie-oozi-Woozie工作流正在运行,在最后一个shell操作中,我试图将作业信息详细信息捕获到一个文件中。job.sh------------job_id=${1}exportOOZIE_URL=http://..../oozieooziejob-infojob_id>>/tmp/job_id.txt但是上面的命令不起作用。有没有办法,我们如何在正

java - 如何单独测试作为 oozie 工作流一部分的 hadoop MapReduce java 操作(带有文件标签)?

我正在尝试在java中单独测试MapReduce作业,这是oozie工作流的一部分。我能够通过使用以下命令在Java中成功测试MapReduce作业。hadoopjar/tmp/lib/Example.jarcom.example.MRDrivermapper=com.example.DataTransformMapper挑战是当标记作为ooziejava操作的一部分时。请告知如何使用file标签模拟或测试此MapReduce作业。${hbase_site_xml}com.example.MRDriver-Dsun.security.krb5.debug=truemapper=com.

hadoop - 使用 Oozie 运行级联

我正在尝试使用Oozie运行级联作业。我得到一个java.lang.ClassNotFoundException:cascading.tap.hadoop.MultiInputSplit我在工作流库中包含了级联jar,但是当级联启动m/r作业时它没有被包含。有人在使用Cascading和Oozie吗? 最佳答案 您应该将级联jar与您自己的jar结合起来,并将其提供给workflow/lib。 关于hadoop-使用Oozie运行级联,我们在StackOverflow上找到一个类似的问题

hadoop - 子工作流失败时如何中止oozie工作流?

我在主工作流中创建了子工作流,它们按顺序调用,这意味着当一个完成时,下一个子工作流将被触发,但在子工作流失败时,我的主工作流没有得到中止并触发下一个子工作流程。下面给出了主要工作流程示例hdfs://link/abc.xmlautoReconnecttrueTableNameabctargetDirPath${targetDirPath}hdfs://def.xmlautoReconnecttrueTableNamedeftargetDirPath${targetDirPath}Actionfailed,errormessage[${wf:errorMessage(wf:lastErr

java - Oozie 构建失败无法锁定存储构建/测试/数据/dfs/name1。该目录已被锁定

我正在尝试按照instruction构建Oozie4.0.1在mvntestinbuild时遇到这个问题-------------------------------------------------------------------------------Testset:org.apache.oozie.store.TestCoordinatorStore-------------------------------------------------------------------------------Testsrun:1,Failures:0,Errors:1,Skip

mysql - 使用 Sqoop/Oozie 从 Hive 加载数据到 MySQL 表

在使用Sqoop(Oozie中的sqoop命令)将数据加载到MySQL表时,我遇到了一些严重的问题(尝试了196次不成功)。如果HDFS中只有一列数据(此处为foo),则没有问题,但是当有超过1列时,例如2列,数据未加载到MySQL。如果我单独运行Sqoop,那么数据会加载到MySQL,但是当我放入Oozie时,数据不会被加载。workflow.xml有两部分,第一部分将数据从Hive表加载到HDFS,第二部分将数据从HDFS加载到MySQL。我正在使用ClouderaVM。错误信息是:Causedby:java.lang.NumberFormatException:Forinputs

hadoop - 在 Hadoop 集群上使用 Oozie 运行 Sqoop Action 时出现问题

我正在尝试使用Hadoop集群在Oozie中成功运行sqoop-action。每当我检查作业状态时,Oozie都会返回以下状态更新:ActionID状态分机ID分机状态错误代码0000037-140930230740727-oozie-oozi-W@:start:OK-OK-0000037-140930230740727-oozie-oozi-W@sqoop-loadERRORjob_1412278758569_0002FAILED/KILLEDJA0180000037-140930230740727-oozie-oozi-W@sqoop-load-failOK-OKE0729这让我相