草庐IT

oozie-workflow

全部标签

c# - c# 应用程序的 oozie 调度

我在Windows中使用oozie-4.1.0。我想通过oozie安排一个c#应用程序。据我所知oozie只支持java,pig,hive。谁能告诉我是否支持调度c#应用程序 最佳答案 据我所知,Oozie不支持c#,但具有shell操作:https://oozie.apache.org/docs/4.1.0/DG_ShellActionExtension.html这可能是一个变通办法-如果您通过shell操作启动您的c#应用程序。 关于c#-c#应用程序的oozie调度,我们在Stac

hadoop - Oozie - 任务日志不显示

使用CDH5,当我运行我的oozie工作流时,我不再看到来self的映射器(log4j、slf4j)的日志语句。我什至尝试了System.out.println-我仍然看不到这些语句。是否有我缺少的设置? 最佳答案 事实证明日志仍然存在,除非您需要手动将浏览器指向它。例如,单击map-reduce操作仍会打开类似(http://localhost:50030/jobdetails.jsp?jobid=job_201510061631_2112)的作业日志页面。但是要获得实际工作的结果,我需要将jobid增加到job_20151006

hadoop - 通过 oozie 运行的配置单元查询的 CPU 时间

我正在运行一个包含配置单元操作的oozie工作流。如何获取查询占用的CPU时间。如果通过HiveCLI提交Hive查询,则它会显示累积CPU时间,但在MapReduce或oozie的Hive操作日志中看不到。 最佳答案 检查在资源管理器中提交的相应MR作业。打开父作业的系统日志。您可以在那里找到所有控制台信息。 关于hadoop-通过oozie运行的配置单元查询的CPU时间,我们在StackOverflow上找到一个类似的问题: https://stackov

hadoop - 如何在 oozie 协调器中使用一天的旧数据集

我正在寻找实现以下目标的正确方法:场景:连接器正在提供数据,并且正在将数据存储在hdfs中的路径/data/2015/09/15/csvfile.csv中。(按天存储)我的协调员工作在一天结束时在2015-09-15T23:59上运行,并使用来自上述路径的当天数据并将其存储到分区day=下的配置单元表中16.基本上,如果数据可用,我想让每个分区都保存最后一天的数据,如果数据不可用,则不应创建分区。例如第15个收集的数据应类似地存储到第16个分区中第16个数据放入第17个分区,依此类推。假设喂食从2015-09-15T00:00开始直到2015-09-16T00:00满一天并存储在路径/

hadoop - Oozie 编译问题

我正在尝试在hadoop1上安装oozie..编译时:[INFO]ReactorSummary:[INFO][INFO]ApacheOozieMain.................................SUCCESS[0.372s][INFO]ApacheOozieClient...............................SUCCESS[1.530s][INFO]ApacheOozieHadoop1.1.1.oozie-4.0.1.............SUCCESS[0.052s][INFO]ApacheOozieHadoopDistcp1.1.1.o

hadoop - 如何使用自定义Oozie EL函数读取HDFS文件

在oozie中是否可以写一个EL函数来读取HDFS文件 最佳答案 是的,您可以编写任何您喜欢的EL函数,参见thisblogpost获取说明。 关于hadoop-如何使用自定义OozieEL函数读取HDFS文件,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/32748214/

hadoop - 如何使用 hue-oozie 设计 distcp 作业

我正在尝试在hueoozie浏览器中设置distcp作业。不确定在哪里提供的参数是什么?hadoopdistcphdfs://nn1:8020/source/firsthdfs://nn1:8020/source/second哪个xml应该是job.xml以及参数值是什么? 最佳答案 Hue自带例子,你看过DisCo的吗?(在您的安装或demo.gethue.com中)。请注意,新编辑器(Hue3.8+)中的Distcp操作更易于使用。 关于hadoop-如何使用hue-oozie设计d

shell - 如何在 Oozie 中使用配置单元操作运行 shell 脚本?

我每天都在尝试在Oozie中运行带有配置单元操作的shell脚本。我在Oozie中成功执行了操作,但shell脚本中的配置单元部分不起作用。当我从shell运行脚本时,它工作正常。位于HDFS中的文件。这里是异常(exception)Causedby:java.lang.RuntimeException:Unabletoinstantiateorg.apache.hadoop.hive.metastore.HiveMetaStoreClientatorg.apache.hadoop.hive.metastore.MetaStoreUtils.newInstance(MetaStoreU

hadoop - Oozie - 从 Hive Action 捕获输出

在Oozie中,我们如何捕获可以在后续HiveAction中进一步使用的第一个HiveAction的输出? 最佳答案 假设您有两个hive表A和B。这里您正在对表A的数据执行一些转换,并希望将数据存储在表B中。为此,您的表B应该在Metastore中定义为外部表。Oozie工作流将在表A中执行转换查询,其输出将作为表B的源存储在表B的表定义中定义的同一目录中。 关于hadoop-Oozie-从HiveAction捕获输出,我们在StackOverflow上找到一个类似的问题:

java.lang.NoSuchFieldError : INSTANCE in HttpClient when running Oozie 错误

我有一个Java应用程序(作为Maven项目),它使用HttpClient(v4.5)访问RESTAPI,然后将GET响应作为JSON写入HDFS。这在EclipseIDE中工作正常。这是我的依赖项:org.apache.httpcomponentshttpclient4.5com.google.code.gsongson2.3.1org.apache.hadoophadoop-client2.2.0当我尝试将它与Oozie集成时,因为我计划定期进行RESTAPI调用和HDFS写入,我遇到了:Causedby:java.lang.NoSuchFieldError:INSTANCEato