草庐IT

hadoop - 在 Oozie 中可以实现这种类型的工作流程吗?

Oozie中可以实现这种类型的工作流吗?或者关于如何在oozie中做这类事情的任何建议请看附图http://s7.postimg.org/yj30wb0mj/oozie_Workflow.jpgTask3一次只能由一个工作流运行,其他工作流需要等待。Task3是ssh操作,一次只有一个人需要访问该机器。 最佳答案 这是可以做到的。使用forkandjoinfork创建wf1和2并加入然后开始任务3,然后再次fork。您可能需要重构您的操作以匹配此设计并拆分您的工作流,以便设计将匹配您想要实现的目标

hadoop - 带有 Hive 问题的 Oozie

我正在尝试使用配置单元操作将配置单元与Oozie一起使用。Oozie工作流应该将数据从一个Hive表加载到另一个。我在Hive中有一个表foo,它应该将数据加载到表“test”中。我正在使用ClouderaVM和Hadoop2.0.0-cdh4.4.0。我使用以下命令运行工作流:[cloudera@localhostoozie-3.3.2+92]$ooziejob-ooziehttp://localhost:11000/oozie-configexamples/apps/hive/job.properties-run当我转到JobTracker日志文件时,它说:找不到表'foo'。有帮

hadoop - 使用带有 kerberos 的配置单元 Metastore 服务器的 oozie 配置单元操作

我正在使用CDH5。我已经设置了一个HiveMetastore来使用kerberos。即hive-site.xml具有以下属性hive.metastore.sasl.enabledtruehive.metastore.kerberos.keytab.file/etc/hive/conf/hive.keytabhive.metastore.kerberos.principalhive/hive-metastore.example.com@example.COM日志显示启动hive-metastore服务时没有错误。我正在尝试在oozie工作流中运行配置单元操作。oozie-site.xm

xml - Oozie workflow.xml 错误

我是hadoop生态系统的新手,我一直在尝试通过Oozie协调和执行基本的pig工作。当我尝试验证我的workflow.xml文件时出现以下错误。错误:Invalidappdefinition,org.xml.sax.SAXParseException;lineNumber:32;columnNumber:16;cvc-complex-type.2.3:Element'workflow-app'cannothavecharacter[children],becausethetype'scontenttypeiselement-only.这是我的workflow.xml文件供您引用。12

hadoop - Oozie 自定义异步操作

我在Oozie中实现自定义异步操作时遇到问题。我的类扩展自ActionExecutor,并覆盖了方法initActionType、start、end、check、kill和isCompleted。在启动方法中,我想启动一个YARN作业,它是通过我的BiohadoopClient类实现的。为了使调用异步,我将client.run()方法包装在Callable中:publicvoidstart(finalContextcontext,finalWorkflowActionaction){...Callablebiohadoop=newCallable(){BiohadoopClientcl

hadoop - CDH5 中的 Oozie 不获取 mapreduce.job.counters.max

当我运行一个oozie工作流,该工作流运行创建超过120个计数器的mapreduce-action(120是允许的默认最大计数器数)时,我收到一条错误消息,提示“计数器太多”。我已将mapreduce.job.counters.max设置为高于120的数字,但oozie似乎没有接受它。我在CDH5.1上使用hadoop2.3有没有人遇到过这种情况? 最佳答案 解决方案是将以下内容添加到YARNServiceMapReduceAdvancedConfigurationSnippet(SafetyValve):mapreduce.job

java - 是否可以使用 hadoop 2.5.2 在 oozie 4.1.0 中运行 map reduce 作业

我是oozie的新手,可以在oozie4.1.0和hadoop2.5.2中运行mapreduce作业吗???请多指教! 最佳答案 应该是内存问题吧。在yarn-site.xml中设置以下属性并尝试运行作业,yarn.nodemanager.resource.memory-mb20960 yarn.scheduler.minimum-allocation-mb512yarn.scheduler.maximum-allocation-mb2048 关于java-是否可以使用hadoop2.5

c# - c# 应用程序的 oozie 调度

我在Windows中使用oozie-4.1.0。我想通过oozie安排一个c#应用程序。据我所知oozie只支持java,pig,hive。谁能告诉我是否支持调度c#应用程序 最佳答案 据我所知,Oozie不支持c#,但具有shell操作:https://oozie.apache.org/docs/4.1.0/DG_ShellActionExtension.html这可能是一个变通办法-如果您通过shell操作启动您的c#应用程序。 关于c#-c#应用程序的oozie调度,我们在Stac

hadoop - Oozie - 任务日志不显示

使用CDH5,当我运行我的oozie工作流时,我不再看到来self的映射器(log4j、slf4j)的日志语句。我什至尝试了System.out.println-我仍然看不到这些语句。是否有我缺少的设置? 最佳答案 事实证明日志仍然存在,除非您需要手动将浏览器指向它。例如,单击map-reduce操作仍会打开类似(http://localhost:50030/jobdetails.jsp?jobid=job_201510061631_2112)的作业日志页面。但是要获得实际工作的结果,我需要将jobid增加到job_20151006

hadoop - 通过 oozie 运行的配置单元查询的 CPU 时间

我正在运行一个包含配置单元操作的oozie工作流。如何获取查询占用的CPU时间。如果通过HiveCLI提交Hive查询,则它会显示累积CPU时间,但在MapReduce或oozie的Hive操作日志中看不到。 最佳答案 检查在资源管理器中提交的相应MR作业。打开父作业的系统日志。您可以在那里找到所有控制台信息。 关于hadoop-通过oozie运行的配置单元查询的CPU时间,我们在StackOverflow上找到一个类似的问题: https://stackov