草庐IT

oozie-anth-W

全部标签

java - 无法使用 java 操作运行 oozie 工作流

我正在提交一个oozie工作流,我是在Hue中设计的,它包含一些java操作。Hue提交并尝试执行oozie工作流,我总是收到以下错误。FailingOozieLauncher,Mainclass[org.apache.oozie.action.hadoop.JavaMain],main()threwexception,begin>endinrange(begin,end)Causedbyjava.lang.IllegalArgumentException:begin>endinrange(begin,end):(1399708804155,1399694415805)我不知道这意味着

hadoop - 在oozie中覆盖hadoop的mapreduce.fileoutputcommitter.marksuccessfuljobs

mapreduce.fileoutputcommitter.marksuccessfuljobsfalse我想将上述属性重写为true。对于集群上的其余作业,该属性需要为false,但在我的oozie工作流中,我需要hadoop在作业完成后在输出目录中创建_SUCCESS文件。它是写入输出的工作流中的配置单元操作。请帮忙。 最佳答案 不幸的是,Hive通过设置它自己的NullOutputComitter覆盖了这个能力:conf.setOutputCommitter(NullOutputCommitter.class);看src/sh

hadoop - 从 oozie 的网络用户界面中删除作业?

Oozie将在其WebUI中列出所有提交的作业,包括RUNNING、KILLED、PREP等。有什么方法可以在不直接编辑MetastoreDB的情况下从oozie的WebUI中删除作业? 最佳答案 有一些属性可以在设定的天数过期后删除已完成的作业/协调器/包:http://oozie.apache.org/docs/3.3.2/oozie-default.xmloozie.services-需要包含清除服务:org.apache.oozie.service.PurgeServiceoozie.service.PurgeService

hadoop - Oozie 卡在 PREP 状态

我在运行oozie协调器作业时遇到问题。下面是我的工作属性和xml文件代码。提交作业时没有错误,但作业始终处于“准备”状态。经过一定程度的等待后,我必须手动终止工作。单独执行工作流作业时,成功完成。能否请您告诉我在我的协调工作中可能出了什么问题?这是我的coordinator.xml这是我的coordinatorjob.properties谢谢,卡莱 最佳答案 当开始时间在未来时,协调器处于PREP状态。您的配置中的开始时间是2014-02-2511:31UTC,因此如果您在发布问题时提交(2014-02-2506:45UTC),它

hadoop - 使用 Spark on YARN 支持构建 Oozie 4.2.0

我想要实现的是构建和安装Oozie4.2.0,这将使我能够将Spark作业提交到YARN集群。我通过执行以下命令构建发行版:oozie-4.2.0/bin/mkdistro.sh-Puber-Phadoop-2-DskipTests。这创建了oozie-4.2.0-distro.tar.gz包,我可以在里面找到oozie-4.2.0-sharelib.tar.gz。但是,许多在线教程指出我应该使用oozie-4.2.0-sharelib-yarn.tar.gz才能使用YARN。这样的文件不包含在发行包中。如何让构建过程输出YARN版本的sharelibs?我尝试继续使用非YARN版本,

hadoop - Oozie 4.2 中禁用的工作流错误日志

我正在使用与HDP2.3捆绑在一起的Oozie4.2。在使用oozie包附带的几个示例工作流时,我注意到“作业错误日志已禁用”,这使得在出现故障时调试非常困难。我尝试运行以下命令,#ooziejob-config/home/santhosh/examples/apps/hive/job.properties-runjob:0000063-150904123805993-oozie-oozi-W#ooziejob-errorlog0000063-150904123805993-oozie-oozi-W错误日志被禁用!!谁能告诉我如何为oozie启用工作流错误日志?

hadoop - HUE、YARN 和 OOZIE 有什么区别

我了解HDFS和MapReduce的概念,以及将处理逻辑移动到数据以提高效率的重要性。我什至能够在我的基本Hadoop集群上运行几个mapreduce作业。围绕这些概念,有许多不同的技术,如YARN、HUE、OOZIE,所有这些似乎都在做同样的事情(至少从非常高的水平来看),即作业的操作可见性和CRUD能力(可以是map-reduce或者是其他东西)。我做出这个假设是否正确,或者它们之间是否存在更根本的区别?谢谢凯 最佳答案 YARN-MapReduce是一种API,您必须在其中实现数据处理逻辑。编译代码后,您必须使用hadoopj

hadoop - 如何查看 Oozie 日志

我的协调器因错误而失败:E0301无效资源[文件名]当我执行hadoopfs-ls[filename]时,会列出该文件。我该如何调试错误。我如何查看日志文件???ooziejob-log需要jobId。就我而言,我没有工作编号。在那种情况下我怎么能看到日志。感谢回复。谢谢 最佳答案 如果您正在寻找命令行方式来执行此操作,您可以运行以下命令:ooziejob-ooziehttp://localhost:11000-infoooziejob-ooziehttp://localhost:11000-log如果您设置了$OOZIE_URL,

java - 在 OOZIE-4.1.0 中运行多个工作流时出错

我按照以下步骤在Linux机器上安装了oozie4.1.0http://gauravkohli.com/2014/08/26/apache-oozie-installation-on-hadoop-2-4-1/hadoopversion-2.6.0maven-3.0.4pig-0.12.0集群设置-主节点运行-名称节点、资源管理器、代理服务器。SLAVENODErunning-Datanode,Nodemanager.当我运行单个工作流作业时意味着它成功了。但是当我尝试运行多个Workflow作业时,即两个作业都处于接受状态检查错误日志,我深入了解问题,014-12-2421:00:3

shell - Oozie shell 操作未作为提交用户运行

我编写了一个Oozie工作流,它运行BASHshell脚本来执行一些配置单元查询并对结果执行一些操作。该脚本运行但在访问某些HDFS数据时抛出权限错误。提交Oozie工作流的用户有权限,但脚本以yarn用户身份运行。是否可以让Oozie以提交工作流的用户身份执行脚本?Hive和Java操作都作为提交的用户执行,只是shell的行为不同。这是我的Oozie操作的粗略轮廓${jobTracker}${nameNode}${WorkflowRoot}/hive-site.xmlscript.sh${WorkflowRoot}/script.sh我正在运行Oozie4.1.0和HDP2.1。