oozie-anth-W

hadoop - OOZIE 状态检查抛出 java.lang.NullPointerException

我是oozie的新手，正在尝试在CDH4.1.1中编写一个oozie工作流。所以我启动了oozie服务，然后我使用这个命令检查了状态:sudo服务oozie状态我收到消息:正在运行然后我尝试了这个命令来检查状态:oozieadmin--ooziehttp://localhost:11000/ooziestatus我得到了以下异常:java.lang.NullPointerExceptionatjava.io.Writer.write(Writer.java:140)atorg.apache.oozie.client.AuthOozieClient.writeAuthToken(Auth

hadoop - Oozie 未启动

我正在使用oozie4.1.0和CDH-5.5.1。我正在启用sla作为对thisquestion的回答。我从oozie.services.ext属性中删除了所有FQCN。它在后端使用PostgreSQL。我没有任何凭据。开始抛异常如下2016-05-0309:31:28,312FATALorg.apache.oozie.service.Services:SERVER[data4]RuntimeExceptionduringServicesLoad.Checkyourlistof'oozie.services'or'oozie.services.ext'2016-05-0309:31:

hadoop Oozie apache java org job-scheduling

hadoop - 使用带有 Oozie 的 sqoop 观察重复项

我已经构建了一个sqoop程序，以便使用预构建的sqoop作业将数据从MySQL导入HDFS:sqoopjob-fs$driver_path-Dmapreduce.map.java.opts="-Duser.timezone=Europe/Paris"\--createjob_parquet_table--import-m$nodes_number\--connectjdbc:mysql://$server:$port/$database--username$username--password-file$pass_file\--target-dir$destination_dir--

hadoop Oozie sqoop section noreferrer

hadoop - Hadoop Oozie shell 操作中的 kerberos 票证和委托(delegate) token 使用

我是hadoop的新手，我试图理解为什么即使在执行kinit后我的oozieshell操作也没有接受新票证。这是我的场景。我使用我的ID“A”登录，并为我的ID准备了一张kerberos票证。我使用我的ID提交带有shell操作的oozieworklow。在oozieshell操作中，我执行另一个kinit以获得ID“B”的票证。只有这个id“B”可以访问一些HDFS文件。kinit工作正常，因为klist显示了ID“B”的票证。现在，当我读取只有B有权访问的HDFS文件时，我收到权限被拒绝的错误消息，提示“A”无权访问该文件。但是当我在oozie之外的linuxcli上做同样的事情时

票证 delegate oozie token hadoop hive kerberos kerberos-delegation

hadoop - 导出 Oozie Web 控制台中列出的作业

抱歉，如果这个问题听起来很基础，我是Hadoop环境的新手。我在找什么？在我的例子中，有计划每天运行的作业，我想每天在Excel工作表中导出失败的作业列表。如何查看工作流作业？目前我使用Oozie网络控制台查看作业，但我没有/看不到导出选项。还，我无法从Ooziedocumentation中找到此信息.但是，我发现可以使用如下命令列出作业$ooziejobs-ooziehttp://localhost:8080/oozie-localtime-len2-fliterstatus=RUNNING我卡在哪里了？我想过滤给定日期的失败作业，想将其导出为csv/excel数据。

hadoop Oozie strong code section

hadoop - 如果协调器操作失败，如何暂停 Oozie 协调器？

在我的用例中，下一次迭代使用协调器操作的输出，因此如果其中一个失败，未完成/损坏的数据将被输入到下一个协调器操作。如果协调器操作中的工作流步骤之一失败，是否有任何方法可以暂停Oozie协调器？例如代替:我们可以这样做吗:因此可以在其输出被下一个协调器操作覆盖之前诊断出错误？PS:fs>delete不是这里的实际用例，只是一个例子。最佳答案您不能基于工作流失败(来自协调器操作)暂停协调器。如果工作流的输出具有特定模式，那么您可以使用它并在工作流开始时检查它。否则，只要文件成功，您始终可以触摸文件作为工作流中的最后一个操作，如果失败

协调器 hadoop section lt oozie oozie-coordinator

hadoop - oozie是否使用Yarn容器

我们目前正在我们的集群中运行大量的Oozie作业。其中许多工作都使用模板并具有子工作流程。这些作业并不总是包含大量繁重的作业，它们大多包含一个小的shell脚本。Hue作业浏览器显示大量Oozie步骤。我们现在有时会觉得我们的集群因这些作业而重载。这让我想知道，是否每一个Oozie作业都指定了一个yarn容器？如果是这样，这意味着对于2分钟的工作，我们有效使用的资源是所需资源的2-10倍。最佳答案自己看吧...在Hue仪表板中，单击任何已执行的工作流，选择“操作”选项卡，查看“外部ID”列=>每个job_000000_0000指

容器 hadoop section strong stackoverflow hadoop-yarn oozie cloudera-cdh

hadoop - 在 Hadoop 上运行的 Oozie 作业出现问题 -/user/history/done_intermediate 上的权限

首先介绍一下背景。我有一个测试CDH集群，有两个节点。我正在尝试执行Oozie作业，下载文件，使用SPARK处理它，然后在Solr中对其进行索引。集群配置为使用Kerberos身份验证。CDH版本为5.7.1当我尝试使用Oozie运行作业时，使用以下命令:ooziejob--ooziehttps://host:11443/oozie/-run--configoozieExample/job.properties失败并出现以下异常:2016-08-1212:29:40,415WARNorg.apache.oozie.action.hadoop.JavaActionExecutor:SER

done_intermediate intermediate code hadoop oozie hdfs

Azure oozie 工作流

我正在尝试在azurehdinsight集群上运行oozie工作流，作业定义如下所示:jobtrackerhost:9010wasb://abc@def.blob.core.windows.netmapred.job.queue.namedefaultimport--connectjdbc:mysql://{ip}/svnadmin--usernameuname--passwordpassword--tablerights--hive-importsqoopfailed,errormessage[${wf:errorMessage(wf:lastErrorNode())}]日志:201

Azure oozie lt gt hadoop sqoop azure-hdinsight

hadoop - 无法在 HUE oozie 中运行 spark 作业。异常 : "datanucleus-api-jdo-3.2.1.jar does not exist"

我想知道的是spark如何/在哪里挑选所需的jar。文件:/mnt/md0/yarn/nm/usercache/kylin/appcache/application_1468506830246_161908/container_1468506830246_161908_01_000001/datanucleus-api-jdo-3.2.1.jar不存在。--num-executors30--executor-memory18g--executor-cores15--driver-memory2g--fileshdfs:///jobs/kylin/hive-site.xml--jarsd

中运 datanucleus-api-jdo spark strong section hadoop apache-spark hadoop-yarn oozie hue

16 17 181920 21 22