草庐IT

hadoop - Oozie 从上次被杀死的节点重新运行工作流

我在oozie中使用MRAction。并且想在MR上使用oozie提供的suspend/resume功能。问题-但是,当我们在Oozie上调用“暂停”时,它不会终止hadoop作业,而只会更新oozie状态,而hadoop作业会继续运行直至完成。我希望在oozie工作流暂停时立即终止hadoop作业。我猜这不可能吧?所以,我想我可以终止oozie工作流程并重新运行它。但现在的问题是,如果我的工作流程中有3个Action节点,我不想重新运行所有这些节点。我在这里抽烟还是可以访问最后一个成功的oozie节点(这很可能存储在mysql数据库中)?对于我纵容的用例,是否有更好的方法?提前感谢您

hadoop - Pig,Hive,Hbase,Oozie,Zookeeper在Hadoop 2.0和Hadoop 1.0的安装是一样的吗?

我最近使用YARN配置安装了hadoopv_2。我计划安装Hadoop生态系统堆栈,如Pig、Hive、Hbase、Oozie、Zookeeper等。我想知道我是否应该从我为Hadoop1.0配置所做的相同链接安装这些工具。如果没有,谁能给我发送这些工具的Hadoop2配置链接?。我听说Pig和Hive在Hadoop2.0中更快。所以想知道有没有更好的版本。谢谢,高瑟姆 最佳答案 http://www.cloudera.com/content/cloudera/en/documentation/cdh4/v4-2-1/CDH4-In

hadoop - Oozie 工作流配置单元操作卡在运行中

我正在运行来自Hortonworks发行版的Hadoop2.4.0、Oozie4.0.0、Hive0.13.0。我有多个Oozie协调员作业,它们可能会同时启动所有工作流。每个协调器作业都监视不同的目录,当_SUCCESS文件出现在这些目录中时,工作流将启动。工作流运行一个Hive操作,该操作从外部目录读取并复制内容。SEThive.exec.dynamic.partition=true;SEThive.exec.dynamic.partition.mode=nonstrict;DROPTABLEIFEXISTS${INPUT_TABLE};CREATEexternalTABLEIFN

hadoop - 使用 oozie 调用 pig - org.apache.pig.Main 退出代码 [2]

我正在尝试在Oozie中调用Pig操作,并且我正在处理以下内容-Ooziev3.3.2Pigv0.12.1-maprHadoopv1.0.3maprM5我现在可以使用Oozie调用java操作。但是,当我尝试调用Pig操作时,它失败了,但并没有透露太多-[Map/Reducefailed,errormessage[${wf:errorMessage(wf:lastErrorNode())}]],afterresolve[Map/Reducefailed,errormessage[Mainclass[org.apache.oozie.action.hadoop.PigMain],exit

hadoop - Oozie java-action 不包含 core-site.xml

在新安装的HadoopHDP2.2.2.4上运行Ooziejava操作时,例如尝试访问hdfs,它会访问错误的文件系统:java.lang.IllegalArgumentException:错误的FS:hdfs:/tmp/text.txt,预期:file:///可以通过在Oozie操作中包含core-site.xml来修复:hdfs:/path-to-core-site.xml-on-hdfs但是原因是什么,正确的解决方法是什么? 最佳答案 core-site.xml不包含在java-action的类路径中的原因是属性mapredu

java - 来自 Oozie Java 工作的电子邮件

我们使用Clouderacdh5.4.0,并一直在尝试从JavaAPI触发oozie作业以发送电子邮件。使用SMTP登录发送电子邮件依赖于两个第3方jar文件-activation.jar和mail.jar。当第3方文件放置在文件系统上的同一文件夹中时,JAVA程序可以从IDE/packagesJar文件中正常发送电子邮件。但是当我们将文件移动到HDFS并尝试配置oozie作业时,它无法完成。我们的oozie作业xml如下(email.xml):Actionfailed,errormessage[${wf:errorMessage(wf:lastErrorNode())}]${jobT

hadoop - 不应该在包安装期间配置 Oozie/Sqoop jar 位置吗?

我在CentOS6.7中使用HDP2.4。我已经用Ambari创建了集群,所以Oozie是由Ambari安装和配置的。我在运行与jar文件位置相关的Oozie/Sqoop时遇到两个错误。第一个涉及postgresql-jdbc.jar,因为Sqoop作业是从Postgres增量导入的。我将postgresql-jdbc.jar文件添加到HDFS并在workflow.xml中指向它:/user/hdfs/sqoop/postgresql-jdbc.jar问题解决了。但第二个错误似乎与kite-data-mapreduce.jar有关。然而,对这个文件做同样的事情:/user/hdfs/s

apache - 向 Oozie 工作流通知添加授权

ApacheOozie具有oozie.wf.workflow.notification.url属性来通知自定义端点有关作业状态更新。oozie.wf.workflow.notification.urlhttp://SERVER:8080/endpoint/oozieUpdate?jobId=$jobId%26status=$status我有一个用例,其中端点必须对传入请求进行身份验证,但我找不到允许我配置Oozie以便它将身份验证header发送到此通知URL(例如基本身份验证)的解决方案。有办法吗? 最佳答案 我怀疑您能否在ooz

hadoop - 全局变量 HADOOP_USER_NAME oozie?

有什么方法可以在oozie工作流中将HADOOP_USER_NAME声明为全局变量?实际上,我正在为我的项目创建多个shell操作,但为每个shell操作声明一个HADOOP_USER_NAME效率不高,这就是为什么我想知道在这种情况下是否可以使用全局变量,如果可以,我该如何继续它。..非常感谢您的帮助。这是我正在使用的代码HADOOP_USER_NAME*****Error[${wf:errorMessage(wf:lastErrorNode())}]${jobTracker}${nameNode}script1.shscript1.sh#script1.sh出于某种原因,我没有从H

hadoop - Oozie Hive 操作使用 -i init 脚本

如何使用初始化脚本运行OozieHive或Hive2操作?在CLI中,这通常可以通过-iinit.hive来完成。争论;但是当通过-iinit.hive在OozieAction中使用它时工作流程因错误而停止。我将init.hive文件链接到init.hive#init.hive属性,它在本地appcache目录中可用。$llappcache/application_1480609892100_0274/container_e55_1480609892100_0274_01_000001/|grepinit>lrwxrwxrwx1rootroot42Jan1212:24init.hive