oozie-anth-W

hadoop - 为什么oozie需要数据库？

我已经在我的系统中安装了apacheoozieversion4.1.2..安装时，我使用以下命令为oozie创建了一个数据库。ooziedb.shcreate-sqlfileoozie.sql-run(linux)为什么oozie需要数据库？它会在数据库中存储什么？最佳答案 Oozie将工作流/调度程序详细信息和其他信息存储在数据库中。可以从控制台访问正在运行的作业和早期作业的状态。关于hadoop-为什么oozie需要数据库？，我们在StackOverflow上找到一个类似的问题：

java - 如何在不使用 OOzie 的情况下创建 Hadoop 作业链

我想创建一个由三个Hadoop作业组成的链，其中一个作业的输出作为输入提供给第二个作业，依此类推。我想在不使用Oozie的情况下执行此操作。我已经编写了以下代码来实现它:-publicclassTfIdf{publicstaticvoidmain(Stringargs[])throwsIOException,InterruptedException,ClassNotFoundException{TfIdftfIdf=newTfIdf();tfIdf.runWordCount();tfIdf.runDocWordCount();tfIdf.TFIDFComputation();}publ

何在 Hadoop job class section java apache mapreduce

java - 无法从 oozie.action.conf.xml 检索属性

我正在尝试访问通过ooziejava操作配置设置的属性，但我没有得到我正在寻找的值，想知道我是否可以获得任何帮助？我的工作流程...........oozie.launcher.mapred.child.java.opts-Xmx4g-XX:MaxPermSize=256mload.typefull.............我正在尝试通过以下方式从我的代码中访问此属性oozieConfigFile=System.getProperty("oozie.action.conf.xml");finalFileInputStreaminputStream=newFileInputStream(

action oozie section gt lt java hadoop config

Shell 脚本不适用于使用 Hue 的 Oozie

我使用Hue在Oozie上运行Shell脚本，提交工作流作业时显示以下错误:Cannotrunprogram"FileManipulation.sh"(indirectory"/hadoop/mapred/local/taskTracker/root/jobcache/job_201503271756_0277/attempt_201503271756_0277_m_000000_0/work"):java.io.IOException:error=2,Nosuchfileordirectory可能是什么原因？最佳答案请检查包含

Shell Oozie section code FileManipulation hadoop hue

hadoop - 动态计算oozie参数(MR Action 的reducer数量)

在我的oozie工作流程中，我动态创建了一个配置单元表，比如T1。此配置单元操作之后是映射减少操作。我想将reducers属性(mapred.reduce.tasks)的数量设置为等于字段的不同值，比如(T1.group)。关于如何动态设置某些oozie参数的值以及如何从hive不同操作获取参数值到oozie参数的任何想法？最佳答案希望对您有所帮助:像您已经做的那样创建配置单元表。执行另一个Hive查询，计算列的不同值并将其写入hdfs中的文件。创建一个Shell操作，它将读取文件并以key=value的形式回显值。为shell

reducer hadoop code section 配置单 oozie

shell - OOzie Shell -Impala 操作 XML 错误

我正在尝试使用ozzie运行示例impala查询。运行shell时出现以下错误Error:E0701:E0701:XMLschemaerror,cvc-complex-type.2.3:Element'shell'cannothavecharacter[children],becausethetype'scontenttypeiselement-only.HDFS中的Workflow.xml ${jobTracker} ${nameNode}mapred.job.queue.na

Impala shell gt lt section hadoop oozie

hadoop - HiveContext 不适用于 Oozie

我试图使用HiveContext对象从我的spark代码运行一些配置单元查询。当我使用sparksubmit从命令行运行它时，它工作正常。但是，当我尝试从oozie工作流运行相同的内容时，出现以下异常。Userclassthrewexception:java.lang.RuntimeException:java.lang.RuntimeException:Unabletoinstantiateorg.apache.hadoop.hive.ql.metadata.SessionHiveMetaStoreClient 最佳答案如果使用

HiveContext hadoop section spark gt apache-spark hive oozie

hadoop - Oozie - 有没有办法在整个集群上只执行一个 java 操作实例？

当我查看我的日志时，我发现我的ooziejava操作实际上在多台机器上运行。我认为这是因为它们被包裹在m/r作业中？(这是正确的吗)有没有办法在整个集群上只执行一个java操作实例？最佳答案 Java操作在Oozie“启动器”作业中运行，只有一个YARN“映射”容器。诀窍在于每个YARN作业都需要一个应用程序主(AM)容器进行协调。所以你最终有2个容器，_0001用于AM和_0002用于Oozie操作，可能在不同的机器上。要控制每个资源的分配，您可以设置以下操作属性来覆盖您的/etc/hadoop/conf/*-site.xml配

hadoop Oozie code section strong hadoop-yarn

hadoop - 在附件的 oozie 电子邮件操作中根据日期传递变量

我正在使用oozie发送带附件的电子邮件。我正在这样做。Actionfailed,errormessage[${wf:errorMessage(wf:lastErrorNode())}]xxxxxxxxxxxxxxx@xxxxxjobsuccesstext/plain/user/XXXX/logs/2017-05-03/exec.log现在在/user/XXXX/logs/2017-05-03/exec.log附近的工作流程中日期总是在变。我如何传递变量，以便在调用工作流时发送特定日期的附件。editedquestion.我的shell脚本:#!/bin/bashTIMESTAMP=`

传递 hadoop 34 lt gt hdfs oozie oozie-coordinator

hadoop - oozie 在通过协调器提交作业时模拟了哪个用户

用户模拟/传播在oozie中如何工作？最佳答案检查UserPropogation来自Oozie文档。它说Whensubmittingaworkflowjob,theconfigurationmustcontainauser.nameproperty当您没有明确添加此属性时，它会分配给提交作业的用户。关于hadoop-oozie在通过协调器提交作业时模拟了哪个用户，我们在StackOverflow上找到一个类似的问题： https://stackoverf

协调器 hadoop section stackoverflow oozie oozie-coordinator

1 2 345 6 7