草庐IT

hadoop - 该示例如何在 Oozie 最佳情况下找到库?

根据Oozie的文档,我尝试在Oozie上运行一个map-reduce的例子。众所周知,'workflow.xml'(和'coordinator.xml')应该在HDFS中。然后输入命令:ooziejob-ooziehttp://localhost:11000/oozie-configexamples/apps/map-reduce/job.properties-run。而且我也知道“job.properties”应该在本地文件系统中。但有两件事让我感到困惑:1.为什么workflow.xml中的jar或class变量来自HDFS的lib目录?2.oozie-examples-4.3.

Hadoop 调度程序与 oozie

oozie和Hadoop调度程序(FIFO、Fair、Capacity、Delay等)之间有什么区别?哪一个通常用于生产环境? 最佳答案 它们提供不同的功能。Oozie是一个作业调度程序和编排引擎。它将在配置的队列中执行YARN作业。例如,mapreduce.job.queuename在MR/Java操作中,tez.queue.name在HiveAction中(在Tez上),或--queue在星火。您使用的队列取决于您拥有的工作负载,但Fair或Capacity最适合Multi-Tenancy工作负载。如果您有需要在其他作业之前运行

hadoop - oozie 历史日期协调员

我想为历史日期运行oozie协调器,并将日期作为参数传递给工作流中的脚本。我该怎么做?我可以将开始日期设为旧日期吗?它会catch吗?我应该添加什么频率。 最佳答案 是的,当您提交开始日期为过去的协调器时,它会catch。它会立即开始执行,因此设置concurrency=1可以使您的集群免于繁重的负载。如果你想先处理新文件,你也可以设置execution=LIFO。有关更多信息,请查看http://oozie.apache.org/docs/3.3.2/CoordinatorFunctionalSpec.html我正在发布来自How

Hadoop -copyFromLocal 找不到文件

我正在尝试通过oozieshell执行-copyFromLocal。hadoopfs-copyFromLocal'/usr/test/test1''/user/hue/oozie/workspaces/shell/'但是有时会报错log4j:ERRORCouldnotfindvalueforkeylog4j.appender.TLAlog4j:ERRORCouldnotinstantiateappendernamed"TLA".copyFromLocal:`/usr/test/test1':NosuchfileordirectoryFailingOozieLauncher,Maincl

hadoop - 为什么oozie需要数据库?

我已经在我的系统中安装了apacheoozieversion4.1.2..安装时,我使用以下命令为oozie创建了一个数据库。ooziedb.shcreate-sqlfileoozie.sql-run(linux)为什么oozie需要数据库?它会在数据库中存储什么? 最佳答案 Oozie将工作流/调度程序详细信息和其他信息存储在数据库中。可以从控制台访问正在运行的作业和早期作业的状态。 关于hadoop-为什么oozie需要数据库?,我们在StackOverflow上找到一个类似的问题:

java - 如何在不使用 OOzie 的情况下创建 Hadoop 作业链

我想创建一个由三个Hadoop作业组成的链,其中一个作业的输出作为输入提供给第二个作业,依此类推。我想在不使用Oozie的情况下执行此操作。我已经编写了以下代码来实现它:-publicclassTfIdf{publicstaticvoidmain(Stringargs[])throwsIOException,InterruptedException,ClassNotFoundException{TfIdftfIdf=newTfIdf();tfIdf.runWordCount();tfIdf.runDocWordCount();tfIdf.TFIDFComputation();}publ

Hadoop - Cloudera MRV1 集群规划 - 理想集群的最小节点数是多少,它看起来如何?

我手动安装了一个具有以下配置的三节点集群:Master/SlaveNode0-NameNode,SecondaryNameNode,JobTracker,HMaster,DataNode,TaskTracker,HRegionServer,HiveMetaStore,DatabaseforHive/Sqoop,HiveServer2,HCatalog,OozieServer,Zookeeper,Oozie-client,Hive-client,pig-client,M/Rclienttools,SqoopSlaveNode1-DataNode,TaskTracker,HRegionSe

java - 无法从 oozie.action.conf.xml 检索属性

我正在尝试访问通过ooziejava操作配置设置的属性,但我没有得到我正在寻找的值,想知道我是否可以获得任何帮助?我的工作流程...........oozie.launcher.mapred.child.java.opts-Xmx4g-XX:MaxPermSize=256mload.typefull.............我正在尝试通过以下方式从我的代码中访问此属性oozieConfigFile=System.getProperty("oozie.action.conf.xml");finalFileInputStreaminputStream=newFileInputStream(

Shell 脚本不适用于使用 Hue 的 Oozie

我使用Hue在Oozie上运行Shell脚本,提交工作流作业时显示以下错误:Cannotrunprogram"FileManipulation.sh"(indirectory"/hadoop/mapred/local/taskTracker/root/jobcache/job_201503271756_0277/attempt_201503271756_0277_m_000000_0/work"):java.io.IOException:error=2,Nosuchfileordirectory可能是什么原因? 最佳答案 请检查包含

hadoop - 动态计算oozie参数(MR Action 的reducer数量)

在我的oozie工作流程中,我动态创建了一个配置单元表,比如T1。此配置单元操作之后是映射减少操作。我想将reducers属性(mapred.reduce.tasks)的数量设置为等于字段的不同值,比如(T1.group)。关于如何动态设置某些oozie参数的值以及如何从hive不同操作获取参数值到oozie参数的任何想法? 最佳答案 希望对您有所帮助:像您已经做的那样创建配置单元表。执行另一个Hive查询,计算列的不同值并将其写入hdfs中的文件。创建一个Shell操作,它将读取文件并以key=value的形式回显值。为shell