草庐IT

oozie-setup

全部标签

Hadoop 2.6.0 官方实例 : Yarn (MR2) much slower than Map Reduce (MR1) in single node setup

我开始玩hadoop2.6.0,根据officialdocumentation搭建了一个伪分布式单节点系统.当我运行简单的MapReduce(MR1)示例(参见“伪分布式操作->执行”)时,总执行时间约为7秒。更准确地说,bash的时间给出:real0m6.769suser0m7.375ssys0m0.400s当我通过Yarn(MR2)运行相同的示例时(参见“伪分布式操作->YARNonSingleNode”),总执行时间约为100sec,因此非常慢。bash的时间给出:real1m38.422suser0m4.798ssys0m0.319s因此,(出于某种原因)在用户空间之外存在大量

hadoop - pig udf中是否有类似setup的功能

我想为一个文件添加mapDB,供pigUDF中的所有映射器使用。我怎样才能一次性设置这个mapDB对象?我们有没有在实例化pigudf时只调用一次的函数?谢谢。 最佳答案 在pig中,必须扩展EVALFUNC才能为记录的每一行调用udf。扩展了evalfunc的类可以通过在pig-script的开头定义来实例化。定义ex_argmy.udfs.Extract('true');这会导致类的实例化。 关于hadoop-pigudf中是否有类似setup的功能,我们在StackOverflow

hadoop - 运行 Oozie 作业

我正在尝试配置Oozie以在我的hadoop-2.7.1集群上工作。一切似乎都运行良好,YARN、Hue、MapReduce和Spark。通过yarnjar...命令发送的作业正确完成,但通过CLIooziejob...-run或Hue发送一些带有oozie的作业,作业是停留在33%,节点日志显示:2015-11-0606:08:56,121INFO[main]org.apache.hadoop.yarn.client.RMProxy:ConnectingtoResourceManageratlocalhost/127.0.0.1:180302015-11-0606:08:57,165

hadoop - 使用 oozie 在 S3 中移动文件

我想使用AWSoozie在S3中移动文件。我要运行awss3mvs3://temp/*.zips3://temp/processed_files/.--recursive我如何在oozie中执行此操作?编辑12015-11-1210:18:55,758WARNShellActionExecutor:542-USER[hadoop]GROUP[-]TOKEN[]APP[rad_workflow]JOB[0000118-151029144311676-oozie-oozi-W]ACTION[0000118-151029144311676-oozie-oozi-W@sh]Launcherex

Java MapReduce 计数器 - Oozie

Java应用程序在Hadoop集群中作为具有单个Mapper任务的map-reduce作业执行。如果一个javamapreduce作业(不是hive或任何其他作业只是一个直接的mapreduce作业)是oozie的一部分,我们会得到一个单独的mapper启动器并且实际的mapreduce作业独立运行。那么有没有办法将启动器和实际的mapreduce作业运行联系起来?像获取与启动器jobid一起运行的实际操作的jobid?任何命令知道吗? 最佳答案 您可以转到oozieUI并获取此信息。单击您想要的操作,然后转到ChildJobURL

hadoop - 启动器错误,原因 : Main class [org. apache.oozie.action.hadoop.HiveMain],退出代码 [12]

在oozie中运行配置单元操作时出现以下错误:015-12-2019:48:40,368WARNHiveActionExecutor:523-SERVER[sandbox.hortonworks.com]USER[root]GROUP[-]TOKEN[]APP[oozie_hive_root]JOB[0000013-151220142557945-oozie-oozi-W]ACTION[0000013-151220142557945-oozie-oozi-W@oozie_hive_root]LauncherERROR,reason:Mainclass[org.apache.oozie.

hadoop - 无法启用 oozie web 控制台

我在RHEL7.2上使用CDH5.7。我点击了以下链接Ooziewebconsole.将ext-2.2复制到/var/lib/oozie后,我将权限更改为755。然后我重新启动了oozie。但它仍然显示OozieWeb控制台已禁用 最佳答案 我找到了答案下载ext-2.2提取并移动到/var/lib/oozie将所有者更改为oozie并应用权限755然后重启oozie 关于hadoop-无法启用oozieweb控制台,我们在StackOverflow上找到一个类似的问题:

hadoop - 在 hdfs 中创建 Oozie sharelib。(Root 无法模拟 root)

我正在关注http://hadooptutorial.info/apache-oozie-installation-on-ubuntu-14-04/用于使用hadoop2.7.2安装oozie4.1.0构建成功,我可以通过发出这个命令来创建ooziewarhduser@master:~/oozie/oozie-bin$sudobin/oozie-setup.shprepare-war在/home/hduser/oozie/oozie-bin/oozie-server/webapps/oozie.war添加了“ExtJS库,JAR”的新OozieWAR文件信息:Oozie已准备好启动但是

scala - 使用 Oozie 将 Spark 转为 Hbase

我试图从Spark在Hbase中创建一个表并插入数据,从中读取数据。当我从命令行运行spark作业时它工作正常。但是,每次我尝试使用oozie运行它时,它都会抛出不同类型的异常。这是我的sparkhbase代码valsc=newSparkContext("local","Hbasespark")valtableName="Morbidity_Dummy2"valconf=HBaseConfiguration.create()//AddlocalHBaseconfconf.addResource(newPath("file:///opt/cloudera/....../hbase-sit

Bitbucket Pipelines Android Build Setup失败

挣扎了几个小时后,我能够设置我的Docker容器。我的YML文件如下:image:mingc/android-build-box:latestpipelines:default:-step:script:#GrabtheAndroidSupportRepowhichisn'tincludedinthecontainer-echoy|androidupdatesdk--filter"extra-android-m2repository"--no-ui-a#Acceptpreviewlicences-echo-e"\n84831b9409646a918e30573bab4c9c91346d8abd