touch-action_草庐IT

hadoop - Oozie Hive Action 挂起，心跳永远

我正在尝试通过我在Hue中创建的Oozie工作流来运行Hive操作，但是操作“心跳”永远不会执行HiveSQL。我读过其他关于永远心跳的文章，但这篇文章似乎发生在不同的时间点，在SQL语句被解析之后。我检查了集群中每个节点的内存，并验证了任务计数参数是否合理。这是hive-config.xml文件:javax.jdo.option.ConnectionURLjdbc:hive://10.1.10.250:10000/testdbJDBCconnectstringjavax.jdo.option.ConnectionDriverNameorg.apache.hadoop.hive.jdb

hadoop - map-reduce 中不同组件/ Action 的执行顺序

map-reduce中Action/组件的执行顺序是什么-Mapper-->Combiner-->Shuffling/Sorting-->Partitioner-->Reducer顺序一样吗？？最佳答案这个过程几乎是正确的，但让我们深入了解它。第一个Map阶段将从运行map开始。一旦map处理了输入，它会在保存到本地文件系统之前进行排序，这被称为sort然后copy到本地文件系统，接下来这个数据将被复制到reducer这是shuffle阶段。由于数据已经在每个mapper输出中排序，它根据每个到达reducer所在节点的键执

map-reduce hadoop code section reducer mapreduce

hadoop - 在重新启 Action 业跟踪器之前，我们是否需要将名称节点置于安全模式？

我有一个Hadoop集群运行Cloudera的CDH3，ApacheHadoop的0.20.2等价物。我想重新启动工作跟踪器，因为有些工作没有被杀死。我尝试从命令行杀死它们，命令成功执行，但作业仍处于JobCleanup:Pending状态。无论如何，我想重新启动job-tracker并查看是否清理了作业。我知道重新启Action业跟踪器的命令，但我不确定在重新启Action业跟踪器之前是否需要将name-node置于安全模式。最佳答案您可以尝试使用hadoopjob-kill终止不需要的作业并检查命令状态echo"$?".如果

跟踪器置于 code section hadoop namenode

java - 为什么java action System.out 在Oozie 中执行时消失了？

我正在使用oozie环境。成功完成作业后，我无法在oozie日志中找到System.out.println输出。我用谷歌搜索了好几个小时，然后找到了this但没有结果。从oozieweb控制台我得到了作业ID“0000011-180801114827014-oozie-oozi-W”，然后我尝试使用以下命令获取有关该作业的更多信息:ooziejob-ooziehttp://localhost:11000/oozie/-info0000011-180801114827014-oozie-oozi-W然后我从JobCompleted"16546"操作中获取externalId，我认为作业I

行时 java strong oozie section hadoop logging hadoop-yarn

hadoop - 为什么 oozie 向 yarn 提交 shell Action ？

我最近在学习oozie。我对shell的Action有点好奇。我正在执行包含类似shell命令的shell操作hadoopjar在运行此操作时，有两个yarn作业在运行，它们是一个用于hadoop作业一个用于shell操作我不明白为什么shellAction需要yarn来执行。我也试过电子邮件操作。它在没有yarn资源的情况下执行。最佳答案要回答这个问题，区别在于独立运行shell脚本(.sh文件或从CLI)作为oozie工作流程的一部分运行shell操作。(oozieshell操作中的shell脚本)第一种情况很明显。在第二种

hadoop Action shell section oozie scheduler hadoop-yarn hadoop2

hadoop - 传递 JVM 选项以指向 Oozie Workflow 中 Pig Action 中的 log4j.properties 文件

在我的Oozie工作流程中，有一个pigAction。运行时，它正在CDH中寻找log4j.properties文件，因为我没有在我的jars中提供该文件。现在，我有了log4j.properties文件，我只需要将它作为Pig操作中的JVM选项传递即可。有什么办法吗？最佳答案无法将自定义log4j属性文件传递给Oozie工作流中的Pig操作。PigMain.java文件不允许将以下参数作为参数传递。static{DISALLOWED_PIG_OPTIONS.add("-4");DISALLOWED_PIG_OPTIONS.ad

properties Workflow DISALLOWED_PIG_OPTIONS DISALLOWED OPTIONS hadoop log4j apache-pig oozie

python - 在 Hadoop 上使用 mrjob 启 Action 业时出错

我是hadoop和mrjob的新手，这本书对我的学习帮助很大。我试图在hadoop上运行mrSVM.py，因为它在本地运行良好。但我运行了以下命令:pythonmrSVM.py-rhadoopkickStart.txt并给出以下错误:noconfigsfound;fallingbackonauto-configurationnoconfigsfound;fallingbackonauto-configurationcreatingtmpdirectory/tmp/mrSVM.manvendra.20140818.075925.908574writingwrapperscriptto/t

时出 python manvendra gt lt python-2.7 hadoop mrjob

hadoop - Oozie Launcher 失败，主类 [org.apache.oozie.action.hadoop.MapReduceMain]，main() 抛出异常，未在 JobConf 中设置输出目录

我正在尝试在hue中执行mapreduce作业。我收到以下错误:FailingOozieLauncher,Mainclass[org.apache.oozie.action.hadoop.MapReduceMain],main()threwexception,OutputdirectorynotsetinJobConf.org.apache.hadoop.mapred.InvalidJobConfException:OutputdirectorynotsetinJobConf.atorg.apache.hadoop.mapred.FileOutputFormat.checkOutput

中设 hadoop apache java

hadoop - 如何使用 oozie.launcher.action.main.class 将参数传递给 Oozie 操作？

Oozie有一个名为oozie.launcher.action.main.class的配置属性，您可以在其中为map-reduce操作(或shell操作)传入“主类”的名称，如下所示:oozie.launcher.action.main.classcom.company.MyCascadingClass但是我需要将参数传递给我的主类，但找不到实现它的方法。有什么想法吗？我问这个问题是因为我正尝试从Oozie中启动一个级联类/流，但到目前为止我尝试过的所有选项都失败了。如果有人从Oozie获得了Cascading功能，请告诉我，我会发布另一个问题来特别询问这个问题。

launcher 传递 gt lt section hadoop oozie cascading

hadoop - 是否值得购买 Mahout in Action 以跟上 Mahout 的速度，或者是否有其他更好的来源？

我目前是ApacheMahout的一个非常随意的用户，我正在考虑购买这本书MahoutinAction.不幸的是，我真的很难了解这本书的值(value)——并且看到它是ManningEarlyAccessProgram书(因此目前仅作为测试版电子书提供)，我无法亲自去书店看书。任何人都可以推荐这个作为快速了解Mahout和/或可以补充Mahout网站的其他来源的好(或不太好)指南吗？最佳答案作为Mahout的提交者和本书的合著者，我认为这是值得的。;-)但是说真的，你在做什么？也许我们可以为您指出一些资源。Mahout的某些方面

Mahout 跟上 section noreferrer hadoop