草庐IT

Start-Job

全部标签

java - Hadoop 的命令 start-dfs.sh 显示一个奇怪的错误

当我尝试运行下面的命令时,弹出一个错误Alis-Mac:hadoop-2.7.3naziaimran$sbin/start-dfs.sh错误如下,2018-06-0501:04:31.424java[1879:21215]UnabletoloadrealminfofromSCDynamicStore18/06/0501:04:31WARNutil.NativeCodeLoader:Unabletoloadnative-hadooplibraryforyourplatform...usingbuiltin-javaclasseswhereapplicableStartingnamenod

java - hadoop 使用类名提交作业,为什么需要 job.setJarByClass()?

例如我有一个hadoop字数统计程序(来自互联网),字数统计.java:publicstaticclassWordCount{publicstaticvoidmain(String[]args)throwsException{....Jobjob=Job.getInstance(newConfiguration(),"wordcount");job.setJarByClass(WordCount.class);//Why?}}像这样将它编译成一个jar并提交给yarn:hadoopjarwordcount.jarWordCount[input-hdfs][output-hdfs]在这个

java - 在集群中启动 MapReduce 作业失败,退出代码为 : -1000 and job. jar 不存在

我正在尝试在Java代码中启动mapreduce作业并将作业提交给yarn。但出现以下错误:2018-08-2600:46:26,075WARN[main]util.NativeCodeLoader(NativeCodeLoader.java:(62))-Unabletoloadnative-hadooplibraryforyourplatform...usingbuiltin-javaclasseswhereapplicable2018-08-2600:46:27,526INFO[main]client.RMProxy(RMProxy.java:createRMProxy(92))-

java - Hadoop Map/Reduce WARN mapred.LocalJobRunner : job_local_0001 java. io.EOFException?

在Eclipse6.91中运行Hadoop0.20.2M/R应用。我在执行后收到这些错误和警告:13/07/2416:52:52INFOjvm.JvmMetrics:InitializingJVMMetricswithprocessName=JobTracker,sessionId=13/07/2416:52:52WARNmapred.JobClient:UseGenericOptionsParserforparsingthearguments.ApplicationsshouldimplementToolforthesame.13/07/2416:52:52WARNmapred.Jo

hadoop - 作业跟踪器和名称节点不以 start-all.sh 开头

我正在尝试安装hadoop单节点,但它无法正常工作。当我执行start-all.shnamenode和jobtracker时,不要启动。您是否在我的文件中看到什么可能是错误的,所以我得到了这个结果?hadoopjps命令的结果:14878日元14823任务追踪器14605二级名称节点14456数据节点start-all.sh命令的结果:admin@vm-sgd10:/usr/local$start-all.shstartingnamenode,loggingto/usr/local/hadoop/libexec/../logs/hadoop-admin-namenode-vm-10.v

macos - Hadoop: start-dfs/start-yarn.sh: 没有那个文件或目录

尽管我检查了两个文件都存在于目录中并且hadoop可以访问这些文件夹,但它还是给了我上述两个错误。我使用以下教程安装了hadoop:link出了什么问题,如何解决? 最佳答案 您可能没有导出此目录的路径。尝试提供/entirepath/start-dfs.sh。同样在您的.bash_rc文件中添加HADOOP_HOME=/Pathtohadoopinstallationfolder。使用命令source.bash_rc获取bash_rc文件。 关于macos-Hadoop:start-d

java - hadoop job -kill <ID> 无法杀死

我使用的是1.0.4版。有些工作一直挂起,所以我一直试图杀死这些工作以释放源...但是,killing命令似乎不起作用...这是我正在做的:hadoopjob-listJobIdStateStartTimeUserNamePrioritySchedulingInfojob_111473112865969xyzNORMALNAhadoopjob-killjob_1Killedjobjob_2在此之后,我再次运行list命令,被杀死的作业仍然存在:hadoopjob-listJobIdStateStartTimeUserNamePrioritySchedulingInfojob_11147

hadoop - Apache kylin cube 失败 "no counters for job"

使用kylin1.5.4,当我构建立方体时,它在第3步失败,日志显示“没有工作计数器”。它也没有获取配置单元表的基数。当我创建一个模型或多维数据集时,它会抛出无法采取行动的错误,但是当我关闭json页面时,它们就会被创建。它不获取日期分区列,抛出在日志中找不到的列。非常感谢任何帮助或见解。 最佳答案 这有点晚了,但我在当前项目中也遇到了这个问题,我得到了“没有工作计数器”错误。问题是我们在Hive中使用ORC表。我们只是将数据从ORC表移至新的TEXTFILE表,并使用新表在Kylin多维数据集中设置所有内容,一切正常。

java - 在 java 代码中设置 job.properties 文件以启动 oozie 操作

我正在尝试使用Java代码启动oozie操作。使用命令行时,我们通过“-configjob.properties”指定属性文件,它知道选择哪个工作流程。我们如何在java代码中定义“job.properties”文件来完成相同的任务?conf.setProperty(OozieClient.APP_PATH,"hdfs://clusterdb05.com:8020/user/apps/merge-logs/workflow.xml");conf.setProperty("jobTracker","jobtracker.com:8021");conf.setProperty("nameN

java - Hadoop Job 在最后几个百分比时真的很慢吗?

我一直在Hadoop集群版本0.20.2上运行作业,直到最近一切都正常,没有任何原因,也没有任何错误,maptask的最后几个百分比比作业的其余部分花费的时间长得多,其中最后2%需要30秒,其余工作不到30秒。无论输入大小如何,现在所有作业都会发生这种情况这是一个输入数据为4GB的示例,在此问题之前整个作业从提交到完成需要37秒,但现在需要一分钟多:14/08/0120:57:12INFOinput.FileInputFormat:Totalinputpathstoprocess:114/08/0120:57:12INFOmapred.JobClient:Runningjob:job_