草庐IT

job_local

全部标签

hadoop - 提交拓扑后命令状态停止 "Creating job WordCountTopology"

我尝试使用ApacheMesos、ApacheAurora、ZooKeeper和HDFS构建Heron集群。但是,当我在完成后提交WordCountTopology时,命令输出如下:停止“创建作业WordCountTopology”。yitian@ubuntu:~/.heron/conf/aurora$heronsubmitaurora/yitian/devel--config-path~/.heron/conf~/.heron/examples/heron-api-examples.jarcom.twitter.heron.examples.api.WordCountTopology

macos - 错误:/usr/local/Cellar/sqoop/1. 4.6/../hadoop不存在!请将 $HADOOP_COMMON_HOME 设置为 Hadoop 安装的根目录

我在Mac上使用brew安装了Hadoop,然后进行了配置。然后我安装了Sqoop,当我尝试运行Sqoop时出现以下错误:错误:/usr/local/Cellar/sqoop/1.4.6/../hadoop不存在!请将$HADOOP_COMMON_HOME设置为Hadoop安装的根目录。我的Hadoop运行良好,我什至在~/.bash_profile和sqoop-env.sh中都设置了HADOOP_COMMON_HOME的路径这是我的sqoop环境文件:#LicensedtotheApacheSoftwareFoundation(ASF)underoneormore#contribut

hadoop - 运行hadoop example,遇到 ".staging/job_1541144755485_0002/job.splitmetainfo does not exist",怎么办?

我的配置如下:Hadoop实验我用了两台机器,分别是pc720(10.10.1.1)和pc719(10.10.1.2)。jdk(版本1.8.0_181)由apt-get安装。Hadoop2.7.1下载自https://archive.apache.org/dist/hadoop/common/hadoop-2.7.1/,并放入/opt/第一步:我配置了/etc/bash.bashrc,添加了exportJAVA_HOME=/usr/lib/jvm/java-8-openjdk-amd64exportPATH=${JAVA_HOME}/bin:${PATH}exportHADOOP_HO

apache-spark - 亚马逊电子病历 : Spark - SparkException java IOException: Failed to create local dir in/tmp/blockmgr*

我有一个带有Spark的AWSEMR集群。我可以连接到它(spark):通过SSH连接到主节点后从主节点来自另一个AWSEMR集群但无法连接到它:从我的本地机器(macOSMojave)来自非emr机器,如Metabase和Redash我已阅读thisquestion的答案.我已经检查过所有节点上的文件夹权限和磁盘空间都没有问题。我的假设是我面临着类似的问题JamesWierzba在评论中提问。但是,我没有足够的声誉在那里添加评论。此外,考虑到它特定于AWSEMR,这可能是一个不同的问题。SSH连接到主节点后连接工作正常。#SSHedtomasternode$ssh-i~/identi

ubuntu - 安装hadoop时如何修复 "Error: Could not find or load main class ” -Djava.library.path=.usr.local.hadoop.lib”

我正在尝试在Ubuntu上安装Hadoop2.9.2。我在~/.bashrc和env.sh文件中设置了相同的JAVA_HOME路径。在hadoop_store下使用正确的路径为数据节点和名称节点创建了两个单独的目录。Java版本是“java-11-openjdk-amd64”。在hadoop文件系统中格式化namenode时,我仍然面临错误。请帮助我解决它。指向我一直遵循其说明的页面的链接。https://www.digitalvidya.com/blog/install-hadoop-on-ubuntu-and-run-your-first-mapreduce-program/这是错

amazon-web-services - 如何计算映射器/缩减器的数量,以最大限度地提高在亚马逊云上运行的 mahout Recommender Job 的性能?

根据AmazonElasticMapReduce上使用/可用的实例,计算要使用的正确hadoop映射器和缩减器数量的最佳方法是什么?(使用mahout-core-0.7发行版的RecommenderJob) 最佳答案 通用的Hadoop答案适用:让Hadoop选择映射器的数量将reducer的数量设置为等于集群中reduce插槽的数量对于EMR,查看在您使用的实例类型上默认运行的reducer数量:http://docs.aws.amazon.com/ElasticMapReduce/latest/DeveloperGuide/Ha

hadoop - 如何在 HBase 上配置 map reduce jobs

我有一个在HBase表上运行的mapreduce作业。它在应用一些扫描过滤器并进行一些处理后扫描Hbase表。这项工作花费了很长时间,绝对比预期的要长得多,并且感觉性能下降是指数级的(即,前90%的完成速度比其余的快得多,大约98%(映射器完成)之后,看起来像像电影开始时的hell边缘一样陷入永恒。从高层来看,这种不均衡的性能应该没有任何理由,因为扫描中的每一行都应该有类似的行为,并且下游服务应该在HBase表的每一行都有类似的SLA。如何调试和分析此作业?是否有任何可用的工具可以帮助我对系统进行计量并查明行为异常的组件? 最佳答案

hadoop - 级联 2.0.0 作业在 hadoop FileNotFoundException job.split 上失败

当我在更大的数据集上运行我的作业时,许多映射器/缩减器失败导致整个作业崩溃。这是我在许多映射器上看到的错误:java.io.FileNotFoundException:Filedoesnotexist:/mnt/var/lib/hadoop/tmp/mapred/staging/hadoop/.staging/job_201405050818_0001/job.splitatorg.apache.hadoop.hdfs.DFSClient$DFSInputStream.openInfo(DFSClient.java:1933)atorg.apache.hadoop.hdfs.DFSCl

hadoop - Pig local 与 mapreduce 模式性能比较

我已经使用Cloudera管理器CDH4设置了一个3节点Hadoop集群。当在mapreduce模式下运行Pig作业时,对于相同的数据集,它花费的时间是本地模式的两倍。这是预期的行为吗?另外,是否有任何文档可用于mapreduce作业的性能调整选项?非常感谢您的帮助! 最佳答案 这可能是因为您使用的是玩具数据集,并且mapreduce的开销大于并行化的好处 关于hadoop-Piglocal与mapreduce模式性能比较,我们在StackOverflow上找到一个类似的问题:

hadoop - 亚马逊弹性 map 减少 : Job flow fails because output file is not yet generated

我有一个执行三项任务的AmazonEMR作业流程,第一项的输出是后续两项的输入。第二个任务的输出被第三个任务DistributedCache使用。我已经完全在EMR网站(控制台)上创建了作业流,但集群立即失败,因为它找不到分布式缓存文件-因为它尚未在步骤#1中创建。我唯一的选择是通过boostrap操作从CLI创建这些步骤,并指定--wait-for-steps选项吗?我无法执行一个任务的输入依赖于另一个任务的输出的多步骤作业流,这似乎很奇怪。 最佳答案 最后,我通过创建一个自举但没有任何步骤的AmazonEMR集群解决了这个问题。