ecs-cli

amazon-ec2 - 在 Amazon ec2 : multi node cluster 上运行 hadoop 作业

我必须在AmazonEC2集群上运行hadoopmapreduce作业。我尝试使用现有的AMI进行设置。但是在启动master和clients之后，“jps”没有列出任何节点。那么，即使在使用公共(public)hadoopAMI之后，我们还必须为主服务器和从服务器设置hadoop吗？master怎么知道slave的IP地址？？谁能告诉我一些好的文档。我现在已经为此苦苦思索了12个多小时。有人可以帮忙吗？谢谢。最佳答案 Matthew建议的另一种替代方法是使用Whirr。Whirr让在Amazon上部署Hadoop集群变得非常容易

hadoop - 亚马逊 EC2 和 S3 : How to read and write data

我刚刚遵循了本指南:http://rogueleaderr.tumblr.com/post/32768181371/set-up-and-run-a-fully-distributed-hadoop-hbase-cluster在运行hadoop和hbase的AmazonEC2上设置集群。我现在想知道的是，我实际上如何在我的集群上运行的hbase中获取我的数据？我需要将它加载到S3中然后加载到我的hbase集群中吗？是否有加载/提取数据的最佳实践？由于我是EC2的新手，因此我将不胜感激。最佳答案您需要通过SSH连接到您的一个节点，

hadoop write section hbase amazon-s3 amazon-ec2

java - 具有 420GB 实例存储的 ec2 实例中的 Hadoop "Spill Failed"异常

我正在使用Hadoop2.3.0并将其作为单节点集群(伪分布式模式)安装在CentOS6.4Amazonec2实例上，实例存储为420GB和7.5GBRAM，我的理解是“溢出失败”仅当节点用完磁盘空间时才会发生异常，但是，在仅短时间运行map/reduce任务后(没有接近420GB的数据)我得到以下异常。我想提一下，我将同一节点上的Hadoop安装从8GB的EBS卷(我最初安装它的地方)移动到同一节点上的420GB实例存储卷，并更改了$HADOOP_HOME环境变量和其他属性相应地指向实例存储卷，Hadoop2.3.0现在完全包含在420GB驱动器中。但是我仍然看到以下异常，请问除

amp Failed hadoop apache MapTask java amazon-ec2 hadoop-yarn

hadoop - 如何在配置单元 cli/beeline 中将 textinputformat.record.delimiter 重置为其默认值？

将textinputformat.record.delimiter设置为非默认值，对于加载多行文本很有用，如下面的演示所示。但是，我无法在不退出cli并重新打开它的情况下将此参数设置回其默认值。以下选项均无效(其他一些试验也无效)settextinputformat.record.delimiter='\n';settextinputformat.record.delimiter='\r';settextinputformat.record.delimiter='\r\n';settextinputformat.record.delimiter='';reset;有什么想法吗？谢谢演示

配置单 textinputformat 39 code hadoop mapreduce hive hiveql

java - Hadoop NoSuchMethodError apache.commons.cli

我正在使用hadoop-2.7.2，我用IntelliJ做了一个MapReduceJob。在我的工作中，我正在使用apache.commons.cli-1.3.1并将lib放入jar中。当我在我的Hadoop集群上使用MapReduceJob时，我有一个NoSuchMethodError:Exceptioninthread"main"java.lang.NoSuchMethodError:org.apache.commons.cli.Option.builder(Ljava/lang/String;)Lorg/apache/commons/cli/Option$Builder;我不明白

NoSuchMethodError commons code section java hadoop apache-commons-cli

hadoop - AWS 上的 EMR 与 EC2/Hadoop

我知道EC2比EMR更灵活，但工作量更大。然而，就成本而言，如果使用EC2，它可能需要将EBS卷附加到EC2实例，而AWS只是从S3流式传输数据。因此，在AWS计算器上计算数字，即使对于EMR，也必须为EC2付费，EMR变得比EC2便宜了？？我在这里错了吗？当然，带有EBS的EC2可能更快，但它值得付出代价吗？谢谢，马特最佳答案 EMR可以为您做很多在EC2上的标准Hadoop上做不到的事情。一些特别重要的包括将Hadoop日志从您的机器复制到S3。这对于集群关闭后调试错误非常有用。运行多个MapReduce、Pig或Hive作业

hadoop section EC2 amazon-web-services amazon-ec2 emr

java - 如何使用亚马逊的 EMR 在 CLI 中使用自定义 jar 指定 mapred 配置和 java 选项？

我想知道如何在使用自定义jar运行流作业时指定mapreduce配置，例如mapred.task.timeout、mapred.min.split.size等。当我们使用外部脚本语言如ruby或python运行时，我们可以使用以下方式来指定这些配置:rubyelastic-mapreduce-j--stream--step-name"mystream"--jobconfmapred.task.timeout=0--jobconfmapred.min.split.size=52880--mappers3://somepath/mapper.rb--reducers3:somepath

自定 java somepath bootstrap hadoop mapreduce elastic-map-reduce emr

amazon-s3 - 使用 Amazon EC2/S3 将本地数据复制到 Hadoop 集群上的 HDFS 时出现问题

我在AmazonEC2上设置了一个包含5个节点的Hadoop集群。现在，当我登录到主节点并提交以下命令时bin/hadoopjar.jar它抛出以下错误(不同时)。第一个错误是在我没有用“%2F”替换斜杠时抛出的，第二个是在我用“%2F”替换斜杠时抛出的:1)Java.lang.IllegalArgumentException:InvalidhostnameinURIS3://:@/2)org.apache.hadoop.fs.S3.S3Exception:org.jets3t.service.S3ServiceException:S3PUTfailedfor'/'XMLErrorMe

时出 amazon-s code gt lt amazon-s3 amazon-ec2 hadoop cloud hdfs

hadoop - 使用 spark-ec2 更改 hadoop 版本

我想知道在spark-ec2创建集群的时候是否可以更改hadoop版本？我试过了spark-ec2-kspark-i~/.ssh/spark.pem-s1launchmy-spark-cluster然后我登录spark-ec2-kspark-i~/.ssh/spark.pemloginmy-spark-cluster发现hadoop版本是1.0.4。我想使用2.x版本的hadoop，最好的配置方法是什么？最佳答案 Hadoop2.0spark-ec2脚本不支持修改现有集群，但您可以使用Hadoop2创建一个新的Spark集群。请参

hadoop spark-ec spark strong amazon-ec2 apache-spark spark-ec2

hadoop - EC2 上 Hadoop 中的 BindException

我正在尝试在EC2实例上设置Hadoop集群(CDH4)。当我尝试格式化名称节点时，名称节点不断崩溃。这是我得到的错误。2013-04-1205:37:16,995FATALorg.apache.hadoop.hdfs.server.namenode.NameNode:Exceptioninnamenodejoinjava.net.BindException:Problembindingto[head.node.iec.project:8020]java.net.BindException:Cannotassignrequestedaddress;Formoredetailssee:h

BindException hadoop apache NameNode amazon-ec2 hdfs cloudera

139 140 141142143 144 145