EC2-classic

hadoop - 自动缩放 EMR - 是否需要？我应该只使用 EC2 吗？我应该只使用 Qubole 吗？

为了减少配置时间，我们决定保留一个包含5个实例的专用EMR集群(我们预计大约需要5个)。如果我们需要更多，我们认为我们需要实现某种自动缩放。我对EMR一点都不熟悉-它支持自动缩放吗？我在文档中找到了这个:http://docs.aws.amazon.com/ElasticMapReduce/latest/DeveloperGuide/emr-manage-resize.html这是查找自动缩放的正确位置还是我误解了“调整大小”的含义。我读过EMR的一个好处是“按需处理”，我认为它在ec2实例之间分配负载而无需指定实例数量，所以这给我的印象是它自己进行ec2实例的扩展，这意味着我们不需要

networking - 亚马逊 EC2 - 网络问题

我们正在amazonec2上启动hadoop集群，最近我们遇到网络问题，例如master无法连接到slave。我们认为原因是亚马逊限制了网络连接。因此，我们尝试在每个从节点的随机延迟后建立连接。但是，这没有帮助。还有其他建议吗？谢谢巴拉最佳答案您是否尝试过使用cloudera的hadoop-ec2脚本？我一直在使用它们为我的论文研究设置偶尔的hadoop集群，我发现它们工作得很好。设置需要几分钟时间，但设置完成后您就可以了hadoop-ec2launch-cluster它会设置您需要的所有东西，而且通常做得非常好。有时，节点无法

networking EC2 section hadoop code amazon-web-services amazon-ec2

ubuntu - Hadoop - EC2 ubuntu 上的环境设置

我在AmazonEC2(ubuntu)上配置hadoop2.7.1，所有TCP端口(0~65535)都打开。我的节点结构是nameNode,resourceManager,dataNode01,dataNode02，和每个都有一个EC2。此外，我使SSH连接成为可能，无需key对或密码。如果我输入sbin/start-all.sh在nameNode,然后SecondaryNameNode,NameNode创建于nameNode,NodeManager创建于resourceManager,dataNode01,dataNode02.(注意:ResourceManager不是在resour

ubuntu Hadoop code gt lt amazon-ec2

亚马逊EC2服务器链接方式

亚马逊EC2服务器（linux、centos系统）使用Xshell链接工具进行链接登陆用户名（ec2-user）、使用PublicKey登录方式，选择创建实例时用的密钥对文件登录成功后可使用 (sudo-s)命令切换至 Root账户，进行操作只有切换为root账户后，方可安装宝塔面板等使用PHPstorm链接亚马逊服务器使用非root账号登录（只读）默认使用ec2-user登录，选择Keypair方式检验登录使用root账号登录（可读可写）先设置root账号（参考AWSEC2启动Centos实例以及设置root密码登录_hhhzua的专栏-CSDN博客_awscentosroot密码一、在

EC2 EC strong xff xff0c 服务器运维云计算

amazon-web-services - 具有重叠 EC2 实例的集群

我有以下具有重叠EC2实例的集群，例如:Yarn集群和Memcached集群使用相同的实例2、3、4；此外，每个实例都有不同的RAM、CPU、内核大小，这会不会有潜在的类(class)问题？还是集群自己做平衡？谢谢!Spark集群:EC2实例2、3、5Yarn集群:EC2实例1、2、3、4、5Memcached数据库集群:EC2实例2、3、4、6instance1:512GBRAM,2vCPU,2coresinstance2:1TBRAM,8vCPU,4coresinstance3:2TBRAM,6vCPU,6coresinstance4:256GBRAM,2vCPU,2coresin

amazon-web-services services strong section instance hadoop apache-spark amazon-ec2 hadoop-yarn

hadoop - CDH WebHDFS 请求重定向到 EC2 上的本地地址

我正在尝试设置一个环境，在其中我在本地运行我的一些后端，并从我的本地计算机向EC2实例发送请求。我有CDH4.5安装程序，它工作正常。当我运行以下请求时curl--negotiate-i-L-u:hdfshttp://ec2-xx-xx-xx-xx.eu-west-1.compute.amazonaws.com:50070/webhdfs/v1/tmp/test.txt?op=OPEN这适用于该区域中的任何EC2实例，但在该区域之外不起作用。如果我在本地尝试，它会返回以下错误curl:(6)Couldnotresolvehost:ip-xx-xx-xx-xx.eu-west-1.com

WebHDFS hadoop section code 该区 amazon-ec2 cloudera-cdh

apache - EC2 上 SSL 的 Ambari 注册阶段失败

我正在尝试使用ApacheAmbari在EC2上配置Hadoop集群。在注册阶段我得到这个错误:Commandstarttime2016-11-2320:25:12('Traceback(mostrecentcalllast):File"/usr/lib/python2.6/site-packages/ambari_agent/main.py",line312,inmain(heartbeat_stop_callback)File"/usr/lib/python2.6/site-packages/ambari_agent/main.py",line248,inmainstop_agen

apache Ambari 2016 INFO main hadoop

amazon-ec2 - EC2 上的 Hadoop 推荐？

在EC2中运行Hadoop时，我似乎有两个选择:答:自己管理集群，使用Hadoop附带的EC2特定shell脚本。B:使用ElasticMapReduce，为方便起见多付一点钱。我倾向于B，但我希望有更多经验的人提供一些建议。这是我的问题:是否有任何任务可以使用这些方法中的一种来完成，而另一种则不能？除了我忽略的这两个选项之外，还有其他选项吗？如果我选择B，回到A有多容易？也就是说，供应商锁定的危险是什么？最佳答案第三个选项:您可以使用apachewhirr在ec2上设置hadoop集群(也支持rackspace)

amazon-ec amazon section strong li amazon-ec2 hadoop mapreduce

hadoop - Hadoop EC2 安装的 Spark 脚本 : IPC client connection refused

我试图在EC2的spark脚本设置的EC2集群上使用distcp在Hadoop和AmazonS3之间复制[root]#bin/hadoopdistcps3n://bucket/f1hdfs:///user/root/我得到的错误是INFOipc.Client:Retryingconnecttoserver:..Alreadytriedntime(s).Copyfailed:java.net.ConnectException:Callto..my_serverfailedonconnectionexcep\tion:java.net.ConnectException:Connection

connection refused section code pre hadoop amazon-ec2 apache-spark

amazon-ec2 - 在 EC2 集群上安装 Hbase/Hadoop

我知道我可以分拆出一个安装了Hadoop的EC2集群(除非我错了)。Hbase怎么样？我可以预先准备好Hadoop和Hbase吗？或者我需要弄脏我的手吗？如果它不是一个选项，什么是最好的选择？Cloudera显然有一个包含两者的软件包。这是要走的路吗？感谢您的帮助。最佳答案 hbase有一组ec2脚本，可以让您快速设置并准备好运行。它允许您配置zk服务器和从节点的数量，但我不确定它们在哪些版本中可用。我正在使用0.20.6。设置一些S3/EC2信息后，您可以执行以下操作:/usr/local/hbase-0.20.6/contri

amazon-ec amazon strong section INSTANCE amazon-ec2 hadoop hbase

10 11 121314 15 16