草庐IT

EC2-classic

全部标签

hadoop - 自动缩放 EMR - 是否需要?我应该只使用 EC2 吗?我应该只使用 Qubole 吗?

为了减少配置时间,我们决定保留一个包含5个实例的专用EMR集群(我们预计大约需要5个)。如果我们需要更多,我们认为我们需要实现某种自动缩放。我对EMR一点都不熟悉-它支持自动缩放吗?我在文档中找到了这个:http://docs.aws.amazon.com/ElasticMapReduce/latest/DeveloperGuide/emr-manage-resize.html这是查找自动缩放的正确位置还是我误解了“调整大小”的含义。我读过EMR的一个好处是“按需处理”,我认为它在ec2实例之间分配负载而无需指定实例数量,所以这给我的印象是它自己进行ec2实例的扩展,这意味着我们不需要

networking - 亚马逊 EC2 - 网络问题

我们正在amazonec2上启动hadoop集群,最近我们遇到网络问题,例如master无法连接到slave。我们认为原因是亚马逊限制了网络连接。因此,我们尝试在每个从节点的随机延迟后建立连接。但是,这没有帮助。还有其他建议吗?谢谢巴拉 最佳答案 您是否尝试过使用cloudera的hadoop-ec2脚本?我一直在使用它们为我的论文研究设置偶尔的hadoop集群,我发现它们工作得很好。设置需要几分钟时间,但设置完成后您就可以了hadoop-ec2launch-cluster它会设置您需要的所有东西,而且通常做得非常好。有时,节点无法

ubuntu - Hadoop - EC2 ubuntu 上的环境设置

我在AmazonEC2(ubuntu)上配置hadoop2.7.1,所有TCP端口(0~65535)都打开。我的节点结构是nameNode,resourceManager,dataNode01,dataNode02,和每个都有一个EC2。此外,我使SSH连接成为可能,无需key对或密码。如果我输入sbin/start-all.sh在nameNode,然后SecondaryNameNode,NameNode创建于nameNode,NodeManager创建于resourceManager,dataNode01,dataNode02.(注意:ResourceManager不是在resour

亚马逊EC2服务器链接方式

亚马逊EC2服务器(linux、centos系统)使用Xshell链接工具进行链接登陆用户名(ec2-user)、使用PublicKey登录方式,选择创建实例时用的密钥对文件登录成功后可使用 (sudo-s)命令切换至  Root账户,进行操作只有切换为root账户后,方可安装宝塔面板等 使用PHPstorm链接亚马逊服务器使用非root账号登录(只读)默认使用ec2-user登录,选择Keypair方式检验登录使用root账号登录(可读可写)先设置root账号(参考AWSEC2启动Centos实例以及设置root密码登录_hhhzua的专栏-CSDN博客_awscentosroot密码一、在

amazon-web-services - 具有重叠 EC2 实例的集群

我有以下具有重叠EC2实例的集群,例如:Yarn集群和Memcached集群使用相同的实例2、3、4;此外,每个实例都有不同的RAM、CPU、内核大小,这会不会有潜在的类(class)问题?还是集群自己做平衡?谢谢!Spark集群:EC2实例2、3、5Yarn集群:EC2实例1、2、3、4、5Memcached数据库集群:EC2实例2、3、4、6instance1:512GBRAM,2vCPU,2coresinstance2:1TBRAM,8vCPU,4coresinstance3:2TBRAM,6vCPU,6coresinstance4:256GBRAM,2vCPU,2coresin

hadoop - CDH WebHDFS 请求重定向到 EC2 上的本地地址

我正在尝试设置一个环境,在其中我在本地运行我的一些后端,并从我的本地计算机向EC2实例发送请求。我有CDH4.5安装程序,它工作正常。当我运行以下请求时curl--negotiate-i-L-u:hdfshttp://ec2-xx-xx-xx-xx.eu-west-1.compute.amazonaws.com:50070/webhdfs/v1/tmp/test.txt?op=OPEN这适用于该区域中的任何EC2实例,但在该区域之外不起作用。如果我在本地尝试,它会返回以下错误curl:(6)Couldnotresolvehost:ip-xx-xx-xx-xx.eu-west-1.com

apache - EC2 上 SSL 的 Ambari 注册阶段失败

我正在尝试使用ApacheAmbari在EC2上配置Hadoop集群。在注册阶段我得到这个错误:Commandstarttime2016-11-2320:25:12('Traceback(mostrecentcalllast):File"/usr/lib/python2.6/site-packages/ambari_agent/main.py",line312,inmain(heartbeat_stop_callback)File"/usr/lib/python2.6/site-packages/ambari_agent/main.py",line248,inmainstop_agen

amazon-ec2 - EC2 上的 Hadoop 推荐?

在EC2中运行Hadoop时,我似乎有两个选择:答:自己管理集群,使用Hadoop附带的EC2特定shell脚本。B:使用ElasticMapReduce,为方便起见多付一点钱。我倾向于B,但我希望有更多经验的人提供一些建议。这是我的问题:是否有任何任务可以使用这些方法中的一种来完成,而另一种则不能?除了我忽略的这两个选项之外,还有其他选项吗?如果我选择B,回到A有多容易?也就是说,供应商锁定的危险是什么? 最佳答案 第三个选项:您可以使用apachewhirr在ec2上设置hadoop集群(也支持rackspace)

hadoop - Hadoop EC2 安装的 Spark 脚本 : IPC client connection refused

我试图在EC2的spark脚本设置的EC2集群上使用distcp在Hadoop和AmazonS3之间复制[root]#bin/hadoopdistcps3n://bucket/f1hdfs:///user/root/我得到的错误是INFOipc.Client:Retryingconnecttoserver:..Alreadytriedntime(s).Copyfailed:java.net.ConnectException:Callto..my_serverfailedonconnectionexcep\tion:java.net.ConnectException:Connection

amazon-ec2 - 在 EC2 集群上安装 Hbase/Hadoop

我知道我可以分拆出一个安装了Hadoop的EC2集群(除非我错了)。Hbase怎么样?我可以预先准备好Hadoop和Hbase吗?或者我需要弄脏我的手吗?如果它不是一个选项,什么是最好的选择?Cloudera显然有一个包含两者的软件包。这是要走的路吗?感谢您的帮助。 最佳答案 hbase有一组ec2脚本,可以让您快速设置并准备好运行。它允许您配置zk服务器和从节点的数量,但我不确定它们在哪些版本中可用。我正在使用0.20.6。设置一些S3/EC2信息后,您可以执行以下操作:/usr/local/hbase-0.20.6/contri