草庐IT

ec2-user

全部标签

ubuntu - Hadoop - EC2 ubuntu 上的环境设置

我在AmazonEC2(ubuntu)上配置hadoop2.7.1,所有TCP端口(0~65535)都打开。我的节点结构是nameNode,resourceManager,dataNode01,dataNode02,和每个都有一个EC2。此外,我使SSH连接成为可能,无需key对或密码。如果我输入sbin/start-all.sh在nameNode,然后SecondaryNameNode,NameNode创建于nameNode,NodeManager创建于resourceManager,dataNode01,dataNode02.(注意:ResourceManager不是在resour

亚马逊EC2服务器链接方式

亚马逊EC2服务器(linux、centos系统)使用Xshell链接工具进行链接登陆用户名(ec2-user)、使用PublicKey登录方式,选择创建实例时用的密钥对文件登录成功后可使用 (sudo-s)命令切换至  Root账户,进行操作只有切换为root账户后,方可安装宝塔面板等 使用PHPstorm链接亚马逊服务器使用非root账号登录(只读)默认使用ec2-user登录,选择Keypair方式检验登录使用root账号登录(可读可写)先设置root账号(参考AWSEC2启动Centos实例以及设置root密码登录_hhhzua的专栏-CSDN博客_awscentosroot密码一、在

amazon-web-services - 具有重叠 EC2 实例的集群

我有以下具有重叠EC2实例的集群,例如:Yarn集群和Memcached集群使用相同的实例2、3、4;此外,每个实例都有不同的RAM、CPU、内核大小,这会不会有潜在的类(class)问题?还是集群自己做平衡?谢谢!Spark集群:EC2实例2、3、5Yarn集群:EC2实例1、2、3、4、5Memcached数据库集群:EC2实例2、3、4、6instance1:512GBRAM,2vCPU,2coresinstance2:1TBRAM,8vCPU,4coresinstance3:2TBRAM,6vCPU,6coresinstance4:256GBRAM,2vCPU,2coresin

hadoop - CDH WebHDFS 请求重定向到 EC2 上的本地地址

我正在尝试设置一个环境,在其中我在本地运行我的一些后端,并从我的本地计算机向EC2实例发送请求。我有CDH4.5安装程序,它工作正常。当我运行以下请求时curl--negotiate-i-L-u:hdfshttp://ec2-xx-xx-xx-xx.eu-west-1.compute.amazonaws.com:50070/webhdfs/v1/tmp/test.txt?op=OPEN这适用于该区域中的任何EC2实例,但在该区域之外不起作用。如果我在本地尝试,它会返回以下错误curl:(6)Couldnotresolvehost:ip-xx-xx-xx-xx.eu-west-1.com

scala - Spark-Scala HBase 表创建失败(MetaException(消息 :file:/user/hive/warehouse/src is not a directory or unable to create one)

我的VM中运行着hortonworks沙盒。我已经完成了所有的hive-site.xml配置并放置在Spark/conf文件中。我可以使用PySpark访问HBase并创建/更新表,但是当我在Scala中执行相同的实现时,会出现以下错误:FAILED:ExecutionError,returncode1fromorg.apache.hadoop.hive.ql.exec.DDLTask.MetaException(message:file:/user/hive/warehouse/srcisnotadirectoryorunabletocreateone)我也更改了对“hive/war

multithreading - 为什么hadoop任务的real时间明显大于user+sys时间?

在hadoop任务上运行time命令时,出现如下结果:real0m25.839suser0m1.362ssys0m0.184我在VM上运行单个节点,并尝试在基准测试中记录hadoop任务的时间。 最佳答案 假设为I/O休眠所花费的时间不是原因,也许是VM本身作为主机上的进程运行这一事实导致了巨大的差异。实时表示挂钟时间。此处报告的user+sys时间是任务在VM处理器上花费的时间。因此,报告的实时时间将包括VM上运行的其他进程以及主机上运行的VM以外的进程使用的时间。 关于multith

apache - EC2 上 SSL 的 Ambari 注册阶段失败

我正在尝试使用ApacheAmbari在EC2上配置Hadoop集群。在注册阶段我得到这个错误:Commandstarttime2016-11-2320:25:12('Traceback(mostrecentcalllast):File"/usr/lib/python2.6/site-packages/ambari_agent/main.py",line312,inmain(heartbeat_stop_callback)File"/usr/lib/python2.6/site-packages/ambari_agent/main.py",line248,inmainstop_agen

amazon-ec2 - EC2 上的 Hadoop 推荐?

在EC2中运行Hadoop时,我似乎有两个选择:答:自己管理集群,使用Hadoop附带的EC2特定shell脚本。B:使用ElasticMapReduce,为方便起见多付一点钱。我倾向于B,但我希望有更多经验的人提供一些建议。这是我的问题:是否有任何任务可以使用这些方法中的一种来完成,而另一种则不能?除了我忽略的这两个选项之外,还有其他选项吗?如果我选择B,回到A有多容易?也就是说,供应商锁定的危险是什么? 最佳答案 第三个选项:您可以使用apachewhirr在ec2上设置hadoop集群(也支持rackspace)

hadoop - spark-submit --proxy-user 在 yarn 集群模式下不工作

目前我使用的是clouderahadoop单节点集群(启用了kerberos。)在客户端模式下我使用以下命令kinitspark-submit--masteryarn-client--proxy-userclouderaexamples/src/main/python/pi.py这很好用。在集群模式下,我使用以下命令(没有完成kinit并且缓存中没有TGT)spark-submit--principal--keytab--masteryarn-clusterexamples/src/main/python/pi.py也很好用。但是当我在集群模式下使用以下命令时(没有完成kinit并且缓

MySQL新建表:1044 - Access denied for user ‘root‘@%‘ to database ‘XXX‘终极解决方案

1.问题描述情况一:Navicat连接远程mysql数据库,创建数据库时出现错误:情况二:在linux中命令创建数据库出现如下报错:2.原因分析root权限不够,先使用“SELECThost,user,Grant_priv,Super_privFROMmysql.user;”查询,发现已经是Y了。通过SELECT*FROMmysql.user;命令查询权限信息,可以看到root对应的很多权限都是N,如下图所示:至于为什么会出现root权限不够,可能是安装mysql的时候MySQL权限配置不正确,或者修改了相关的配置文件等。3.解决方案将root权限全部修改为Y,执行如下代码(记得退出mysql