草庐IT

华为云ECS/HECS:中小企业上云第一步

1.上云是目前中小企业最火热的话题博主目前担任中型企业架构师,在与客户的沟通过程中,”你们公司上云了吗“是谈及最多的话题,在客户的眼里,上云就是技术优秀的代名词,那么什么是上云,上云又有什么好处?2.什么是上云,上云有什么好处上云,顾名思义就是使用云服务器代替传统机房建设。相对传统机房有以下优点。造价低,相比动辄数十万、上百万的机房,中小企业可轻松负担云服务。云服务器不需要专业人员维护,维护费用极低。大多数厂商都使用异地防灾,保证服务器的稳定性。可根据当前用户量动态的扩容或减少服务器。3.什么样的云服务器是中小企业最需要的博主现公司需要为500人左右体量企业定制oa系统,对于中小企业来说什么是

networking - Cloudera Hadoop 在 EC2 上使用 Vagrant - 如何设置主机、IP 和网络?

我使用自己制作的Vagrant配置脚本在我提供的本地VirtualBox中安装Cloudera集群。提供者在这里:https://github.com/theclue/cdh5-vagrant在我的本地环境中一切正常,但现在我面临着如何添加EC2提供商的问题。由于供应商烘焙了一个大量手动调整的Cloudera集群,因此使用Whirr完成任务没有任何意义。我会尽量坚持我心爱的Vagrant。网络问题。集群的每个节点在子网10.10.50.*中共享一个私有(private)IP-这确保节点可以相互通信并且不能从外部访问。然后,我将这些私有(private)IP硬编码到每个节点的/etc/h

linux - 无法将文件从 ubuntu scp 到 Amazon EC2

我正在运行sch命令并收到以下错误,谁能告诉我那是什么?xxxxxxxxx@ubuntu:~/Downloads$sudoscp-v"word_count.jar"ubuntu@54.68.0.10:/usr/Executing:program/usr/bin/sshhost54.68.0.10,userubuntu,commandscp-v-t/usr/OpenSSH_6.6.1,OpenSSL1.0.1f6Jan2014debug1:Readingconfigurationdata/etc/ssh/ssh_configdebug1:/etc/ssh/ssh_configline19

hadoop - 在 Hortonworks Hadoop (AWS EC2) 上访问 WebHDFS

我在AmazonEC2机器上遇到WebHDFS访问问题。顺便说一句,我已经安装了HortonworksHDP2.3。我可以使用以下http请求在浏览器(chrome)中从我的本地计算机检索文件状态:http://:50070/webhdfs/v1/user/admin/file.csv?op=GETFILESTATUS这工作正常,但如果我尝试使用?op=OPEN打开文件,它会将我重定向到我无法访问的机器的私有(private)DNS:http://:50075/webhdfs/v1/user/admin/file.csv?op=OPEN&namenoderpcaddress=:8020

amazon-web-services - 在 EC2 上设置 Hadoop 的脚本

在EC2上设置Hadoop的脚本,如https://wiki.apache.org/hadoop/AmazonEC2中所述已从最近的hadoop版本中删除。谷歌给我指出了一个替代方案http://whirr.apache.org/这也已经退休一年多了。是否有替代品或替代品仍然适合在EC2上设置最新版本的Hadoop?谢谢!更新hadoop-ec2脚本已从hadoopsrc中删除01/11/2011.目的是将其替换为ApacheWhirr.如果可以明确记录删除操作,那就太好了。不幸的是,Hadoop官方网站上不再方便地提供早期变更日志。 最佳答案

amazon-web-services - EC2(持久)HDFS 和 EMR( transient )HDFS 如何通信

我已经在AmazonEC2上使用NameNode/DataNode和其他一些服务设置了一个Hadoop集群。我的摄取工作将数据带入EC2HDFS集群(比方说hdfs://ec2-hdfs/)。现在我有一个每周批量运行的管道。我正在启动一个新的AmazonEMR集群来运行我的计算。处理完成后,我将终止EMR集群。需要在EMR中运行的我的spark作业的输入位于EC2HDFS(hdfs://ec2-hdfs/)中。如何从新创建的EMR集群访问它?我相信在EMR集群启动期间应该有一些选项(bootstrap/VPC/子网)可用。 最佳答案

hadoop - 使用 Whirr 启动 EC2 集群

我目前正在学习JefferyBreen的教程。当我想用Whirr启动ec2集群时遇到了一些麻烦。我使用的是cloudera演示vmcdh3u4。我下载了whirr0.8.1版本这是我运行的所有命令:$wgethttp://mirror.switch.ch/mirror/apache/dist/whirr/whirr-0.8.1/whirr-0.8.1.tar.gz$tarzxfwhirr-0.8.0.tar.gz$exportPATH="~/whirr-0.8.0/bin:$PATH"$exportAWS_ACCESS_KEY_ID=MYACCESSKEY$exportAWS_SECR

hadoop - AWS EC2 - Cloudera Manager - 停止实例

我已经使用cloudera管理器在AmazonEC2上设置了hadoop集群。Cloudera管理器创建了两个实例,并且都按预期工作。我试图通过AWS控制台停止cloudera创建的实例,但没有停止选项。我们只有“终止”和“重启”。我不想终止这些实例,因为我想重用这些实例。如何停止这些实例? 最佳答案 由于您的实例来自实例存储支持的AMI,您将只能重启和终止实例。查看“根设备”下的管理控制台以确认情况是否如此。要解决此问题,您可以从您的实例创建一个AMI,然后使用新的AMI重新启动您的环境,这样您就可以选择停止您的实例。

linux - 在哪里可以找到适用于 EC2 上的 Hadoop 的 AMI?

我正在尝试在AmazonEC2上永久设置Hadoop。目前我正在做的是每天早上启动EC2实例并设置Hadoop。有什么办法可以避免这个繁琐的步骤吗?我正在寻找可以加载到EC2上的Hadoop镜像,让事情变得简单。我知道我可以将EMR用于hadoop服务。但是我不知道如何在不提交作业流的情况下启动EMR(hadoop)集群。我的意思是我需要一个没有运行任何作业的hadoop集群。最终我的目标是运行像Distmap这样的生物信息学应用程序和Seal.要运行这些应用程序,有许多依赖项。所以我需要一个免费的hadoop集群来搭建环境,然后运行这些应用。我希望它清楚我正在尝试做什么。谢谢。

amazon-ec2 - 当我尝试进行查询时 Hive 没有响应

我在使用Whirr启动新的hadoop实例的EC2实例上进行了设置。我一直在尝试让Hive使用此设置。Hive应配置为使用mysql作为本地元存储。我遇到的问题是,每次我尝试通过配置单元界面运行类似(CREATETABLEtesters(fooINT,barkSTRING);)这样的查询时,它只是卡在那里,似乎没有做任何事情。如有任何帮助,我们将不胜感激。 最佳答案 我会先从配置单元命令行获取调试输出,看看它卡在哪里。使用此参数运行配置单元shell,然后粘贴命令的输出。hive-hiveconfhive.root.logger=D