AWS-EC_草庐IT

hadoop - AWS EMR 上的 YARN 日志聚合 - UnsupportedFileSystemException

我正在努力为我的AmazonEMR集群启用YARN日志聚合。我正在按照此文档进行配置:http://docs.aws.amazon.com/ElasticMapReduce/latest/DeveloperGuide/emr-plan-debugging.html#emr-plan-debugging-logs-archive在标题为“使用AWSCLI在AmazonS3中聚合日志”的部分下。我已验证hadoop-config引导操作将以下内容放入yarn-site.xmlyarn.log-aggregation-enabletrueyarn.log-aggregation.retain

streaming - Hadoop 或 Hadoop Streaming for MapReduce on AWS

我即将开始一个将在AWS上运行的mapreduce项目，我面临一个选择，是使用Java还是C++。我知道用Java编写项目会使我可以使用更多功能，但是C++也可以通过HadoopStreaming实现它。请注意，我对这两种语言都没有什么背景。一个类似的项目已经用C++完成，代码可供我使用。所以我的问题是:这个额外功能是通过AWS提供的，还是仅在您对云有更多控制权时才相关？为了做出决定，还有什么我应该牢记的，比如hadoop插件的可用性，可以更好地使用一种语言或另一种语言？提前致谢最佳答案您有几个选项可以在AWS上运行Hadoop

Hadoop streaming section C++amazon-web-services mapreduce

AWS 免费套餐中的 Hadoop？

对于Java类期末项目，我们需要设置Hadoop并实现n-gram处理器。我找到了许多“AWS上的Hadoop”教程，但不确定如何在保持免费套餐的同时部署Hadoop。我刚才试过，收到了超过250美元的账单。现在我太紧张了，无法测试，希望得到帮助，以确保我不会再付一笔钱。据我了解，这些是免费套餐的限制:允许的实例:t1.micro或t2.micro每月最大实例小时数:750操作系统:EC2上的标准价格版本的Linux或Windows存储:30GB的EBS许多Hadoop教程使用的实例不是上面显示的这两个实例。TheAWStutorialhere提到它将花费大约1美元，并表示它将运行一个

套餐 Hadoop section amazon-web-services

hadoop - 在 EMR 上运行 Spark 作业时 AWS 连接超时

我正在尝试在AmazonEMR集群中提交一个简单的Spark作业。我的集群有5个M4.2xlarge实例(1个主实例、4个从实例)，每个实例有16个vCPU和32GB内存。这是我的代码:defmain(args:Array[String]):Unit={valsparkConfig=newSparkConf().set("hive.exec.dynamic.partition","true").set("hive.exec.dynamic.partition.mode","nonstrict").set("hive.s3.max-client-retries","50").set("h

hadoop Spark apache java apache-spark amazon-s3 apache-spark-sql emr

amazon-ec2 - 在 EC2 集群上安装 Hbase/Hadoop

我知道我可以分拆出一个安装了Hadoop的EC2集群(除非我错了)。Hbase怎么样？我可以预先准备好Hadoop和Hbase吗？或者我需要弄脏我的手吗？如果它不是一个选项，什么是最好的选择？Cloudera显然有一个包含两者的软件包。这是要走的路吗？感谢您的帮助。最佳答案 hbase有一组ec2脚本，可以让您快速设置并准备好运行。它允许您配置zk服务器和从节点的数量，但我不确定它们在哪些版本中可用。我正在使用0.20.6。设置一些S3/EC2信息后，您可以执行以下操作:/usr/local/hbase-0.20.6/contri

amazon-ec amazon strong section INSTANCE amazon-ec2 hadoop hbase

EC2 上的 Hadoop 与 Elastic Map Reduce

我正在尝试评估这两个选项之间的差异。以下是我能想到的一些优缺点:ElasticMapReduce=>来自Amazon的更好支持，无需管理集群，更昂贵(？)EC2+Hadoop=>更多地控制您的hadoop配置，更便宜(？)我想知道是否有人针对EMR对EC2+Hadoop的性能进行了基准测试？大型集群部署的成本是否有显着差异？还有哪些区别？最佳答案我们在工作中使用这两种方法(EMR和EC2)。Amar提到的EMR的优势或多或少是正确的:因此，如果您想要简单，它可能是可行的方法。但是还有其他的考虑:EMR的版本远远落后于apache

Elastic Hadoop 205 section amazon-web-services

每个AWS lambda的最大事件源映射数量是多少？

我找不到AWS文档中任何地方列出的此限制，以触发一个lambda的最大事件源数量。我有一个lambda，该lambda将被无限期增长的S3桶触发。显然，只有在最大存储桶数超过触发器数量的最大数量时，这才能起作用。有最大值吗？如果是这样，它是什么，可以增加吗？看答案我只是遇到了一个极限。我添加了60个CloudWatch触发器到lambda功能，当我尝试再添加一个触发器时，我发现一个错误说：“最终策略大小（20643）大于限制（20480）。（服务：AWSLAMBDA；状态代码：400；错误代码：PolicyLengthExceededException；”

映射每个触发 section 触发器

php - 使用 AWS api 检查 amazon s3 上是否存在对象

我正在使用AWSapi，但在检查现有对象(文件夹)时遇到问题。我经历了this问题，它对我没有帮助，因为我使用的是最新更新的SDK。我搜索了SDK并找到了this这应该可以工作，即doesObjectExist，但我无法在任何地方找到函数定义。我的s3.php文件没有此功能。Here是我的S3.php类。我还了解到S3不支持文件夹结构，但由于平面文件系统，它只是在视觉上让它看起来像是存储在一个文件夹中。现在，如果我必须在S3上搜索文件夹1024x768，我是否只检查存储桶的根目录？我的意思是这样的$chkFileExist=$s3->doesObjectExist($bucketNam

amazon php code section noreferrer api amazon-web-services amazon-s3

php - 无法在 Amazon EC2 上设置 cron-job

我有一个AmazonEC2实例(Ubuntu服务器13.04-64位[ami-bf1d8a8f])运行我的网站。我需要设置一个CronJob来每天收到电子邮件提醒。有没有人有任何建议或可能的解决方案？感谢您的宝贵时间。最佳答案这与通过命令行在任何其他服务器上设置cron作业一样。通过SSH连接导航到/etc/cron.daily制作一个运行/调用PHP脚本以发送电子邮件/其他任务的新脚本确保其可执行您可以使用诸如wget-q-Otemp.txthttp://www.site.com/cron.php之类的命令来调用PHP脚本，或

cron-job Amazon code cron section php amazon-ec2 ec2-ami

php - 无法将 Laravel 应用程序部署到 EC2

我的Laravel项目都在我的本地主机上运行。我将它部署到EC2，但没有任何反应。我在开发控制台中看到的只是内部错误(500)。我错过了什么？在部署到AWS之前我需要更改什么？这是网址:http://ec2-52-88-99-75.us-west-2.compute.amazonaws.com这是httpd.conf文件:http://collabedit.com/sdcxm 最佳答案 AfterinstallingLaravel,youmayneedtoconfiguresomepermissions.Directorieswit

Laravel php section code blockquote apache amazon-web-services amazon-ec2 laravel-5