elastics

ruby - 您能否以编程方式轻松控制 Elastic Mapreduce 作业？

有一个用ruby编写的命令行客户端用作标准。但是，它不会在1.9中运行。还有一个非常好的rubyaws-sdk，但它不支持EMR。有更好的选择吗？最佳答案 2012年6月22日更新:亚马逊正在审查@nkadwa的拉取请求(见上文)。请留意这一点。我一直在使用Ruby命令行客户端，但我构建的许多基于Ruby/Rails的工具需要ruby1.9.3。我的解决方法是RVM.假设您有$HOME/projects/elastic-mapreduce，其中有EMRRuby客户端假设您还有$HOME/projects/myproj您

java - AWS Elastic Map Reduce 中线程 "main"java.lang.NoClassDefFoundError 中的异常

我正在尝试使用JAR文件在AWSElasticMapReduce上运行hadoop作业。我正在使用一个名为EJMLhttps://code.google.com/p/efficient-java-matrix-library/wiki/EjmlManual的库.我使用project-->BuildPath-->ConfigureBuildPath-->AddExtrenalJarsinEclipse将它作为外部库包含在我的项目中。当我在本地计算机上运行该项目时，一切都很好。但是在AWS上我得到了错误，Exceptioninthread"main"java.lang.NoClassDef

NoClassDefFoundError java section code hadoop amazon-web-services mapreduce elastic-map-reduce

尝试在 Elastic MapReduce 上运行 Jar 作业时出现 java.lang.RuntimeException : java. lang.ClassNotFoundException

我应该更改什么来修复以下错误:我正在尝试在ElasticMapreduce上开始一项工作，但它每次都崩溃并显示以下消息:java.lang.RuntimeException:java.lang.ClassNotFoundException:iataho.mapreduce.NewMaxTemperatureMapperatorg.apache.hadoop.conf.Configuration.getClass(Configuration.java:831)atorg.apache.hadoop.mapreduce.JobContext.getMapperClass(JobContex

时出 ClassNotFoundException java apache hadoop mapreduce amazon-emr elastic-map-reduce

amazon-web-services - 登录 Elastic Mapreduce 的最佳实践 - AWS

我计划将AmazonEMR用于SparkStreaming应用程序。亚马逊提供了一个很好的界面来显示标准错误和Controller日志。但是对于流式应用程序，我不确定如何管理日志。亚马逊将数据记录到/var/log/hadoop/steps/和Spark的类似地方。http://docs.aws.amazon.com/ElasticMapReduce/latest/DeveloperGuide/emr-manage-view-web-log-files.html我想知道我们如何轮换日志并且仍然可以通过awsemrWeb界面访问。我们可以通过配置hadoop-log4j轻松更改日志轮换策

amazon-web-services Mapreduce section emr-manage-view-web-log-files ElasticMapReduce hadoop spark-streaming amazon-emr

python - 具有二进制可执行文件的 Hadoop/Elastic Map Reduce？

我正在使用hadoop流、python、matlab和elasticmapreduce编写分布式图像处理应用程序。我已经使用matlab编译器编译了我的matlab代码的二进制可执行文件。我想知道如何将其合并到我的工作流程中，以便二进制文件成为Amazon的弹性mapreduce处理的一部分？看来我必须使用Hadoop分布式缓存？代码非常复杂(而且不是我写的)所以现在不可能将它移植到另一种语言。谢谢最佳答案以下内容并不完全是对您的Hadoop问题的回答，但我忍不住要问您为什么不在Grid资源上执行处理作业？有用于在网格上执行计算

Elastic python section matlab Hadoop amazon-web-services mapreduce

hadoop - Amazon Elastic MapReduce 在主节点上完成引导操作，但在核心节点上挂起

我在1个主节点和25个核心节点上运行AmazonElasticMapReduce(EMR)作业。引导操作在主节点上完成，但它们卡在核心节点上。构成map步骤的约5000个(共5200个)任务随后被报告为“正在运行”，而其余任务则为“待定”。然而，因为核心节点挂起，实际上没有任何东西在运行；我可以说是因为没有写入中间输出。大约30分钟后，所有之前“正在运行”的任务都被标记为“killed_unclean”并转为“待处理”。几分钟后，核心节点上的引导操作完成，但没有任何任务从“待定”状态转变为“运行状态”。当我使用2个核心节点而不是25个核心节点运行作业时，不会出现此问题；任务按预期完成。

MapReduce Elastic section stackoverflow hadoop amazon-web-services amazon-ec2 emr

hadoop - 在 Amazon Web Services 上的 Elastic MapReduce 上定义一个 HDFS 文件

我开始在HadoopMapReduce框架上实现KMeans算法。在这方面，我正在使用AmazonWebServices提供的弹性MapReduce。我想创建一个HDFS文件以在其上保存初始集群坐标，并在其上存储reducer的最终结果。我在这里完全困惑。无论如何要创建或“上传”这个文件到HDFS格式，以便所有映射器都能看到。有这方面的说明吗？谢谢。最佳答案最后我知道了怎么做。所以，为了将HDFS文件上传到集群中。您必须通过Putty连接到您的集群(通过使用安全key)。然后编写这些命令hadoopdistcps3://buck

MapReduce Services section 上实 hadoop amazon-web-services

hadoop - Amazon Elastic Map Reduce 是否在每个实例中运行一个或多个映射器进程？

我的问题是:我应该自己关心映射器中的多重处理(从标准输入读取任务，然后将它们分配给工作进程，在主进程中组合结果并输出到标准输出)还是Hadoop会自动处理它？我在HadoopStreaming文档和AmazonElasticMapReduce常见问题解答中都没有找到答案。最佳答案 Hadoop有一个“槽”的概念。Slot是mapper进程运行的地方。您配置每个tasktracker节点的槽数。它是映射进程的理论最大值，它将在每个节点上并行运行。如果没有足够的输入数据的单独poprtions(称为FileSplits)，它可能会更少

中运射器 section Hadoop amazon-web-services mapreduce elastic-map-reduce hadoop-streaming

hadoop - 如何与 amazon elastic mapreduce 共享 jar 库？

为了加快jar到s3的上传速度，我想将我所有常用的jar复制到普通hadoop中的“$HADOOP_HOME/lib”之类的地方。我是否可以创建预安装这些库的自定义EMRhadoop实例。或者有更简单的方法？最佳答案您可以将此作为引导操作来执行。这就像放置一个脚本来复制到S3一样简单，然后如果您从命令行启动EMR，请添加如下参数:--bootstrap-action's3://my-bucket/boostrap.sh'或者，如果您通过网络界面执行此操作，只需在相应字段中输入位置即可。

mapreduce elastic section hadoop stackoverflow amazon-ec2 elastic-map-reduce

eclipse - 无法在 Elastic map reduce 命令行工具中列出当前作业流程？

我已成功安装AmazonElasticMapReduce命令行工具。在列出当前作业流程时，使用以下命令$./elastic-mapreduce--list它抛出以下错误。Error:Requesthasexpired.Timestampdate:2013-07-09T02:48:00-07:00 最佳答案检查时间戳(即)主节点时间、机器时间应该相等。那么只有你会得到正确的回应。您可以通过putty查看您的主节点实例的时间戳。关于eclipse-无法在Elasticmapreduce命

作业流程 eclipse section code hadoop amazon-web-services mapreduce elastic-map-reduce

23 24 252627 28 29