AWS-EC

java - 使用 AWS Java SDK 和 Hadoop 将项目放入 DynamoDB 时出错

我使用的是hadoop2.7、hadoop-core版本1.1.2和AWSJavaSDK1.10.50。当我尝试将项目放入dynamoDB时，出现以下错误:java.lang.NoSuchFieldError:INSTANCEatcom.amazonaws.http.conn.SdkConnectionKeepAliveStrategy.getKeepAliveDuration(SdkConnectionKeepAliveStrategy.java:48)我发现这个错误是由于AWSSDK和HttpCore版本冲突导致的。在我的代码中运行:ClassLoaderclassLoader=M

时出放入 section code gt java maven hadoop amazon-web-services amazon-dynamodb

hadoop - Apache Spark Ec2 : could only be replicated to 0 nodes, 而不是 1

我有一个在Ec2d2.xlarge实例上运行的2Node集群，我有一个10Gb的文件要通过Spark处理，我在spark上安装了一个本地磁盘并在那里生成了10gb的数据集，但是当我我试图将其放入Hdfs中，它向我抛出错误"couldonlybereplicatedto0nodes,insteadof1"如下16/03/0921:44:25WARNhdfs.DFSClient:DataStreamerException:org.apache.hadoop.ipc.RemoteException:java.io.IOException:File/vinit/inputfile.txtcou

replicated hadoop java code apache-spark pyspark spark-streaming

hadoop - 通过 Java 代码从本地计算机连接 AWS EMR 上的 HDFS

我想了解如何从我的本地机器连接到hdfs(在awsEMR上)我的示例程序publicclassEMRConnection{publicstaticvoidmain(String[]args)throwsIOException,URISyntaxException{Configurationconfig=newConfiguration();FileSystemhdfs=FileSystem.get(newURI("hdfs://***-**-**-***-***.compute-1.amazonaws.com:50070"),config);hdfs.mkdirs(newPath("/

hadoop Java apache hdfs emr

amazon-web-services - AWS EMR 集群失败，因为磁盘已满

我在具有约10个节点的awsemr集群上运行一些Map-Reduce-Jobs。(emr4.7.11,m3.xlarge)当作业正在运行时，工作节点在约4小时后开始一个接一个地死亡。在日志中我发现了以下错误:“1/3本地目录错误:/mnt/yarn；1/1日志目录错误:/var/log/hadoop-yarn/containers”当节点出现故障时，工作节点上的磁盘使用率为96%。所以我假设节点上的磁盘达到100%，并且没有文件可以写入磁盘。所以我尝试为每个实例附加一个500GB的EBS卷。但是Hadoop只使用了/mnt，并没有使用额外的Volume(/mnt2)。如何配置AWSEM

amazon-web-services services hadoop code section amazon-emr

amazon-web-services - 尝试从本地计算机访问 AWS 上的 HDFS 文件时出现错误

我已经在thistutorial之后在AWSEC2上成功安装了hadoop和spark.我可以从AWS上的spark访问HDFS。但是，当我尝试通过以下方式从本地计算机访问HDFS文件时vallines=sc.textFile("hdfs://namenode_public_DNS:9000/datasets/wikipedia/wikipedia.dat")lines.first()我明白了17/04/1016:35:41WARNBlockReaderFactory:I/Oerrorconstructingremoteblockreader.org.apache.hadoop.net

时出 amazon-web-services section code pre hadoop apache-spark amazon-ec2 hdfs

hadoop - 通过 Chef 在ec2中设置ssh无密码

我在Chef中有以下recipe/default.rb:#CreateemptyRSApasswordtemplate"#{node[:cluster][:ubuntu]}/my_key.pem"dosource"keys.pem.erb"mode0400owner"ubuntu"group"ubuntu"endbash"ssh-passwordless"douser"ubuntu"cwd"#{node[:cluster][:ubuntu]}"code/tmp/tmp.pubkey;mkdir-p.ssh;touch.ssh/authorized_keys;grep#{node[:fq

中设 hadoop ubuntu ssh 34 amazon-web-services amazon-ec2 chef-infra

hadoop - 在 AWS EC2 上扩展根分区

我创建了一个公共(public)VPC，然后向其中添加了一堆节点，以便我可以将其用于spark集群。不幸的是，它们都具有如下所示的分区设置:ec2-user@sparkslave1:lsblk/dev/xvda100G/dev/xvda15.7G/我在这些机器上设置了一个云管理器，所有节点只剩下1G空间给HDFS。如何扩展分区以占用所有100G？我尝试创建/dev/xvda2，然后创建一个卷组，将所有/dev/xvda*添加到其中，但/dev/xvda1在挂载时没有添加。在这种情况下，我无法从liveCD启动，它在AWS上。我也试过resize2fs但它说根分区已经占用了所有可用的bl

hadoop AWS section li xvda amazon-web-services amazon-ec2

hadoop - AWS EMR 4.0 - 如何添加自定义 JAR 步骤以运行 shell 命令

我正在尝试使用EMR4.0.0上的步骤运行shell命令，并使用此链接作为引用-http://docs.aws.amazon.com/ElasticMapReduce/latest/DeveloperGuide/emr-hadoop-script.html但我想知道从何处将“command-runner.jar”放入“JAR位置”字段http://i.stack.imgur.com/CRicz.png我在AWSs3中保留了“command-runner.jar”并尝试从该位置加载它，在“参数”中给出了我的“example.sh”文件的s3位置，在添加步骤后它失败并给出了这个异常Exce

自定 hadoop java runner section amazon-web-services amazon-s3 amazon-emr

hadoop - AWS EMR S3DistCp : The auxService:mapreduce_shuffle does not exist

我通过SSH连接到AWSEMRv5.4.0实例，我想调用s3distcp。Thislink演示了如何设置一个emr步骤来调用它，但是当我运行它时出现以下错误:Containerlaunchfailedforcontainer_1492469375740_0001_01_000002:org.apache.hadoop.yarn.exceptions.InvalidAuxServiceException:TheauxService:mapreduce_shuffledoesnotexistatsun.reflect.NativeConstructorAccessorImpl.newIns

mapreduce_shuffle auxService yarn nodemanager hadoop elastic-map-reduce

amazon-web-services - Spark/Hadoop 不支持 AWS S3 上的 SSE-KMS 加密

我正在尝试使用KMSkey(SSE-KMS)通过服务器端加密在S3上保存一个rdd，但出现以下异常:Exceptioninthread"main"com.amazonaws.services.s3.model.AmazonS3Exception:StatusCode:400,AWSService:AmazonS3,AWSRequestID:695E32175EBA568A,AWSErrorCode:InvalidArgument,AWSErrorMessage:Theencryptionmethodspecifiedisnotsupported,S3ExtendedRequestID:

不支 amazon-web-services 34 SSE-KMS hadoopConfiguration hadoop apache-spark encryption amazon-s3

187 188 189190191 192 193