草庐IT

s3_direct_upload

全部标签

java - 为什么我不能再从 AWS S3 in Spark 应用程序读取数据?

我已经升级到ApacheSpark1.5.1,但我不确定这是否导致了它。我在spark-submit中有我的访问key,它一直有效。Exceptioninthread"main"java.lang.NoSuchMethodError:org.jets3t.service.impl.rest.httpclient.RestS3Service.(Lorg/jets3t/service/security/AWSCredentials;)VSQLContextsqlContext=newSQLContext(sc);DataFramedf=sqlContext.read().format("c

java - 如何连接 Apache Kafka 和 Amazon S3?

我想使用KafkaConnect将来自Kafka的数据存储到存储桶s3中。我已经运行了一个Kafka的主题,并且创建了一个存储桶s3。我的主题有关于Protobuffer的数据,我尝试使用https://github.com/qubole/streamx我得到了下一个错误:[2018-10-0413:35:46,512]INFORevokingpreviouslyassignedpartitions[]forgroupconnect-s3-sink(org.apache.kafka.clients.consumer.internals.ConsumerCoordinator:280)[

java - 使用 AWS Java SDK 为现有 S3 对象设置过期 header

我正在更新AmazonS3存储桶中的现有对象以设置一些元数据。我想为每个对象设置HTTPExpiresheader,以便更好地处理HTTP/1.0客户端。我们正在使用AWSJavaSDK,它允许在不重新上传对象内容的情况下更改对象的元数据。我们使用CopyObjectRequest来做到这一点将对象复制到自身。ObjectMetadata类允许我们设置Cache-Control、Content-Type和其他几个header。但不是Expiresheader。我知道S3使用RESTAPI为PUT对象存储和提供Expiresheader。有没有办法从JavaSDK执行此操作?已更新以表明

java - 如何读取 Amazon S3 中的文件内容

我在AmazonS3存储桶ABCD中有一个文件。我有3个对象("folderA/folderB/folderC/abcd.csv")是文件夹,在最后一个文件夹中我有一个.csv文件(abcd.csv)。我使用逻辑将其转换为JSON并将其加载回另一个文件,该文件是同一文件夹("folderA/folderB/文件夹C/abcd.txt")。为此,我必须在本地下载文件。我将如何直接读取文件并将其写回文本文件。下面是我用来写入S3文件的代码,我需要从S3读取文件。InputStreaminputStream=newByteArrayInputStream(json.getBytes(Stan

java - 由于授权无法访问 S3 预签名 URL

这个问题在这里已经有了答案:Theauthorizationmechanismyouhaveprovidedisnotsupported.PleaseuseAWS4-HMAC-SHA256(25个答案)关闭7年前。使用Java8和aws-java-sdk1.10.43我正在尝试获取S3文件的预签名URL。我确实找回了一个链接,但浏览它会导致这个错误:authorizationmechanismyouhaveprovidedisnotsupported.PleaseuseAWS4-HMAC-SHA256要强调的是,我希望生成一个可以通过电子邮件发送并在浏览器中打开的URL,而不是使用Ja

java - 读取 S3 文件时出现 "java.net.SocketException: Socket is closed"

我正在尝试从S3读取一个csv文本文件,然后将其中的每一行发送到分布式队列以进行处理。尝试读取它时,我在读取文件的不同点(在不同的执行中)收到“java.net.SocketException:套接字已关闭”异常。这是代码:AmazonS3s3=newAmazonS3Client(newPropertiesCredentials(MyClass.class.getResourceAsStream("myCredentials.properties")));StringbucketName="myBucket";Stringkey="myFile";S3Objectobject=s3.g

java - 如何从 S3 下载 GZip 文件?

我都看了AWSS3JavaSDK-Downloadfilehelp和WorkingwithZipandGZipfilesinJava.虽然它们提供了分别从S3和GZip文件下载和处理文件的方法,但这些方法无助于处理位于S3中的GZip文件。我该怎么做?目前我有:try{AmazonS3s3Client=newAmazonS3Client(newProfileCredentialsProvider());StringURL=downloadURL.getPrimitiveJavaObject(arg0[0].get());S3ObjectfileObj=s3Client.getObjec

java - 从 S3 存储桶获取文件大小

我正在尝试使用AmazonS3JAVAsdk获取文件大小(内容长度)。publicLonggetObjectSize(AmazonS3ClientamazonS3Client,Stringbucket,Stringkey)throwsIOException{Longsize=null;S3Objectobject=null;try{object=amazonS3Client.getObject(bucket,key);size=object.getObjectMetadata().getContentLength();}finally{if(object!=null){//object

java - 如何使用暂停/恢复支持上传到 S3?

我想知道如何使用“暂停和恢复”支持将文件上传到AmazonS3?(通过网络浏览器)。是否有可用的示例Web应用程序?任何编程语言/框架都可以。提前致谢。解决方案我实现了以下应用。GithubLink.它基于来自Condominios的示例应用程序和gem.全部归功于https://github.com/cotag/一个伟大的gem和工作。特点:-Pause/Resumesupport~5MBchunks-LargeFileUpload-ProgressBar-NoJavaApplet/NoFlash-Registrationsystemviadevise 最

java - Spark - 方案 : https, 的无文件系统无法从 Amazon S3 加载文件

我正在尝试通过以下方式从AmazonS3存储桶加载一些数据:SparkConfsparkConf=newSparkConf().setAppName("Importer");JavaSparkContextctx=newJavaSparkContext(sparkConf);HiveContextsqlContext=newHiveContext(ctx.sc());DataFramemagento=sqlContext.read().json("https://s3.eu-central-1.amazonaws.com/*/*.json");最后一行会抛出一个错误:Exception