草庐IT

S3CryptoModuleBase

全部标签

python - mrjob:无效的引导操作路径,必须是 Amazon S3 中的一个位置

我在Windows7上。我安装了mrjob,当我运行exampleword_countfile时从网站上看,它在本地机器上运行良好。但是,我在尝试在AmazonEMR上运行它时遇到错误。我什至测试了仅使用boto连接到amazons3并且它有效。mrjob.conf文件runners:emr:aws_access_key_id:xxxxxxxxxxxxxaws_region:us-east-1aws_secret_access_key:xxxxxxxxec2_key_pair:bzyec2_key_pair_file:C:\aa.pemec2_instance_type:m1.smal

python - 一段时间后,将 Django 的 collectstatic 与 boto S3 一起使用会抛出 "Error 32: Broken Pipe"

我将boto与S3结合使用来存储我的Django站点的静态文件。使用collectstatic命令时,它会完美地上传大量文件,然后在文件处停止并抛出“错误32:损坏的管道。”当我尝试运行再次命令,它会跳过它已经上传的文件并从它停止的文件开始,然后在没有上传任何新内容的情况下抛出相同的错误。 最佳答案 关键似乎是指定哪个AWSEndpoint你的桶位于。我尝试了很多不同的方法,但最终对我有用的解决方案是为boto创建一个配置文件,如documentation中指定的那样。.这是我在~/.boto创建的配置文件的内容:[Credenti

python - 从 S3 开始的 Luigi Pipeline

我的初始文件在AWSS3中.有人可以指出我需要如何在LuigiTask中设置它吗??我查看了文档并找到了luigi.S3但我不清楚该怎么做,然后我在网上搜索并只获得来自mortar-luigi的链接。并在luigi之上实现。更新按照为@matagus提供的示例(我也按照建议创建了~/.boto文件):#coding:utf-8importluigifromluigi.s3importS3Target,S3ClientclassMyS3File(luigi.ExternalTask):defoutput(self):returnS3Target('s3://my-bucket/19170

python - AWS BOTO3 S3 python - 调用 HeadObject 操作 : Not Found 时发生错误 (404)

我正在尝试下载s3存储桶中的目录。我正在尝试使用传输从S3存储桶下载目录,但出现错误“调用HeadObject操作时发生错误(404):未找到”。请帮忙。S3structure:**BucketFolder1File1**注意:正在尝试下载Folder1transfer.download_file(self.bucket_name,self.dir_name,self.file_dir+self.dir_name) 最佳答案 我最近遇到了同样的问题。您可能拼错了路径和文件夹名称。例如,就我而言,我弄乱了“/”。要解决此问题,请确保您

python - 读取由 s3 事件触发的文件

这是我想做的:用户将csv文件上传到AWSS3存储桶。上传文件后,S3存储桶会调用我创建的lambda函数。我的lambda函数读取csv文件内容,然后发送包含文件内容和信息的电子邮件本地环境无服务器框架版本1.22.0python2.7这是我的serverless.yml文件service:aws-python#NOTE:updatethiswithyourservicenameprovider:name:awsruntime:python2.7stage:devregion:us-east-1iamRoleStatements:-Effect:"Allow"Action:-s3:*

python - 如何在 Amazon S3 上存储 scrapy 图像?

我已经使用Scrapy大约1周了,想将图像存储到amazonS3,他们提到他们支持将图像上传到amazonS3,但没有记录。那么有人知道如何将AmazonS3与Scrapy一起使用吗?这是他们关于mediapipeline的Scrapy文档. 最佳答案 您需要3个设置:AWS_ACCESS_KEY_ID="xxxxxx"AWS_SECRET_ACCESS_KEY="xxxxxx"IMAGES_STORE="s3://bucketname/base-key-dir-if-any/"就是这样,即。图像将使用在http://readthe

python - 如何使用 django (python) 和 s3 上传文件?

我正在寻找一种将文件上传到s3的方法。我正在使用Django。我目前正在使用亚马逊的python库以及以下代码进行上传:查看:defsubmitpicture(request):fuser=request.session["login"]copied_data=request.POST.copy()copied_data.update(request.FILES)content_type=copied_data['file'].get('content-type')ffile=copied_data['file']['content']key='%s-%s'%(fuser,''.joi

python - 将 S3 数据加载到 AWS SageMaker Notebook

我刚刚开始试验AWSSageMaker,想将数据从S3存储桶加载到我的SageMakerpythonjupyternotebook中的pandas数据框中进行分析。我可以使用boto从S3获取数据,但我想知道是否有更优雅的方法作为SageMaker框架的一部分在我的python代码中执行此操作?提前感谢您的任何建议。 最佳答案 importboto3importpandasaspdfromsagemakerimportget_execution_rolerole=get_execution_role()bucket='my-buck

python - 使用 boto3 将文件上传到 S3 时 file_upload() 和 put_object() 有什么区别

我正在使用boto3并尝试上传文件。如果有人能解释file_upload()和put_object()s3bucketmethods在boto3之间的确切区别,这将很有帮助>?有任何性能差异吗?这些人中有人在幕后处理分段上传功能吗?两者的最佳用例是什么? 最佳答案 upload_file方法由S3传输管理器处理,这意味着它会在必要时自动在后台为您处理分段上传。put_object方法直接映射到低级S3API请求。它不会为您处理分段上传。它将尝试在一个请求中发送整个正文。 关于python

python - 为什么 S3(与 boto 和 django-storages 一起使用)甚至为公共(public)文件提供签名 url?

这很奇怪。我混合了公共(public)文件和私有(private)文件。我想要公共(public)文件中的普通网址,以及私有(private)文件中的签名网址。我尝试将AWS_QUERYSTRING_AUTH更改为False,默认情况下,它在django-storages中为True。但是,当我更改它时,我的私有(private)文件url未签名(因此无法访问)。可能是我在这里遗漏了什么。有什么办法可以解决?提前致谢。 最佳答案 AWS_QUERYSTRING_AUTH设置默认行为,但您可以在创建S3BotoStorage实例时覆盖