草庐IT

S3FileSystem

全部标签

python - 使用 boto3 清空 s3 存储桶的最快方法是什么?

我正在考虑删除然后重新创建存储桶(我后来意识到的错误选择)。那么如何删除桶中的所有对象呢?我试过这个:http://boto3.readthedocs.io/en/latest/reference/services/s3.html#S3.Bucket.delete_objects但它会删除多个对象而不是全部。你能建议什么是清空水桶的最佳方法吗? 最佳答案 只需使用awscli.awss3rms3://mybucket--recursive好吧,如果您坚持使用boto3,则需要更长的答案。这将向s3发送一个删除标记。无需文件夹处理。b

python - 有什么方法可以使用 boto3 将文件直接写入 S3?

我编写了一个python脚本来处理非常大的文件(总共几TB),我将在EC2实例上运行它。之后,我想将处理后的文件存储在S3存储桶中。目前,我的脚本首先将数据保存到磁盘,然后将其上传到S3。不幸的是,考虑到等待实例首先写入磁盘然后上传所花费的额外时间,这将是非常昂贵的。有什么方法可以使用boto3将文件直接写入S3bucket吗?编辑:为了澄清我的问题,我问我是否在内存中有一个对象,将该对象直接写入S3而没有先将对象保存到磁盘上。 最佳答案 您可以使用put_object为了这。只需将您的文件对象作为正文传递即可。例如:importb

python - Django 1.8 缓存破坏 + Amazon S3

我一直在做一些研究,我找到了解释如何使用Django(1.8)缓存破坏的文章,但他们没有解释我的情况。我在settings.py中通过以下设置使用S3(并且可以正常工作):STATICFILES_STORAGE='pms.s3utils.StaticRootS3BotoStorage'为了使用缓存破坏docs假设我必须设置:STATICFILES_STORAGE='django.contrib.staticfiles.storage.ManifestStaticFilesStorage'我不知道要使用什么设置才能同时使用S3和缓存清除。谢谢! 最佳答案

python - 在谷歌云上训练神经网络时出现 "Unable to get Filesystem for path"错误

我正在使用GoogleCloud在云端训练神经网络,如下例所示:https://cloud.google.com/blog/big-data/2016/12/how-to-classify-images-with-tensorflow-using-google-cloud-machine-learning-and-cloud-dataflow首先,我将以下内容设置为环境变量:PROJECT_ID=$(gcloudconfiglistproject--format"value(core.project)")BUCKET_NAME=${PROJECT_ID}-mlengine然后我使用以下

python - 如何使用 csv.DictReader 读取存储在 S3 中的 csv?

我有获取AWSS3对象的代码。我如何使用Python的csv.DictReader读取这个StreamingBody?importboto3,csvsession=boto3.session.Session(aws_access_key_id=,aws_secret_access_key=,region_name=)s3_resource=session.resource('s3')s3_object=s3_resource.Object(,)streaming_body=s3_object.get()['Body']#csv.DictReader(???)

python - 无法在 S3 中设置文件内容类型

如何通过Pythonboto模块在支持虚拟主机的S3帐户中的文件上设置内容类型?我在做:fromboto.s3.connectionimportS3Connectionfromboto.s3.keyimportKeyfromboto.cloudfrontimportCloudFrontConnectionconn=S3Connection(access_key_id,secret_access_key)bucket=conn.create_bucket('mybucket')b=conn.get_bucket(bucket)b.set_acl('public-read')fn='ind

python - eclipse ,PyDev "interpreter does not exist in filesystem"

我最近想开始使用python进行编程,因此使用PyDev设置了我的eclipse。现在,我遵循了中的分步教程http://pydev.org/manual_101_interpreter.html但是当我创建我的第一个PyDev项目时我得到了错误:"Theinterpreterconfigureddoesnotexistinthefilesystem:python"我正在使用Eclipse4.3、Python2.7,并且我通过eclipse的“安装新软件”选项安装了PyDev。我没有配置任何Jython/IronPython解释器,以下是我的python解释器首选项的样子:任何帮助将不

python - Boto S3 偶尔会抛出 httplib.IncompleteRead

我有几个守护进程使用boto从AmazonS3读取许多文件。每隔几天,我就会遇到一种情况,即httplib.IncompleteRead从boto的深处被抛出。如果我尝试重试该请求,它会立即因另一个IncompleteRead而失败。即使我调用bucket.connection.close(),所有进一步的请求仍然会出错。我觉得我可能在这里偶然发现了boto中的一个错误,但似乎没有其他人遇到过它。难道我做错了什么?所有守护进程都是单线程的,我尝试过两种方式设置is_secure。Traceback(mostrecentcalllast):...File"line22,innextlin

python - 亚马逊 AWS S3 基于浏览器的上传使用 POST -

我正在构建一个包含文件上传功能的网络应用程序。我的目标是启动用户直接上传到S3存储桶。该策略是预先签署一个将作为表单提交的POST请求。障碍是SignatureDoesNotMatch错误-据我所知,我已经遵守了文档,并且探索了很多选项,但仍然无法解决。我能够生成预先签名的下载链接。引用:AWSPOSTdocumentationExampleboto3generate_presigned_postreference生成签名请求:defs3_upload_creds(name,user):s3=boto3.client('s3')key='${filename}'region='us-e

python - amazon s3 get_key成功后指定的key不存在

我正在使用python和boto这是我的代码:key=bucket.get_key(key_name)ifnotkey:print'error,keydoesnotexist'returndata=key.get_contents_as_string()有时(随机出现)我得到这个异常:S3ResponseError:S3ResponseError:404NotFound注意:文件由一台服务器上传,紧接着另一台服务器(位于不同大陆)正在运行上面的代码。回溯:Traceback(mostrecentcalllast):File"/test.py",line222,in_process_re