S3NativeFileSystem

python - Boto3:仅从 S3 资源中抓取选定的对象

我可以通过抓取和读取我的AWSS3存储桶中的所有对象s3=boto3.resource('s3')bucket=s3.Bucket('my-bucket')all_objs=bucket.objects.all()forobjinall_objs:pass#filteronlytheobjectsIneed然后obj.key会给我桶内的路径。有没有一种方法可以预先过滤那些符合特定起始路径(存储桶中的目录)的文件，这样我就可以避免循环遍历所有对象并在以后进行过滤？最佳答案使用过滤器[1],[2]类似桶的集合方法。s3=boto3.

python - 如果我们想使用 S3 来托管 Python 包，我们如何告诉 pip 在哪里可以找到最新版本？

我们正在尝试提出一个解决方案，让AWSS3托管和分发我们的Python包。基本上我们想要做的是使用python3setup.pybdist_wheel创建一个轮子。将其上传到S3。然后任何服务器或任何机器都可以执行pipinstall$http://path/on/s3。(包括AWSlambda中的virtualenv)(我们调查了Pypicloud并认为这是一种矫枉过正。)从S3创建包和安装工作正常。这里只有一个问题:我们将发布新代码并给他们不同的版本。如果我们在Pypi上托管我们的代码，您可以通过调用pipinstallpackage--upgrade将一些包升级到最新版本。但是如

python code awesomepy strong amazon-s3 pip

python - S3 使用 boto 和 SigV4 - 缺少主机参数

在开发时，我在爱尔兰使用了一个S3桶，效果很好。对于生产，我想使用S3的新“法兰克福”位置，但显然新的法兰克福地区使用“SigV4”，它破坏了我的python脚本。将以下block添加到~/.boto时，出现以下错误:~/.boto:[s3]use-sigv4=True错误:File"/usr/lib/python2.6/site-packages/boto/__init__.py",line141,inconnect_s3returnS3Connection(aws_access_key_id,aws_secret_access_key,**kwargs)File"/usr/lib/

python SigV4 code boto section amazon-s3

python - 从 s3 获取 ogg 轨道的长度而不下载整个文件

如何在不下载整个文件的情况下获取ogg文件的播放长度？我知道这是可能的，因为HTML5标签和VLC都可以在加载URL后立即显示整个播放长度，而无需下载整个文件。是否有标题或我可以阅读的内容。甚至比特率，我可以将其除以文件大小以获得大概的播放长度？最佳答案不幸的是，似乎没有办法实现这一目标。Mozilla的ConfiguringserversforOggmedia很有指导意义。基本上:Gecko使用X-Content-Durationheader-由web服务器发送(如果有的话)。这解释了您提出的HTML5音频流示例。如果丢失，则

不下 python section header noreferrer ogg

python - 将 Django-Storages 与亚马逊 S3 和 https 一起使用

我们有一个使用django-storages上传到AWS的图片uploader。现在它通过http发送图像，但我们希望它使用https。谷歌搜索没有帮助我找到配置django-storages的方法。有谁知道完成此任务的最佳方法，或者任何可以为我指明正确方向的文档。最佳答案查看source您似乎可以通过设置AWS_S3_SECURE_URLS=True来启用HTTPS。关于python-将Django-Storages与亚马逊S3和https一起使用，我们在StackOverflo

Django-Storages Storages section python django python-django-storages

python - django S3 - 修剪图像字段文件名而不是 url 路径

这是我在这里的问题的跟进:ImageField/FileFieldDjangoformCurrentlyunabletotrimthepathtofilename在我的Django应用程序中，有一个图像字段上传到S3修剪图像文件路径名后，由于修剪了url，因此无法访问图像。如何修剪显示但不修剪路径？我设法像这样修剪显示文件名的显示classCustomClearableFileInput(ClearableFileInput):defget_context(self,name,value,attrs):logging.debug("%s",name)logging.debug("%s"

python django code value widget amazon-s3 imagefield

python - 在 S3 上存储静态文件，但在本地显示 staticfiles.json

我有一个在Heroku上运行的Django应用程序。为了存储和提供我的静态文件，我正在使用django-storages使用我的S3存储桶，以及标准的DjangoManifestFilesMixin。我也在使用django-pipeline.在代码中:fromdjango.contrib.staticfiles.storageimportManifestFilesMixinfromstorages.backends.s3botoimportS3BotoStoragefrompipeline.storageimportPipelineMixinclassS3PipelineManifes

staticfiles python code section django amazon-s3 deployment django-storage

python - 将 boto 用于 AWS S3 Buckets for Signature V4

我在为法兰克福地区的S3存储桶使用Python-BotoSDK时遇到问题。根据Amazonlink该区域将仅支持V4。这document说明如何为BotoSDK添加V4支持。我添加了一个新部分:ifnotboto.config.get('s3','use-sigv4'):boto.config.add_section('s3')boto.config.set('s3','use-sigv4','True')然后我创建了新连接并获取了所有存储桶:connection=S3Connection(accesskey,secretkey,host=S3Connection.DefaultHos

Signature Buckets section code 39 python amazon-web-services amazon-s3 boto

python - 将 Amazon S3 与 Heroku、Python 和 Flask 结合使用

我正在尝试使用Flask在Heroku上运行一个简单的图像上传应用程序。我在这里学习教程:http://flask.pocoo.org/docs/patterns/fileuploads/但是，我想使用S3来存储文件而不是临时目录，因为Heroku不允许您写入磁盘。我找不到任何具体针对Heroku和Flask执行此操作的示例。最佳答案在我看来，在将上传文件存储到临时文件的示例代码中，您只需替换file.save(os.path.join(app.config['UPLOAD_FOLDER'],filename))使用将文件上传到

python Amazon section file filename file-upload heroku amazon-s3 flask

python - 如何从 S3 读取 Parquet 数据以激发 Python 数据框？

我是Spark的新手，我找不到这个...我有很多Parquet文件上传到s3的位置:s3://a-dps/d-l/sco/alpha/20160930/parquet/此文件夹的总大小为20+Gb。如何分block并将其读入数据帧如何将所有这些文件加载到数据框中？分配给spark集群的内存为6GB。frompysparkimportSparkContextfrompyspark.sqlimportSQLContextfrompysparkimportSparkConffrompyspark.sqlimportSparkSessionimportpandas#SparkConf().

据以 Parquet FileSystem scala apache python apache-spark amazon-s3 pyspark