s3fs

python - 如何将标签添加到 boto (Amazon S3) 中的 key ？

我正在尝试标记已上传到S3的key。在下面的同一行中，我只是从一个字符串创建一个文件。获得key后，我不确定如何标记文件。我试过Tag和TagSet。fromboto.s3.bucketimportBucketfromboto.s3.keyimportKeyfromboto.s3.taggingimportTag,TagSetk=Key(bucket)k.key='foobar/somefilename'k.set_contents_from_string('somedatainfile')Tag(k,'the_tag') 最佳答案

python - Google App Engine 和 Amazon S3 文件上传

我知道之前有人问过这个问题，但确实没有明确的答案。我的问题是我为GAE构建了一个文件上传脚本，之后才发现，您最多只能存储aprox的文件。数据存储中的1MB。如果您能告诉我，如果我启用计费，1MB限制已成为历史，但我对此表示怀疑，我可以在这里阻止您。我需要能够上传每个文件最多20mb，所以我想也许我可以使用Amazon的S3。关于如何实现这一目标的任何想法？有人告诉我使用GAE+Ec2和S3的组合，但我不知道这将如何工作。谢谢，最大最佳答案来自AmazonS3documentation:用户打开网络浏览器并访问您的网页。您的网页

python Google section Amazon 传到 google-app-engine amazon-s3 amazon-ec2

python - 如何在 Python 中使用 Pandas 从 s3 存储桶中读取 csv 文件

我正在尝试使用以下代码将位于AWSS3存储桶中的CSV文件作为pandas数据帧读取到内存中:importpandasaspdimportbotodata=pd.read_csv('s3:/example_bucket.s3-website-ap-southeast-2.amazonaws.com/data_1.csv')为了提供完整的访问权限，我在S3存储桶上设置了存储桶策略，如下所示:{"Version":"2012-10-17","Id":"statement1","Statement":[{"Sid":"statement1","Effect":"Allow","Princip

何在 python 34 section import amazon-web-services pandas amazon-s3

python - 使用 Python 通过流将数据从 FTP 服务器传输到 S3 时出现问题

我希望将文件夹的内容从ftp服务器传输到s3中的存储桶，而无需写入磁盘。目前，s3正在获取文件夹中所有文件的名称，但没有实际数据。文件夹中的每个文件只有几个字节。我不太清楚为什么它没有上传整个文件。fromftplibimportFTPimportioimportboto3s3=boto3.resource('s3')ftp=FTP('ftp.ncbi.nlm.nih.gov')ftp.login()ftp.cwd('pubchem/RDF/descriptor/compound')address='ftp.ncbi.nlm.nih.gov/pubchem/RDF/descriptor

时出 python ftp section 39 amazon-s3

python - PySpark 使用 IAM 角色访问 S3

我想知道PySpark是否支持使用IAM角色访问S3。具体来说，我有一个业务限制，我必须担任AWS角色才能访问给定的存储桶。这在使用boto时很好(因为它是API的一部分)，但我找不到关于PySpark是否支持开箱即用的明确答案。理想情况下，我希望能够在本地以独立模式运行时承担一个角色，并将我的SparkContext指向该s3路径。我已经看到非IAM调用通常遵循:spark_conf=SparkConf().setMaster('local[*]').setAppName('MyApp')sc=SparkContext(conf=spark_conf)rdd=sc.textFile(

PySpark python code section gt amazon-web-services amazon-s3 amazon-iam

python - S3Cmd 不适用于 S3 Ninja

我正在尝试将我的本地s3ninja与s3cmd一起使用。每个命令都像:s3cmdlss3://test抛出相同的异常。s3cfg似乎没问题，调用的端点是正确的。有人能够将s3ninja与s3cmd一起使用吗？PS:我知道S3并不昂贵，而且有许多更好的方法可以针对S3进行测试。我出于其他原因需要S3Ninja。调试信息如下:DEBUG:ConfigParser:Readingfile'/Users/daniel/.s3cfg'DEBUG:ConfigParser:access_key->AK...17_chars...EDEBUG:ConfigParser:access_token->D

python S3Cmd ConfigParser DEBUG gt amazon-web-services amazon-s3

python - boto.s3 : copy() on a key object loses 'Content-Type' metadata

下面是一些复制S3key的示例代码。您可能想要这样做的原因有很多，其中之一就是更新关键元数据。虽然这似乎是广泛接受的解决方案，但存在一个大问题。问题是当我执行下面的示例时，我实际上丢失了我的Content-Type，它默认返回到“application/octet-stream”(如果尝试提供网络图像则不是很有用)。#Getbucketconn=S3Connection(self._aws_key,self._aws_secret)bucket=conn.get_bucket(self._aws_bucket)#Createkeyk=Key(bucket)k.key=key#Copyo

Content-Type amp bucket key section python amazon-s3 boto

python - 通过django storages boto s3将二进制数据保存到模型上的文件中

我正在从echosignAPI中提取一个pdf，它提供了一个文件的字节数。我正在尝试获取这些字节并将它们保存到botos3支持的FileField中。我运气不太好。这是我得到的最接近的，但它在保存“扬声器”时出错，而且pdf虽然写入S3，但似乎已损坏。这里speaker是我的模型的一个实例，fileData是从echosignapi返回的'bytes'字符串afile=speaker.the_file=S3BotoStorageFile(filename,"wb",S3BotoStorage())afile.write(fileData)afile.close()speaker.sav

storages python code section speaker django amazon-s3 django-storage

python - Django 在 S3 中存储上传的文件

我有一个使用DjangoREST框架向API使用者公开POST端点的类。该代码应该接收文件上传，然后将其上传到S3。文件正确上传到Django应用程序(file_obj.length返回实际文件大小)，并在S3中创建对象。但是，S3中的文件大小为零。如果我记录file_obj.read()的返回，它也是空的。怎么了？fromdjango.confimportsettingsfromrest_framework.viewsimportAPIViewfromrest_framework.responseimportResponsefromrest_framework.parsersimpo

python Django section import from amazon-s3 boto

python - 使用 boto 从 S3 流式传输 .gz 文件时无限循环

我正在尝试使用boto从S3流式传输.gz文件并遍历解压缩文本文件的行。神秘的是，循环永远不会终止；读取整个文件后，迭代从文件开头重新开始。假设我创建并上传了一个如下所示的输入文件:>echo'{"key":"value"}'>foo.json>gzip-9foo.json>awss3cpfoo.json.gzs3://my-bucket/my-location/然后我运行以下Python脚本:importbotoimportgzipconnection=boto.connect_s3()bucket=connection.get_bucket('my-bucket')key=buck

流式 python bucket section key amazon-s3 gzip boto

151 152 153154155 156 157