草庐IT

Amazon-S

全部标签

Python 和 Amazon EC2——推荐的库?

关闭。这个问题不符合StackOverflowguidelines.它目前不接受答案。我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题,以便用事实和引用来回答。关闭7年前。Improvethisquestion为python推荐什么库来完成所有与AmazonEC2相关的事情?我遇到了boto和libcloud。哪个更容易使用?libcloud是否提供与boto相同的功能?

python - 在 Amazon 的 DynamoDB 中编写分布式队列

我正在寻找使用Python将大量高分辨率图像(数百万)目录转换为缩略图。我有一个DynamoDB表,用于存储S3中每个图像的位置。与其在一个EC2实例上处理所有这些图像(需要数周时间),不如使用一组实例编写一个分布式应用程序。我可以使用什么技术来编写一个队列,允许节点从数据库中“checkout”图像、调整图像大小,并使用生成的缩略图的新尺寸更新数据库?具体来说,我担心原子性和并发性——如何使用DynamoDB防止两个节点同时checkout同一个作业? 最佳答案 您可以采用的一种方法是使用Amazon'sSimpleQueueSe

python - 使用 SQLAlchemy 连接到 Amazon Aurora

我正在尝试使用SSL连接通过SQLAlchemy连接到AmazonAurora,将IAM角色指定为数据库用户帐户并将身份验证token指定为密码,如[AWS文档]中所述(http://docs.aws.amazon.com/AmazonRDS/latest/UserGuide/UsingWithRDS.IAMDBAuth.html#UsingWithRDS.IAMDBAuth.Connecting)这些是我遵循的步骤。wgethttps://s3.amazonaws.com/rds-downloads/rds-combined-ca-bundle.pemexportLIBMYSQL_E

python - 使 python 脚本在 Amazon EC2 上永远运行

我有一个基本上永远运行的python脚本,它每秒检查一次网页,如果有任何值更改会通知我。我将它放在AWSEC2实例上并通过ssh运行它。启动后半小时左右检查时,脚本运行良好。问题是几个小时后我再次检查时,ssh已经关闭。当我重新登录时,没有程序在运行。我检查了所有正在运行的进程,但没有任何运行。谁能教我如何让它在AWSEC2实例上永远运行(或直到我停止它)?非常感谢。编辑:我使用AWS提供的JavaSSHClient来运行脚本 最佳答案 您可以使用Linuxscreen。Linuxscreen工具不仅可以让您免于断线的灾难,还可以通

python - 如何通过 Python Boto3 将数据加载到 Amazon Redshift?

在AmazonRedshift的GettingStartedGuide中,数据从AmazonS3中提取并使用SQLWorkbench/J加载到AmazonRedshift集群中。我想模拟使用Boto3连接到集群并将样本数据加载到集群的相同过程。.然而在Boto3'sdocumentation对于Redshift,我找不到一种方法可以将数据上传到AmazonRedshift集群。我已经能够使用Boto3通过以下代码连接到Redshift:client=boto3.client('redshift')但我不确定哪种方法可以让我创建表或将数据上传到AmazonRedshift,就像在tuto

python - 在 Amazon EC2 上安装 numpy

我在AmazonEC2服务器上安装numpy时遇到问题。我尝试在虚拟环境中使用easy_install、pip、pip,在另一个使用python2.7的虚拟环境中使用pip...每次我尝试时,它都会失败并出现错误:gcc:internalcompilererror:Killed(programcc1),然后再往下我会得到一堆python错误,使用easy_installIget:ImportError:Nomodulenamednumpy.distutils,使用pip我得到:UnicodeDecodeError:'ascii'codeccan'tdecodebyte0xe2inpos

python - mrjob:无效的引导操作路径,必须是 Amazon S3 中的一个位置

我在Windows7上。我安装了mrjob,当我运行exampleword_countfile时从网站上看,它在本地机器上运行良好。但是,我在尝试在AmazonEMR上运行它时遇到错误。我什至测试了仅使用boto连接到amazons3并且它有效。mrjob.conf文件runners:emr:aws_access_key_id:xxxxxxxxxxxxxaws_region:us-east-1aws_secret_access_key:xxxxxxxxec2_key_pair:bzyec2_key_pair_file:C:\aa.pemec2_instance_type:m1.smal

python - 如何在 Amazon S3 上存储 scrapy 图像?

我已经使用Scrapy大约1周了,想将图像存储到amazonS3,他们提到他们支持将图像上传到amazonS3,但没有记录。那么有人知道如何将AmazonS3与Scrapy一起使用吗?这是他们关于mediapipeline的Scrapy文档. 最佳答案 您需要3个设置:AWS_ACCESS_KEY_ID="xxxxxx"AWS_SECRET_ACCESS_KEY="xxxxxx"IMAGES_STORE="s3://bucketname/base-key-dir-if-any/"就是这样,即。图像将使用在http://readthe

python - 如何测试依赖于 boto 和 Amazon AWS 服务的模块?

我正在围绕boto.dynamodb.layer2编写一个非常小的PythonORM。我想为它编写测试,但我不希望测试实际与AWS通信,因为这需要复杂的设置、凭证、网络访问等。由于我计划开源该模块,在源代码中包含凭据似乎不是一个好主意,因为我会收取使用费,并且在环境中包含凭据很痛苦。将我的测试耦合到网络似乎是个坏主意,因为它会使测试运行得更慢,或者可能由于网络错误或节流而导致测试失败。我的目标不是测试boto的DynamoDB接口(interface)或AWS。我只是想测试我自己的代码。我打算使用unittest2编写测试和mock模拟boto进入网络的部分,但我以前从未这样做过,所以

python - 每当队列中有内容时,Amazon 的 SQS 如何通知我的 "worker"服务器之一?

我正在学习本教程:http://boto.s3.amazonaws.com/sqs_tut.html当队列中有东西时,我如何分配我的20个工作人员中的一个来处理它?我正在使用Python。 最佳答案 不幸的是,SQS缺少一些我们经常期望在队列中使用的语义。没有通知或任何类型的阻塞“获取”调用。亚马逊的相关SNS/简单通知服务可能对您有所帮助。将工作添加到队列后,您可以向订阅的工作人员发送通知。另见:http://aws.amazon.com/sns/BestpracticesforusingAmazonSQS-Pollingtheq