Task_草庐IT

python - 异步和协程与任务队列

我一直在阅读有关python3中的asyncio模块的内容，以及更广泛的有关python中的协程的信息，但我不知道是什么让asyncio成为如此出色的工具。我觉得你可以用协程做的所有事情，你可以通过使用基于多处理模块(例如celery)的任务队列做得更好。是否存在协程优于任务队列的用例？最佳答案不是一个正确的答案，而是一个无法放入评论的提示列表:您提到了multiprocessing模块(让我们也考虑一下threading)。假设您必须处理数百个套接字:您能生成数百个进程或线程吗？再次，对于线程和进程:您如何处理对共享资源的并发

python 异步 section code 套接字 task python-asyncio

python - 创建数据库连接并维护多个进程(多处理)

与我发布的另一篇文章类似，这篇文章回答了该帖子并创建了一个新问题。回顾:我需要更新空间数据库中的每条记录，其中我有一个点数据集覆盖多边形数据集。对于每个点要素，我想分配一个键以将其与它所在的多边形要素相关联。因此，如果我的点“纽约市”位于多边形USA内，并且对于美国多边形“GID=1”，我将为我的点纽约市分配“gid_fkey=1”。好的，这是使用多处理实现的。我注意到使用它的速度提高了150%，所以它确实有效。但我认为有一堆不必要的开销，因为每条记录都需要一个数据库连接。代码如下:importmultiprocessing,time,psycopg2classConsumer(mul

python 创建 self queue task database-connection multiprocessing

python - 创建数据库连接并维护多个进程(多处理)

与我发布的另一篇文章类似，这篇文章回答了该帖子并创建了一个新问题。回顾:我需要更新空间数据库中的每条记录，其中我有一个点数据集覆盖多边形数据集。对于每个点要素，我想分配一个键以将其与它所在的多边形要素相关联。因此，如果我的点“纽约市”位于多边形USA内，并且对于美国多边形“GID=1”，我将为我的点纽约市分配“gid_fkey=1”。好的，这是使用多处理实现的。我注意到使用它的速度提高了150%，所以它确实有效。但我认为有一堆不必要的开销，因为每条记录都需要一个数据库连接。代码如下:importmultiprocessing,time,psycopg2classConsumer(mul

python 创建 self queue task database-connection multiprocessing

python - 报告长期运行的 Celery 任务的结果

问题我已将长时间运行的任务分割成逻辑子任务，因此我可以在每个子任务完成时报告其结果。但是，我正在尝试报告一项实际上永远不会完成的任务的结果(而是在执行过程中产生值)，并且正在努力使用我现有的解决方案来做到这一点。背景我正在为我编写的一些Python程序构建一个Web界面。用户可以通过网络表单提交作业，然后回来查看作业的进度。假设我有两个函数，每个函数都通过单独的表单访问:med_func:大约需要1分钟的时间来执行，结果被传递给render()，它会产生额外的数据。long_func:返回一个生成器。每个yield大约需要30分钟，并且应该报告给用户。有这么多产量，我们可以认为这个迭代

python Celery code task session django

python - 报告长期运行的 Celery 任务的结果

问题我已将长时间运行的任务分割成逻辑子任务，因此我可以在每个子任务完成时报告其结果。但是，我正在尝试报告一项实际上永远不会完成的任务的结果(而是在执行过程中产生值)，并且正在努力使用我现有的解决方案来做到这一点。背景我正在为我编写的一些Python程序构建一个Web界面。用户可以通过网络表单提交作业，然后回来查看作业的进度。假设我有两个函数，每个函数都通过单独的表单访问:med_func:大约需要1分钟的时间来执行，结果被传递给render()，它会产生额外的数据。long_func:返回一个生成器。每个yield大约需要30分钟，并且应该报告给用户。有这么多产量，我们可以认为这个迭代

python Celery code task session django

python - 如何在 Airflow 上重新启动失败的任务

我正在使用LocalExecutor，而我的dag有3个任务，其中task(C)依赖于task(A)。Task(B)和task(A)可以像下面这样并行运行A-->CB所以task(A)失败了，但task(B)运行良好。任务(C)尚未运行，因为任务(A)已失败。我的问题是我如何单独重新运行Task(A)，以便Task(C)在Task(A)完成并且AirflowUI将它们标记为成功后运行。最佳答案在用户界面中:转到要更改的运行的dag和dag运行点击GraphView点击任务A点击“清除”这会让任务A再次运行，如果成功，任务C应该运

何在 Airflow strong section task python hadoop

python - 如何在 Airflow 上重新启动失败的任务

我正在使用LocalExecutor，而我的dag有3个任务，其中task(C)依赖于task(A)。Task(B)和task(A)可以像下面这样并行运行A-->CB所以task(A)失败了，但task(B)运行良好。任务(C)尚未运行，因为任务(A)已失败。我的问题是我如何单独重新运行Task(A)，以便Task(C)在Task(A)完成并且AirflowUI将它们标记为成功后运行。最佳答案在用户界面中:转到要更改的运行的dag和dag运行点击GraphView点击任务A点击“清除”这会让任务A再次运行，如果成功，任务C应该运

何在 Airflow strong section task python hadoop

python - Google App Engine 任务队列如何工作？

我对使用队列执行任务感到困惑。我已经阅读了文档，我以为我理解了bucket_size和rate，但是当我将20个任务发送到一个设置为5/h、大小为5的队列时，所有20个任务会尽快一个接一个地执行，不到1分钟。deferred.defer(spam.cookEggs,egg_keys,_queue="tortoise")-name:tortoiserate:5/hbucket_size:5我想要的是创建10个还是100个任务，我只希望每小时运行5个。因此，完成20个任务大约需要4个小时。我希望他们的处决分散开来。更新问题是我假设在本地运行时，遵循了任务执行率规则，但事实并非如此。您无法在

python Google section 执行率 size google-app-engine queue task

python - Google App Engine 任务队列如何工作？

我对使用队列执行任务感到困惑。我已经阅读了文档，我以为我理解了bucket_size和rate，但是当我将20个任务发送到一个设置为5/h、大小为5的队列时，所有20个任务会尽快一个接一个地执行，不到1分钟。deferred.defer(spam.cookEggs,egg_keys,_queue="tortoise")-name:tortoiserate:5/hbucket_size:5我想要的是创建10个还是100个任务，我只希望每小时运行5个。因此，完成20个任务大约需要4个小时。我希望他们的处决分散开来。更新问题是我假设在本地运行时，遵循了任务执行率规则，但事实并非如此。您无法在

python Google section 执行率 size google-app-engine queue task

python - 如何将 @shared_task 装饰器用于基于类的任务？

如documentation中所示@shared_task装饰器让您无需任何具体的应用实例即可创建任务。给出的示例展示了如何装饰基于函数的任务。你能帮我理解如何装饰基于类的任务吗？最佳答案引用celery-users线程中的Ask，他解释了@task和@shared_task之间的区别。HereislinktothethreadTL;DR;@shared_task将为每个应用程序创建任务的独立实例，使任务可重用。@task(shared=True)和@shared_task有区别默认情况下，任务装饰器将在应用程序之间共享任务，因

shared_task 装饰 app shared python celery