草庐IT

worker-pool

全部标签

python - Worker 启动,然后关闭。没有错误

我在启动celery任务时遇到问题。当您在本地运行以下命令时celery-Acodebaseworker--loglevel=debug--beat我得到以下响应/local/lib/python2.7/site-packages/twisted/internet/endpoints.py:30:DeprecationWarning:twisted.internet.interfaces.IStreamClientEndpointStringParserwasdeprecatedinTwisted14.0.0:ThisinterfacehasbeensupersededbyIStrea

梳理 Web Worker 及实战场景

前言有一些前端技术点,即使以前用过,但没有自己动手归纳总结过,许久还是要回过头来还是需要重新梳理。于是,本文就来梳理一下WebWorker。为什么需要WebWorker由于JavaScript语言采用的是单线程,同一时刻只能做一件事,如果有多个同步计算任务执行,则在这段同步计算逻辑执行完之前,它下方的代码不会执行,从而造成了阻塞,用户的交互也可能无响应。但如果把这段同步计算逻辑放到WebWorker执行,在这段逻辑计算运行期间依然可以执行它下方的代码,用户的操作也可以响应了。WebWorker是什么HTML5提供并规范了WebWorker这样一套API,它允许一段JavaScript程序运行在

python - Django 中所有 Celery worker/内存缓存的全局可访问对象

我有非常标准的Django+Rabbitmq+Celery设置,有1个Celery任务和5个worker。任务将相同(我简化了一点)大文件(~100MB)异步上传到多个远程PC。一切都以使用大量内存为代价运行良好,因为每个任务/工作人员都将那个大文件单独加载到内存中。我想做的是拥有某种缓存,所有任务都可以访问,即只加载一次文件。基于locmem的Django缓存将是完美的,但正如文档所说:“每个进程都有自己的私有(private)缓存实例”,我需要所有工作人员都可以访问此缓存。尝试使用#2129820中描述的Celery信号,但这不是我需要的。所以问题是:有没有一种方法可以在Celer

python - 通知 worker 关闭的 celery 任务

我将celery2.4.1与python2.6、rabbitmq后端和django一起使用。如果工作人员关闭,我希望我的任务能够正确清理。据我所知,您无法提供任务析构函数,因此我尝试连接到worker_shutdown信号。备注:AbortableTask仅适用于数据库后端,所以我不能使用它。fromcelery.signalsimportworker_shutdown@taskdefmytask(*args)obj=DoStuff()defshutdown_hook(*args):print"Workershuttingdown"#cleanupnicelyobj.stop()wor

python - 在 gunicorn workers 之间共享一把锁

有没有一种在gunicornworkers之间共享多处理锁的好方法?我正在尝试用Flask编写一个jsonAPI。一些API调用将与管理正在运行的进程的python类交互(如用于视频转换的ffmpeg)。当我将WebWorker的数量扩大到1个以上时,如何确保只有1个Worker同时与类(class)互动?我最初的想法是使用multiprocessing.Lock以便start()函数可以是原子的。我认为我没有找到创建锁的正确位置,以便所有工作人员共享一个锁:#runserver.pyfromflaskimportFlaskfromwerkzeug.contrib.fixersimpo

python 素数处理 : processing pool is slower?

所以最近几天我一直在摆弄python的多处理库,我真的很喜欢处理池。它很容易实现,我可以想象出很多用途。我已经完成了几个我以前听说过的项目来熟悉它,最近完成了一个暴力破解刽子手游戏的程序。任何人,我正在做一个执行时间比较,对单线程和处理池中100万到200万之间的所有素数求和。现在,对于hangmancruncher来说,将游戏放在处理池中可以将执行时间提高大约8倍(i7具有8个内核),但是当磨掉这些素数时,它实际上增加处理时间几乎是4倍。谁能告诉我这是为什么?这是供有兴趣查看或测试它的任何人使用的代码:#!/user/bin/python.exeimportmathfrommulti

python - 在 uwsgi 应用程序中启动 APScheduler 最终会为每个 worker 分配一个调度程序吗?

我有一个flask应用程序,我需要APScheduler的调度功能。问题是:我在哪里启动调度程序实例?我使用uwsgi+nginx为这个应用程序提供多个worker,我最终不会得到多个Scheduler实例,它们会相互忽略吗?如果这是正确的,一个作业会被触发多次,不是吗?在这种情况下最好的策略是什么,这样我最终只有一个Scheduler实例并且仍然能够从计划的作业中访问应用程序的上下文?Thisquestion尽管使用gunicorn而不是uwsgi也有同样的问题,但答案可能是相似的。下面是将“app”定义为uwsgi可调用应用程序对象的代码。包含此代码的文件称为wsgi.py(无关紧

python - 如何使用 Python 多处理 Pool.map 在 for 循环中填充 numpy 数组

我想在for循环中填充一个2D-numpy数组,并通过使用多处理来加快计算速度。importnumpyfrommultiprocessingimportPoolarray_2D=numpy.zeros((20,10))pool=Pool(processes=4)deffill_array(start_val):returnrange(start_val,start_val+10)list_start_vals=range(40,60)forlineinxrange(20):array_2D[line,:]=pool.map(fill_array,list_start_vals)pool

python - 避免在 multiprocessing.Pool worker 中使用全局变量来获取不可篡改的共享状态

我经常发现自己用Python编写程序,构建一个大型(兆字节)只读数据结构,然后使用该数据结构分析一个非常大(总共数百兆字节)的小记录列表。每条记录都可以并行分析,所以一个自然的模式是设置只读数据结构并将其分配给全局变量,然后创建一个multiprocessing.Pool。(通过fork将数据结构隐式复制到每个工作进程中),然后使用imap_unordered并行处理记录。这种模式的骨架看起来像这样:classifier=Nonedefclassify_row(row):returnclassifier.classify(row)defclassify(classifier_spec,

python - Gunicorn worker 无论如何都会超时

我正在尝试通过gunicorn运行一个简单的flask应用程序,但无论我做什么,我的工作人员都会超时。无论是否存在针对应用程序的事件,无论我将timeout值设置为什么,工作人员都将始终超时。是什么导致他们超时?当我发出请求时,请求成功通过,但工作人员仍然超时。这是我正在运行的:gunicorntest_app.py-b127.0.0.1:8000--log-level=debug--log-file/tmp/log*Runningonhttp://127.0.0.1:5000/127.0.0.1--[28/Aug/201411:23:50]"GET/HTTP/1.1"200-127.