草庐IT

python - IPython中带有多个参数的并行映射函数

coder 2023-05-22 原文

我正在尝试使用 IPython 的并行环境,到目前为止,它看起来很棒,但我遇到了问题。假设我有一个函数,在库中定义

def func(a,b):
   ...

当我想评估 a 的一个值和 b 的一堆值时使用它。

[func(myA, b) for b in myLongList]

显然,真正的函数更复杂,但问题的本质是它需要多个参数,我只想映射其中一个。问题是 map、@dview.parallel 等映射所有参数。

假设我想得到 func(myA, myLongList) 的答案。最明显的方法是使用 functools.partial 或

dview.map_sync(lambda b: func(myA, b),   myLongList)

但是,这在远程计算机上无法正常工作。原因是当 lambda 表达式被腌制时,不包括 myA 的值,而是使用远程机器上本地范围的 myA 的值。当闭包被腌制时,它们关闭的变量不会。

我能想到的两种实际可行的方法是为每个参数手动构建列表,并对所有参数进行映射,

dview.map_sync(func, [myA]*len(myLongList), myLongList)   

或者可怕地使用数据作为函数的默认参数,迫使它被腌制:

# Can't use a lambda here b/c lambdas don't use default arguments :(
def parallelFunc(b, myA = myA):
    return func(myA, b)

dview.map_sync(parallelFunc, myLongList)

真的,当真正的函数需要很多参数并且更复杂时,这一切似乎都被扭曲了。有一些惯用的方法吗?类似的东西

@parallel(mapOver='b')
def  bigLongFn(a, b):
   ...

但据我所知,不存在像“mapOver”这样的东西。我可能对如何实现它有一个想法......这只是一个非常基本的操作,应该存在支持,所以我想检查我是否遗漏了一些东西。

最佳答案

我可以对 batu 的答案进行一些改进(我认为这是一个很好的答案,但可能没有详细记录您为什么使用这些选项)。 ipython 文档目前在这一点上也严重不足。所以你的功能是这样的:

def myfxn(a,b,c,d):
  ....
  return z

并存储在一个名为 mylib 的文件中。假设 b、c 和 d 在您的运行过程中是相同的,因此您编写了一个 lambda 函数以将其简化为 1 参数函数。

import mylib
mylamfxn=lambda a:mylib.myfxn(a,b,c,d)

你想跑:

z=dview.map_sync(mylamfxn, iterable_of_a)

在梦境中,一切都会如此神奇地运作。但是,首先您会收到“未找到 mylib”的错误,因为 ipcluster 进程尚未加载 mylib。如有必要,请确保 ipcluster 进程在其 python 路径中具有“mylib”并且位于 myfxn 的正确工作目录中。然后你需要添加到你的python代码中:

dview.execute('import mylib')

在每个进程上运行 import mylib 命令。如果你再试一次,你会得到一个“全局变量 b 未定义”的错误,因为当变量在你的 python session 中时,它们不在 ipcluster 进程中。但是,python 提供了一种将一组变量复制到子进程的方法。继续上面的例子:

mydict=dict(b=b, c=c, d=d)
dview.push(mydict)

现在所有子进程都可以访问 b、c 和 d。然后你就可以运行了:

z=dview.map_sync(mylamfxn, iterable_of_a)

它现在应该可以像宣传的那样工作了。无论如何,我是使用 python 进行并行计算的新手,发现这个线程很有用,所以我想我会尝试帮助解释一些让我有点困惑的点......

最终的代码是:

import mylib

#set up parallel processes, start ipcluster from command line prior!
from IPython.parallel import Client
rc=Client()
dview=rc[:]

#...do stuff to get iterable_of_a and b,c,d....

mylamfxn=lambda a:mylib.myfxn(a,b,c,d)

dview.execute('import mylib')
mydict=dict(b=b, c=c, d=d)
dview.push(mydict)
z=dview.map_sync(mylamfxn, iterable_of_a)

这可能是让几乎所有令人尴尬的并行代码在 python 中并行运行的最快和最简单的方法....

UPDATE您也可以使用 dview 来推送所有数据而无需循环,然后使用 lview(即 lview=rc.load_balanced_view(); lview.map(...) 以负载平衡的方式进行实际计算。

关于python - IPython中带有多个参数的并行映射函数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11371009/

有关python - IPython中带有多个参数的并行映射函数的更多相关文章

  1. python - 如何使用 Ruby 或 Python 创建一系列高音调和低音调的蜂鸣声? - 2

    关闭。这个问题是opinion-based.它目前不接受答案。想要改进这个问题?更新问题,以便editingthispost可以用事实和引用来回答它.关闭4年前。Improvethisquestion我想在固定时间创建一系列低音和高音调的哔哔声。例如:在150毫秒时发出高音调的蜂鸣声在151毫秒时发出低音调的蜂鸣声200毫秒时发出低音调的蜂鸣声250毫秒的高音调蜂鸣声有没有办法在Ruby或Python中做到这一点?我真的不在乎输出编码是什么(.wav、.mp3、.ogg等等),但我确实想创建一个输出文件。

  2. ruby-on-rails - Rails 3 中的多个路由文件 - 2

    Rails2.3可以选择随时使用RouteSet#add_configuration_file添加更多路由。是否可以在Rails3项目中做同样的事情? 最佳答案 在config/application.rb中:config.paths.config.routes在Rails3.2(也可能是Rails3.1)中,使用:config.paths["config/routes"] 关于ruby-on-rails-Rails3中的多个路由文件,我们在StackOverflow上找到一个类似的问题

  3. ruby-on-rails - 在 Ruby 中循环遍历多个数组 - 2

    我有多个ActiveRecord子类Item的实例数组,我需要根据最早的事件循环打印。在这种情况下,我需要打印付款和维护日期,如下所示:ItemAmaintenancerequiredin5daysItemBpaymentrequiredin6daysItemApaymentrequiredin7daysItemBmaintenancerequiredin8days我目前有两个查询,用于查找maintenance和payment项目(非排他性查询),并输出如下内容:paymentrequiredin...maintenancerequiredin...有什么方法可以改善上述(丑陋的)代

  4. ruby-on-rails - Rails - 一个 View 中的多个模型 - 2

    我需要从一个View访问多个模型。以前,我的links_controller仅用于提供以不同方式排序的链接资源。现在我想包括一个部分(我假设)显示按分数排序的顶级用户(@users=User.all.sort_by(&:score))我知道我可以将此代码插入每个链接操作并从View访问它,但这似乎不是“ruby方式”,我将需要在不久的将来访问更多模型。这可能会变得很脏,是否有针对这种情况的任何技术?注意事项:我认为我的应用程序正朝着单一格式和动态页面内容的方向发展,本质上是一个典型的网络应用程序。我知道before_filter但考虑到我希望应用程序进入的方向,这似乎很麻烦。最终从任何

  5. ruby-on-rails - 如何在 ruby​​ 中使用两个参数异步运行 exe? - 2

    exe应该在我打开页面时运行。异步进程需要运行。有什么方法可以在ruby​​中使用两个参数异步运行exe吗?我已经尝试过ruby​​命令-system()、exec()但它正在等待过程完成。我需要用参数启动exe,无需等待进程完成是否有任何ruby​​gems会支持我的问题? 最佳答案 您可以使用Process.spawn和Process.wait2:pid=Process.spawn'your.exe','--option'#Later...pid,status=Process.wait2pid您的程序将作为解释器的子进程执行。除

  6. ruby - RSpec - 使用测试替身作为 block 参数 - 2

    我有一些Ruby代码,如下所示:Something.createdo|x|x.foo=barend我想编写一个测试,它使用double代替block参数x,这样我就可以调用:x_double.should_receive(:foo).with("whatever").这可能吗? 最佳答案 specify'something'dox=doublex.should_receive(:foo=).with("whatever")Something.should_receive(:create).and_yield(x)#callthere

  7. ruby - 如何在 Ruby 中拆分参数字符串 Bash 样式? - 2

    我正在为一个项目制作一个简单的shell,我希望像在Bash中一样解析参数字符串。foobar"helloworld"fooz应该变成:["foo","bar","helloworld","fooz"]等等。到目前为止,我一直在使用CSV::parse_line,将列分隔符设置为""和.compact输出。问题是我现在必须选择是要支持单引号还是双引号。CSV不支持超过一个分隔符。Python有一个名为shlex的模块:>>>shlex.split("Test'helloworld'foo")['Test','helloworld','foo']>>>shlex.split('Test"

  8. ruby - 在没有 sass 引擎的情况下使用 sass 颜色函数 - 2

    我想在一个没有Sass引擎的类中使用Sass颜色函数。我已经在项目中使用了sassgem,所以我认为搭载会像以下一样简单:classRectangleincludeSass::Script::FunctionsdefcolorSass::Script::Color.new([0x82,0x39,0x06])enddefrender#hamlengineexecutedwithcontextofself#sothatwithintemlateicouldcall#%stop{offset:'0%',stop:{color:lighten(color)}}endend更新:参见上面的#re

  9. ruby - 多个属性的 update_column 方法 - 2

    我有一个具有一些属性的模型:attr1、attr2和attr3。我需要在不执行回调和验证的情况下更新此属性。我找到了update_column方法,但我想同时更新三个属性。我需要这样的东西:update_columns({attr1:val1,attr2:val2,attr3:val3})代替update_column(attr1,val1)update_column(attr2,val2)update_column(attr3,val3) 最佳答案 您可以使用update_columns(attr1:val1,attr2:val2

  10. ruby - 检查方法参数的类型 - 2

    我不确定传递给方法的对象的类型是否正确。我可能会将一个字符串传递给一个只能处理整数的函数。某种运行时保证怎么样?我看不到比以下更好的选择:defsomeFixNumMangler(input)raise"wrongtype:integerrequired"unlessinput.class==FixNumother_stuffend有更好的选择吗? 最佳答案 使用Kernel#Integer在使用之前转换输入的方法。当无法以任何合理的方式将输入转换为整数时,它将引发ArgumentError。defmy_method(number)

随机推荐