python - 为什么 `for` 在 Python 列表上比在 Numpy 数组上更快？

coder 2023-08-17 原文

因此，我没有讲很长的故事，而是在编写一些代码，我从二进制文件中读取一些数据，然后使用 for 循环遍历每个点。所以我完成了代码，但它运行得非常慢。我从大约 128 个数据通道循环了大约 60,000 个点，这需要一分钟或更长时间来处理。这比我预期的 Python 运行速度要慢得多。因此，我通过使用 Numpy 使整个过程更加高效，但在试图弄清楚为什么原始进程运行如此缓慢时，我们进行了一些类型检查，发现我在 Numpy 数组而不是 Python 列表上循环。好的，使我们的测试设置的输入与我在循环之前将 Numpy 数组转换为列表相同没什么大不了的。 Bang 需要 1 分钟才能运行的相同慢速代码现在需要 10 秒。我被打倒了。我唯一的想法是将 Numpy 数组更改为 Python 列表，我将其更改回来，但它又像泥一样慢。我不敢相信，所以我去获得更确切的证据

$ python -m timeit -s "import numpy" "for k in numpy.arange(5000): k+1"
100 loops, best of 3: 5.46 msec per loop

$ python -m timeit "for k in range(5000): k+1"
1000 loops, best of 3: 256 usec per loop

这是怎么回事？我知道 Numpy 数组和 Python 列表是不同的，但为什么遍历数组中的每个点都慢得多？

我相信我在运行 Numpy 10.1 的 Python 2.6 和 2.7 中都观察到了这种行为。

最佳答案

我们可以做一些调查来弄清楚:

>>> import numpy as np
>>> a = np.arange(32)
>>> a
array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15, 16,
       17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31])
>>> a.data
<read-write buffer for 0x107d01e40, size 256, offset 0 at 0x107d199b0>
>>> id(a.data)
4433424176
>>> id(a[0])
4424950096
>>> id(a[1])
4424950096
>>> for item in a:
...   print id(item)
... 
4424950096
4424950120
4424950096
4424950120
4424950096
4424950120
4424950096
4424950120
4424950096
4424950120
4424950096
4424950120
4424950096
4424950120
4424950096
4424950120
4424950096
4424950120
4424950096
4424950120
4424950096
4424950120
4424950096
4424950120
4424950096
4424950120
4424950096
4424950120
4424950096
4424950120
4424950096
4424950120

那么这里发生了什么？首先，我查看了数组内存缓冲区的内存位置。它位于 4433424176。这本身并不太有启发性。然而，numpy 将其数据存储为连续的 C 数组，因此 numpy 数组中的第一个元素应该对应于数组本身的内存地址，但它不是:

>>> id(a[0])
4424950096

这不是一件好事，因为这会破坏 python 中的不变性，即 2 个对象在其生命周期内永远不会具有相同的 id。

那么，numpy 是如何做到这一点的呢？好吧，答案是 numpy 必须用 python 类型包装返回的对象(例如 numpy.float64 或 numpy.int64 在这种情况下)，这需要时间，如果你'逐项迭代¹。迭代时进一步证明了这一点——我们看到在迭代数组时我们在 2 个单独的 ID 之间交替。这意味着 python 的内存分配器和垃圾收集器加类工作以创建新对象然后释放它们。

列表没有这种内存分配器/垃圾收集器开销。列表中的对象已经作为 python 对象存在(并且它们在迭代后仍然存在)，因此它们在列表的迭代中都没有任何作用。

计时方法:

另请注意，您的时间安排因您的假设而略有偏差。您假设 k + 1 在这两种情况下应该花费相同的时间，但事实并非如此。请注意，如果我不做任何添加而重复您的计时:

mgilson$ python -m timeit -s "import numpy" "for k in numpy.arange(5000): k"
1000 loops, best of 3: 233 usec per loop
mgilson$ python -m timeit "for k in range(5000): k"
10000 loops, best of 3: 114 usec per loop

只有大约 2 倍的差异。然而，做加法会导致 5 倍左右的差异:

mgilson$ python -m timeit "for k in range(5000): k+1" 10000 loops, best of 3: 179 usec per loop mgilson$ python -m timeit -s "import numpy" "for k in numpy.arange(5000): k+1" 1000 loops, best of 3: 786 usec per loop

为了好玩，让我们做加法:

$ python -m timeit -s "v = 1" "v + 1" 10000000 loops, best of 3: 0.0261 usec per loop mgilson$ python -m timeit -s "import numpy; v = numpy.int64(1)" "v + 1" 10000000 loops, best of 3: 0.121 usec per loop

最后，您的 timeit 还包括不理想的列表/数组构建时间:

mgilson$ python -m timeit -s "v = range(5000)" "for k in v: k" 10000 loops, best of 3: 80.2 usec per loop mgilson$ python -m timeit -s "import numpy; v = numpy.arange(5000)" "for k in v: k" 1000 loops, best of 3: 237 usec per loop

请注意，在这种情况下，numpy 实际上离列表解决方案更远了。这表明迭代确实较慢，如果将 numpy 类型转换为标准 python 类型，您可能会获得一些加速。

^{¹请注意，这在切片时不会花费很多时间，因为它只需要分配 O(1) 个新对象，因为 numpy 返回一个 View 进入原始数组。}

关于python - 为什么 `for` 在 Python 列表上比在 Numpy 数组上更快？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/35232406/

有关python - 为什么 `for` 在 Python 列表上比在 Numpy 数组上更快？的更多相关文章

ruby - 为什么我可以在 Ruby 中使用 Object#send 访问私有(private)/ protected 方法？ - 2
类classAprivatedeffooputs:fooendpublicdefbarputs:barendprivatedefzimputs:zimendprotecteddefdibputs:dibendendA的实例a=A.new测试a.foorescueputs:faila.barrescueputs:faila.zimrescueputs:faila.dibrescueputs:faila.gazrescueputs:fail测试输出failbarfailfailfail.发送测试[:foo,:bar,:zim,:dib,:gaz].each{|m|a.send(m)resc
python - 如何使用 Ruby 或 Python 创建一系列高音调和低音调的蜂鸣声？ - 2
关闭。这个问题是opinion-based.它目前不接受答案。想要改进这个问题？更新问题，以便editingthispost可以用事实和引用来回答它.关闭4年前。Improvethisquestion我想在固定时间创建一系列低音和高音调的哔哔声。例如:在150毫秒时发出高音调的蜂鸣声在151毫秒时发出低音调的蜂鸣声200毫秒时发出低音调的蜂鸣声250毫秒的高音调蜂鸣声有没有办法在Ruby或Python中做到这一点？我真的不在乎输出编码是什么(.wav、.mp3、.ogg等等)，但我确实想创建一个输出文件。
ruby-on-rails - Rails - 子类化模型的设计模式是什么？ - 2
我有一个模型:classItem项目有一个属性“商店”基于存储的值，我希望Item对象对特定方法具有不同的行为。Rails中是否有针对此的通用设计模式？如果方法中没有大的if-else语句，这是如何干净利落地完成的？最佳答案通常通过Single-TableInheritance. 关于ruby-on-rails-Rails-子类化模型的设计模式是什么？，我们在StackOverflow上找到一个类似的问题： https://stackoverflow.co
ruby - 什么是填充的 Base64 编码字符串以及如何在 ruby 中生成它们？ - 2
我正在使用的第三方API的文档状态:"[O]urAPIonlyacceptspaddedBase64encodedstrings."什么是“填充的Base64编码字符串”以及如何在Ruby中生成它们。下面的代码是我第一次尝试创建转换为Base64的JSON格式数据。xa=Base64.encode64(a.to_json) 最佳答案他们说的padding其实就是Base64本身的一部分。它是末尾的“=”和“==”。Base64将3个字节的数据包编码为4个编码字符。所以如果你的输入数据有长度n和n%3=1=>"=="末尾用于填充n%
ruby - 解析 RDFa、微数据等的最佳方式是什么，使用统一的模式/词汇(例如 schema.org)存储和显示信息 - 2
我主要使用Ruby来执行此操作，但到目前为止我的攻击计划如下:使用gemsrdf、rdf-rdfa和rdf-microdata或mida来解析给定任何URI的数据。我认为最好映射到像schema.org这样的统一模式，例如使用这个yaml文件，它试图描述数据词汇表和opengraph到schema.org之间的转换:#SchemaXtoschema.orgconversion#data-vocabularyDV:name:namestreet-address:streetAddressregion:addressRegionlocality:addressLocalityphoto:i
ruby - 为什么 4.1%2 使用 Ruby 返回 0.0999999999999996？但是 4.2%2==0.2 - 2
为什么4.1%2返回0.0999999999999996？但是4.2%2==0.2。最佳答案参见此处:WhatEveryProgrammerShouldKnowAboutFloating-PointArithmetic实数是无限的。计算机使用的位数有限(今天是32位、64位)。因此计算机进行的浮点运算不能代表所有的实数。0.1是这些数字之一。请注意，这不是与Ruby相关的问题，而是与所有编程语言相关的问题，因为它来自计算机表示实数的方式。关于ruby-为什么4.1%2使用Ruby返
ruby-on-rails - form_for 中不在模型中的自定义字段 - 2
我想向我的Controller传递一个参数，它是一个简单的复选框，但我不知道如何在模型的form_for中引入它，这是我的观点:{:id=>'go_finance'}do|f|%>Transferirde:para:Entrada:"input",:placeholder=>"Quantofoiganho?"%>Saída:"output",:placeholder=>"Quantofoigasto?"%>Nota:我想做一个额外的复选框，但我该怎么做，模型中没有一个对象，而是一个要检查的对象，以便在Controller中创建一个ifelse，如果没有检查，请帮助我，非常感谢,谢谢
ruby - RVM 使用列表[0] - 2
是否有类似“RVMuse1”或“RVMuselist[0]”之类的内容而不是键入整个版本号。在任何时候，我们都会看到一个可能包含5个或更多ruby的列表，我们可以轻松地键入一个数字而不是X.X.X。这也有助于rvmgemset。最佳答案这在RVM2.0中是可能的=>https://docs.google.com/document/d/1xW9GeEpLOWPcddDg_hOPvK4oeLxJmU3Q5FiCNT7nTAc/edit?usp=sharing-知道链接的任何人都可以发表评论
ruby - ruby 中的 TOPLEVEL_BINDING 是什么？ - 2
它不等于主线程的binding，这个toplevel作用域是什么？此作用域与主线程中的binding有何不同？>ruby-e'putsTOPLEVEL_BINDING===binding'false 最佳答案事实是，TOPLEVEL_BINDING始终引用Binding的预定义全局实例，而Kernel#binding创建的新实例>Binding每次封装当前执行上下文。在顶层，它们都包含相同的绑定(bind)，但它们不是同一个对象，您无法使用==或===测试它们的绑定(bind)相等性。putsTOPLEVEL_BINDINGput
ruby - Infinity 和 NaN 的类型是什么？ - 2
我可以得到Infinity和NaNn=9.0/0#=>Infinityn.class#=>Floatm=0/0.0#=>NaNm.class#=>Float但是当我想直接访问Infinity或NaN时:Infinity#=>uninitializedconstantInfinity(NameError)NaN#=>uninitializedconstantNaN(NameError)什么是Infinity和NaN？它们是对象、关键字还是其他东西？最佳答案您看到打印为Infinity和NaN的只是Float类的两个特殊实例的字符串

python - 为什么 `for` 在 Python 列表上比在 Numpy 数组上更快？

计时方法:

有关python - 为什么 `for` 在 Python 列表上比在 Numpy 数组上更快？的更多相关文章

随机推荐