草庐IT

python - 如何限制循环的迭代?

coder 2023-05-22 原文

假设我有一个项目列表,我想遍历其中的前几个:

items = list(range(10)) # I mean this to represent any kind of iterable.
limit = 5

朴素的实现

来自其他语言的 Python naïf 可能会编写这个完美的可服务性和高性能(如果是单一的)代码:

index = 0
for item in items: # Python's `for` loop is a for-each.
    print(item)    # or whatever function of that item.
    index += 1
    if index == limit:
        break

更惯用的实现

但是 Python 有枚举,它很好地包含了大约一半的代码:

for index, item in enumerate(items):
    print(item)
    if index == limit: # There's gotta be a better way.
        break

所以我们已经将额外的代码减半了。但一定有更好的方法。

我们可以近似下面的伪代码行为吗?

如果 enumerate 采用了另一个可选的 stop 参数(例如,它采用如下的 start 参数:enumerate(items, start=1)) 我认为这很理想,但以下内容不存在(参见 documentation on enumerate here ):

# hypothetical code, not implemented:
for _, item in enumerate(items, start=0, stop=limit): # `stop` not implemented
    print(item)

请注意,没有必要为 index 命名,因为不需要引用它。

是否有一种惯用的方式来编写上述内容?怎么样?

第二个问题:为什么这不是内置在枚举中?

最佳答案

How can I limit iterations of a loop in Python?

for index, item in enumerate(items):
    print(item)
    if index == limit:
        break

Is there a shorter, idiomatic way to write the above? How?

包括索引

zip 在其参数中最短的可迭代对象处停止。 (与 zip_longest 的行为相反,它使用最长的可迭代对象。)

range 可以提供一个有限的迭代器,我们可以将它与我们的主迭代器一起传递给 zip。

所以我们可以将 range 对象(带有它的 stop 参数)传递给 zip 并像有限枚举一样使用它。

zip(range(limit), items)

使用 Python 3,ziprange 返回可迭代对象,它们通过管道传输数据,而不是在中间步骤中将数据具体化。

for index, item in zip(range(limit), items):
    print(index, item)

要在 Python 2 中获得相同的行为,只需将 xrange 替换为 range 并将 itertools.izip 替换为 zip.

from itertools import izip
for index, item in izip(xrange(limit), items):
    print(item)

如果不需要索引,itertools.islice

你可以使用itertools.islice:

for item in itertools.islice(items, 0, stop):
    print(item)

不需要分配给索引。

组合enumerate(islice(items, stop))获取索引

正如 Pablo Ruiz Ruiz 指出的那样,我们也可以用 enumerate 组成 islice。

for index, item in enumerate(islice(items, limit)):
    print(index, item)

Why isn't this built into enumerate?

这里是用纯 Python 实现的枚举(可能会进行修改以在注释中获得所需的行为):

def enumerate(collection, start=0):  # could add stop=None
    i = start
    it = iter(collection)
    while 1:                         # could modify to `while i != stop:`
        yield (i, next(it))
        i += 1

对于那些已经使用 enumerate 的人来说,上面的性能会降低,因为它必须检查是否是时候停止每次迭代。如果没有停止参数,我们可以检查并使用旧的枚举:

_enumerate = enumerate

def enumerate(collection, start=0, stop=None):
    if stop is not None:
        return zip(range(start, stop), collection)
    return _enumerate(collection, start)

这个额外的检查对性能的影响可以忽略不计。

至于为什么 enumerate 没有停止参数,这是最初提出的(见PEP 279):

This function was originally proposed with optional start and stop arguments. GvR [Guido van Rossum] pointed out that the function call enumerate(seqn, 4, 6) had an alternate, plausible interpretation as a slice that would return the fourth and fifth elements of the sequence. To avoid the ambiguity, the optional arguments were dropped even though it meant losing flexibility as a loop counter. That flexibility was most important for the common case of counting from one, as in:

for linenum, line in enumerate(source,1):  print linenum, line

显然 start 被保留是因为它非常有值(value),而 stop 被删除是因为它的用例较少并且导致新功能的使用困惑.

避免使用下标符号进行切片

另一个答案说:

Why not simply use

for item in items[:limit]: # or limit+1, depends

这里有一些缺点:

  • 它只适用于接受切片的迭代,因此它受到更多限制。
  • 如果他们确实接受切片,它通常会在内存中创建一个新的数据结构,而不是迭代引用数据结构,因此它会浪费内存(所有内置对象在切片时都会复制,但是,例如,numpy 数组会产生切片时查看)。
  • 不可切片的可迭代对象需要其他类型的处理。如果您切换到惰性评估模型,则还必须使用切片更改代码。

只有在了解限制以及是否生成副本或 View 时,才应使用带下标表示法的切片。

结论

我假设现在 Python 社区知道 enumerate 的用法,混淆成本会被参数的值(value)所抵消。

在那之前,您可以使用:

for index, element in zip(range(limit), items):
    ...

for index, item in enumerate(islice(items, limit)):
    ...

或者,如果您根本不需要索引:

for element in islice(items, 0, limit):
    ...

并避免使用下标符号进行切片,除非您了解这些限制。

关于python - 如何限制循环的迭代?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36106712/

有关python - 如何限制循环的迭代?的更多相关文章

  1. ruby - 如何使用 Nokogiri 的 xpath 和 at_xpath 方法 - 2

    我正在学习如何使用Nokogiri,根据这段代码我遇到了一些问题:require'rubygems'require'mechanize'post_agent=WWW::Mechanize.newpost_page=post_agent.get('http://www.vbulletin.org/forum/showthread.php?t=230708')puts"\nabsolutepathwithtbodygivesnil"putspost_page.parser.xpath('/html/body/div/div/div/div/div/table/tbody/tr/td/div

  2. ruby - 如何从 ruby​​ 中的字符串运行任意对象方法? - 2

    总的来说,我对ruby​​还比较陌生,我正在为我正在创建的对象编写一些rspec测试用例。许多测试用例都非常基础,我只是想确保正确填充和返回值。我想知道是否有办法使用循环结构来执行此操作。不必为我要测试的每个方法都设置一个assertEquals。例如:describeitem,"TestingtheItem"doit"willhaveanullvaluetostart"doitem=Item.new#HereIcoulddotheitem.name.shouldbe_nil#thenIcoulddoitem.category.shouldbe_nilendend但我想要一些方法来使用

  3. python - 如何使用 Ruby 或 Python 创建一系列高音调和低音调的蜂鸣声? - 2

    关闭。这个问题是opinion-based.它目前不接受答案。想要改进这个问题?更新问题,以便editingthispost可以用事实和引用来回答它.关闭4年前。Improvethisquestion我想在固定时间创建一系列低音和高音调的哔哔声。例如:在150毫秒时发出高音调的蜂鸣声在151毫秒时发出低音调的蜂鸣声200毫秒时发出低音调的蜂鸣声250毫秒的高音调蜂鸣声有没有办法在Ruby或Python中做到这一点?我真的不在乎输出编码是什么(.wav、.mp3、.ogg等等),但我确实想创建一个输出文件。

  4. ruby-on-rails - 如何验证 update_all 是否实际在 Rails 中更新 - 2

    给定这段代码defcreate@upgrades=User.update_all(["role=?","upgraded"],:id=>params[:upgrade])redirect_toadmin_upgrades_path,:notice=>"Successfullyupgradeduser."end我如何在该操作中实际验证它们是否已保存或未重定向到适当的页面和消息? 最佳答案 在Rails3中,update_all不返回任何有意义的信息,除了已更新的记录数(这可能取决于您的DBMS是否返回该信息)。http://ar.ru

  5. ruby-on-rails - 'compass watch' 是如何工作的/它是如何与 rails 一起使用的 - 2

    我在我的项目目录中完成了compasscreate.和compassinitrails。几个问题:我已将我的.sass文件放在public/stylesheets中。这是放置它们的正确位置吗?当我运行compasswatch时,它不会自动编译这些.sass文件。我必须手动指定文件:compasswatchpublic/stylesheets/myfile.sass等。如何让它自动运行?文件ie.css、print.css和screen.css已放在stylesheets/compiled。如何在编译后不让它们重新出现的情况下删除它们?我自己编译的.sass文件编译成compiled/t

  6. ruby - 树顶语法无限循环 - 2

    我脑子里浮现出一些关于一种新编程语言的想法,所以我想我会尝试实现它。一位friend建议我尝试使用Treetop(Rubygem)来创建一个解析器。Treetop的文档很少,我以前从未做过这种事情。我的解析器表现得好像有一个无限循环,但没有堆栈跟踪;事实证明很难追踪到。有人可以指出入门级解析/AST指南的方向吗?我真的需要一些列出规则、常见用法等的东西来使用像Treetop这样的工具。我的语法分析器在GitHub上,以防有人希望帮助我改进它。class{initialize=lambda(name){receiver.name=name}greet=lambda{IO.puts("He

  7. ruby-on-rails - 在 Ruby 中循环遍历多个数组 - 2

    我有多个ActiveRecord子类Item的实例数组,我需要根据最早的事件循环打印。在这种情况下,我需要打印付款和维护日期,如下所示:ItemAmaintenancerequiredin5daysItemBpaymentrequiredin6daysItemApaymentrequiredin7daysItemBmaintenancerequiredin8days我目前有两个查询,用于查找maintenance和payment项目(非排他性查询),并输出如下内容:paymentrequiredin...maintenancerequiredin...有什么方法可以改善上述(丑陋的)代

  8. ruby - 如何将脚本文件的末尾读取为数据文件(Perl 或任何其他语言) - 2

    我正在寻找执行以下操作的正确语法(在Perl、Shell或Ruby中):#variabletoaccessthedatalinesappendedasafileEND_OF_SCRIPT_MARKERrawdatastartshereanditcontinues. 最佳答案 Perl用__DATA__做这个:#!/usr/bin/perlusestrict;usewarnings;while(){print;}__DATA__Texttoprintgoeshere 关于ruby-如何将脚

  9. ruby - 如何指定 Rack 处理程序 - 2

    Rackup通过Rack的默认处理程序成功运行任何Rack应用程序。例如:classRackAppdefcall(environment)['200',{'Content-Type'=>'text/html'},["Helloworld"]]endendrunRackApp.new但是当最后一行更改为使用Rack的内置CGI处理程序时,rackup给出“NoMethodErrorat/undefinedmethod`call'fornil:NilClass”:Rack::Handler::CGI.runRackApp.newRack的其他内置处理程序也提出了同样的反对意见。例如Rack

  10. ruby - 如何每月在 Heroku 运行一次 Scheduler 插件? - 2

    在选择我想要运行操作的频率时,唯一的选项是“每天”、“每小时”和“每10分钟”。谢谢!我想为我的Rails3.1应用程序运行调度程序。 最佳答案 这不是一个优雅的解决方案,但您可以安排它每天运行,并在实际开始工作之前检查日期是否为当月的第一天。 关于ruby-如何每月在Heroku运行一次Scheduler插件?,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/8692687/

随机推荐