我使用字典作为查找表,但我开始怀疑列表是否更适合我的应用程序——我的查找表中的条目数量并没有那么大。我知道列表在底层使用 C 数组,这让我得出结论,在只有几个项目的列表中查找会比在字典中更好(访问数组中的几个元素比计算哈希更快)。
我决定分析替代方案,但结果让我感到惊讶。列表查找仅使用单个元素更好!见下图(log-log plot):
那么问题来了:为什么列表查找的表现如此糟糕?我错过了什么?
在一个附带问题上,引起我注意的另一件事是在大约 1000 个条目之后的 dict 查找时间中出现了一点“不连续性”。我单独绘制了dict查找时间来显示它。
p.s.1 我知道数组和哈希表的 O(n) 与 O(1) 摊销时间,但通常情况下,迭代数组的少量元素比使用一个哈希表。
p.s.2 这是我用来比较字典和列表查找时间的代码:
import timeit
lengths = [2 ** i for i in xrange(15)]
list_time = []
dict_time = []
for l in lengths:
list_time.append(timeit.timeit('%i in d' % (l/2), 'd=range(%i)' % l))
dict_time.append(timeit.timeit('%i in d' % (l/2),
'd=dict.fromkeys(range(%i))' % l))
print l, list_time[-1], dict_time[-1]
p.s.3 使用 Python 2.7.13
最佳答案
I know lists use C arrays under the hood which made me conclude that lookup in a list with just a few items would be better than in a dictionary (accessing a few elements in an array is faster than computing a hash).
当然,访问一些数组元素很便宜,但计算 == 在 Python 中却出人意料地重量级。看到第二张图中的尖峰了吗?这就是为两个整数计算 == 的成本。
您的列表查找需要计算 == 比您的 dict 查找更多。
同时,计算哈希值对于很多对象来说可能是一个相当重量级的操作,但对于这里涉及的所有 int,它们只是对自己进行哈希处理。 (-1 会散列到 -2,大整数(技术上是 longs)会散列到更小的整数,但这不适用于这里。)
字典查找在 Python 中并没有那么糟糕,尤其是当您的键只是一个连续的整数范围时。这里所有的 int 都自己散列,Python 使用自定义的开放寻址方案而不是链接,所以你所有的键最终在内存中几乎和你使用列表一样连续(也就是说,指向键的指针结束在连续的 PyDictEntry 范围内)。查找过程很快,而且在您的测试用例中,它总是在第一次探测时点击右键。
好的,回到图 2 中的峰值。第二个图中 1024 个条目的查找时间峰值是因为对于所有较小的大小,您要查找的整数都是 <= 256,所以它们都在cpython="" 的小整数缓存的范围。="" python="" 的引用实现为从="" -5="" 到="" 256="" 的所有整数保留规范整数对象,包括在内。对于这些整数,python="" 能够使用快速指针比较来避免经历计算="">=>== 的(令人惊讶的重量级)过程。对于较大的整数,in 的参数不再是与 dict 中匹配的整数相同的对象,Python 必须经历整个 == 过程。
关于python - 为什么字典查找总是比列表查找好?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43690191/
类classAprivatedeffooputs:fooendpublicdefbarputs:barendprivatedefzimputs:zimendprotecteddefdibputs:dibendendA的实例a=A.new测试a.foorescueputs:faila.barrescueputs:faila.zimrescueputs:faila.dibrescueputs:faila.gazrescueputs:fail测试输出failbarfailfailfail.发送测试[:foo,:bar,:zim,:dib,:gaz].each{|m|a.send(m)resc
关闭。这个问题是opinion-based.它目前不接受答案。想要改进这个问题?更新问题,以便editingthispost可以用事实和引用来回答它.关闭4年前。Improvethisquestion我想在固定时间创建一系列低音和高音调的哔哔声。例如:在150毫秒时发出高音调的蜂鸣声在151毫秒时发出低音调的蜂鸣声200毫秒时发出低音调的蜂鸣声250毫秒的高音调蜂鸣声有没有办法在Ruby或Python中做到这一点?我真的不在乎输出编码是什么(.wav、.mp3、.ogg等等),但我确实想创建一个输出文件。
我有一个模型:classItem项目有一个属性“商店”基于存储的值,我希望Item对象对特定方法具有不同的行为。Rails中是否有针对此的通用设计模式?如果方法中没有大的if-else语句,这是如何干净利落地完成的? 最佳答案 通常通过Single-TableInheritance. 关于ruby-on-rails-Rails-子类化模型的设计模式是什么?,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.co
我正在使用的第三方API的文档状态:"[O]urAPIonlyacceptspaddedBase64encodedstrings."什么是“填充的Base64编码字符串”以及如何在Ruby中生成它们。下面的代码是我第一次尝试创建转换为Base64的JSON格式数据。xa=Base64.encode64(a.to_json) 最佳答案 他们说的padding其实就是Base64本身的一部分。它是末尾的“=”和“==”。Base64将3个字节的数据包编码为4个编码字符。所以如果你的输入数据有长度n和n%3=1=>"=="末尾用于填充n%
我主要使用Ruby来执行此操作,但到目前为止我的攻击计划如下:使用gemsrdf、rdf-rdfa和rdf-microdata或mida来解析给定任何URI的数据。我认为最好映射到像schema.org这样的统一模式,例如使用这个yaml文件,它试图描述数据词汇表和opengraph到schema.org之间的转换:#SchemaXtoschema.orgconversion#data-vocabularyDV:name:namestreet-address:streetAddressregion:addressRegionlocality:addressLocalityphoto:i
为什么4.1%2返回0.0999999999999996?但是4.2%2==0.2。 最佳答案 参见此处:WhatEveryProgrammerShouldKnowAboutFloating-PointArithmetic实数是无限的。计算机使用的位数有限(今天是32位、64位)。因此计算机进行的浮点运算不能代表所有的实数。0.1是这些数字之一。请注意,这不是与Ruby相关的问题,而是与所有编程语言相关的问题,因为它来自计算机表示实数的方式。 关于ruby-为什么4.1%2使用Ruby返
是否有类似“RVMuse1”或“RVMuselist[0]”之类的内容而不是键入整个版本号。在任何时候,我们都会看到一个可能包含5个或更多ruby的列表,我们可以轻松地键入一个数字而不是X.X.X。这也有助于rvmgemset。 最佳答案 这在RVM2.0中是可能的=>https://docs.google.com/document/d/1xW9GeEpLOWPcddDg_hOPvK4oeLxJmU3Q5FiCNT7nTAc/edit?usp=sharing-知道链接的任何人都可以发表评论
它不等于主线程的binding,这个toplevel作用域是什么?此作用域与主线程中的binding有何不同?>ruby-e'putsTOPLEVEL_BINDING===binding'false 最佳答案 事实是,TOPLEVEL_BINDING始终引用Binding的预定义全局实例,而Kernel#binding创建的新实例>Binding每次封装当前执行上下文。在顶层,它们都包含相同的绑定(bind),但它们不是同一个对象,您无法使用==或===测试它们的绑定(bind)相等性。putsTOPLEVEL_BINDINGput
我可以得到Infinity和NaNn=9.0/0#=>Infinityn.class#=>Floatm=0/0.0#=>NaNm.class#=>Float但是当我想直接访问Infinity或NaN时:Infinity#=>uninitializedconstantInfinity(NameError)NaN#=>uninitializedconstantNaN(NameError)什么是Infinity和NaN?它们是对象、关键字还是其他东西? 最佳答案 您看到打印为Infinity和NaN的只是Float类的两个特殊实例的字符串
如果您尝试在Ruby中的nil对象上调用方法,则会出现NoMethodError异常并显示消息:"undefinedmethod‘...’fornil:NilClass"然而,有一个tryRails中的方法,如果它被发送到一个nil对象,它只返回nil:require'rubygems'require'active_support/all'nil.try(:nonexisting_method)#noNoMethodErrorexceptionanymore那么try如何在内部工作以防止该异常? 最佳答案 像Ruby中的所有其他对象