草庐IT

c++ - 靠近最终位置的插入提示位置在最终位置之前还是之后是否重要?

coder 2024-02-03 原文

我在集合/ map 中使用带有提示(insert)的emplace_hint函数。

api doc说,当使用提示位置时,它将“从提示位置开始搜索最终位置,并且当实际插入点位于附近时,将大大加快该过程”。

我想知道关闭在这里是指之前,之后还是两者,以及如何有效使用此功能?

如果使用lower_boundupper_bound之前找到附近的地方,似乎并没有加快处理速度。

最佳答案

坏消息...

我们称这些类型为map/set,但是我们真正的意思是tree /tree。在树上的插入操作是Lower_bound O(log(N)),其后是实际添加新值的操作。 (通常树是RB树,因此添加可能涉及“旋转”)

通过调用lower_bound然后插入,您可以简单地以困难的方式实现insert函数。这根本不可能更快。如果是这样,我们会问为什么这不是默认的实现。

好消息...

如果您真正要问的是...“我怎么比 map 走得快”。这很简单。有两种选择,具体取决于速度较慢的对象-访问或插入/删除,存储多少元素,键/值类型有多大,或者是否有特殊原因导致键/值的移动成本高昂,等等。 。

1)哈希图,在std中以unordered_map的形式实现
这是一种有时称为“桶分类”的技术。您要做的就是提供将 key 变成数字的功能。然后,您修改数字并使用它来查找 map 数组。许多人错误地认为这意味着它提供了线性访问,但它没有,它仍然是O(log(N)),而N较小。
缺点是它使用更多的内存。显然,哈希函数也需要快速。

2)
为了更快地查找,请考虑排序 vector (有时称为平面图,请参见boost::flatmap)。它只是一个std::vector >,只是进行了排序。非常简单,此结构比查找 map 快得多。之所以起作用,是因为lower_bound函数也是一种通用算法,并且仍然是log(N),但是 vector 对缓存更友好。预计它会快4倍左右。
插入/删除为O(N),因为您必须在...周围存储内存。但是,如上所述,插入操作需要一次Lower_bound调用或等效调用,而排序 vector 的调用速度更快。通过实验,我发现对于小于4K的结构, vector 的插入/删除速度比set/map快,但此后速度变慢,但这显然与H/W有关。

3)不要插入/删除,使用如上所述的排序 vector ,但不要调用insert/erase,而只需push_back即可插入。要删除,请将项目与back()交换并调整大小。这意味着排序将在您每次插入/擦除时中断,因此您需要一个脏标志。查找时,检查脏标志,如果已设置,则进行排序。 std::sort算法是一门真正的科学,它的速度非常快。我的意思是说真的很快...唯一的缺点是它是N * log(N),因此对于大型数据集(1000或更多的元素),您需要多次插入/擦除才能获得返回,尽管数量不如人多疑似。
它也变得非常复杂,以至于您可能需要一个类/模板来对其进行抽象。

为了实现最快的插入/删除...
4)所有排序算法之王,是基数排序。用基数排序实现3)会给您O(N)排序时间。
缺点是,基数算法通常需要非常大的数据集才能使用(通常> 10,000个元素),这就是为什么通常不使用它们的原因。对于较小的数据集,通常可以找到std:sort获胜。
另外,我不知道标准的基数排序实现,因此这意味着您需要编写自己的代码或进行大量的Google搜索。通常,基数排序仅支持整数键(尽管没有内在原因无法扩展它)。

对于骇客...
5)设置表示浮点比较。现在,真正的技巧是对浮点数据使用整数比较(如在别名转换中一样,在比较函数中将float *转换为int *)。这是可行的,因为浮点数将指数存储在MSB中,因此,较大的数字具有较大的指数。唯一的问题是符号标志,这是错误的处理方法,因此请注意,如果您遍历结构,则将正值从低到高排序。负数按从高到低的顺序排序,这意味着该 map 并未真正排序。如果您只有+ ve或-ve数字,那么这无关紧要。如果仅插入/擦除/查找,则绝对存储顺序并不重要。
(如果您想知道为什么整数比较会更快,这是因为它比较复杂,而且CPU通常也有用于浮点的单独寄存器,并且访问这些寄存器的速度较慢)。
还要注意,别名转换有时会破坏编译器的优化,具体取决于您可能需要告诉编译器您的工作。您可以使用编译器标志来执行此操作。在GCC上,这是no_strict_aliasing,另一方面,Visual Studio不在乎,并且如果没有,应该没问题)
...
等等,关键是有很多方法可以击败“标准”算法,因为标准算法需要权衡利弊,以平衡所有情况。如果您只有一个已知案例,那么您通常可以击败他们。但是...如果您不知道所存储的内容或数量,则尝试击败std::XXXXX是一个傻瓜游戏。标准算法是由已经这样做数十年并且知道自己在做什么的人实现的。
这就是为什么您尝试的操作很愚蠢的原因,如果那样简单,则std::XXXX版本已经可以做到了。

关于c++ - 靠近最终位置的插入提示位置在最终位置之前还是之后是否重要?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49653112/

有关c++ - 靠近最终位置的插入提示位置在最终位置之前还是之后是否重要?的更多相关文章

  1. ruby-on-rails - 如何验证 update_all 是否实际在 Rails 中更新 - 2

    给定这段代码defcreate@upgrades=User.update_all(["role=?","upgraded"],:id=>params[:upgrade])redirect_toadmin_upgrades_path,:notice=>"Successfullyupgradeduser."end我如何在该操作中实际验证它们是否已保存或未重定向到适当的页面和消息? 最佳答案 在Rails3中,update_all不返回任何有意义的信息,除了已更新的记录数(这可能取决于您的DBMS是否返回该信息)。http://ar.ru

  2. ruby-on-rails - 如何优雅地重启 thin + nginx? - 2

    我的瘦服务器配置了nginx,我的ROR应用程序正在它们上运行。在我发布代码更新时运行thinrestart会给我的应用程序带来一些停机时间。我试图弄清楚如何优雅地重启正在运行的Thin实例,但找不到好的解决方案。有没有人能做到这一点? 最佳答案 #Restartjustthethinserverdescribedbythatconfigsudothin-C/etc/thin/mysite.ymlrestartNginx将继续运行并代理请求。如果您将Nginx设置为使用多个上游服务器,例如server{listen80;server

  3. ruby - 检查数组是否在增加 - 2

    这个问题在这里已经有了答案:Checktoseeifanarrayisalreadysorted?(8个答案)关闭9年前。我只是想知道是否有办法检查数组是否在增加?这是我的解决方案,但我正在寻找更漂亮的方法:n=-1@arr.flatten.each{|e|returnfalseife

  4. ruby - 如何在 Rails 4 中使用表单对象之前的验证回调? - 2

    我有一个服务模型/表及其注册表。在表单中,我几乎拥有服务的所有字段,但我想在验证服务对象之前自动设置其中一些值。示例:--服务Controller#创建Action:defcreate@service=Service.new@service_form=ServiceFormObject.new(@service)@service_form.validate(params[:service_form_object])and@service_form.saverespond_with(@service_form,location:admin_services_path)end在验证@ser

  5. ruby - 检查字符串是否包含散列中的任何键并返回它包含的键的值 - 2

    我有一个包含多个键的散列和一个字符串,该字符串不包含散列中的任何键或包含一个键。h={"k1"=>"v1","k2"=>"v2","k3"=>"v3"}s="thisisanexamplestringthatmightoccurwithakeysomewhereinthestringk1(withspecialcharacterslike(^&*$#@!^&&*))"检查s是否包含h中的任何键的最佳方法是什么,如果包含,则返回它包含的键的值?例如,对于上面的h和s的例子,输出应该是v1。编辑:只有字符串是用户定义的。哈希将始终相同。 最佳答案

  6. ruby-on-rails - Ruby 检查日期时间是否为 iso8601 并保存 - 2

    我需要检查DateTime是否采用有效的ISO8601格式。喜欢:#iso8601?我检查了ruby​​是否有特定方法,但没有找到。目前我正在使用date.iso8601==date来检查这个。有什么好的方法吗?编辑解释我的环境,并改变问题的范围。因此,我的项目将使用jsapiFullCalendar,这就是我需要iso8601字符串格式的原因。我想知道更好或正确的方法是什么,以正确的格式将日期保存在数据库中,或者让ActiveRecord完成它们的工作并在我需要时间信息时对其进行操作。 最佳答案 我不太明白你的问题。我假设您想检查

  7. ruby - 检查日期是否在过去 7 天内 - 2

    我的日期格式如下:"%d-%m-%Y"(例如,今天的日期为07-09-2015),我想看看是不是在过去的七天内。谁能推荐一种方法? 最佳答案 你可以这样做:require"date"Date.today-7 关于ruby-检查日期是否在过去7天内,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/32438063/

  8. ruby - 如何验证 IO.copy_stream 是否成功 - 2

    这里有一个很好的答案解释了如何在Ruby中下载文件而不将其加载到内存中:https://stackoverflow.com/a/29743394/4852737require'open-uri'download=open('http://example.com/image.png')IO.copy_stream(download,'~/image.png')我如何验证下载文件的IO.copy_stream调用是否真的成功——这意味着下载的文件与我打算下载的文件完全相同,而不是下载一半的损坏文件?documentation说IO.copy_stream返回它复制的字节数,但是当我还没有下

  9. ruby - 是否可以覆盖 gemfile 进行本地开发? - 2

    我们的git存储库中目前有一个Gemfile。但是,有一个gem我只在我的环境中本地使用(我的团队不使用它)。为了使用它,我必须将它添加到我们的Gemfile中,但每次我checkout到我们的master/dev主分支时,由于与跟踪的gemfile冲突,我必须删除它。我想要的是类似Gemfile.local的东西,它将继承从Gemfile导入的gems,但也允许在那里导入新的gems以供使用只有我的机器。此文件将在.gitignore中被忽略。这可能吗? 最佳答案 设置BUNDLE_GEMFILE环境变量:BUNDLE_GEMFI

  10. ruby - 在 Windows 机器上使用 Ruby 进行开发是否会适得其反? - 2

    这似乎非常适得其反,因为太多的gem会在window上破裂。我一直在处理很多mysql和ruby​​-mysqlgem问题(gem本身发生段错误,一个名为UnixSocket的类显然在Windows机器上不能正常工作,等等)。我只是在浪费时间吗?我应该转向不同的脚本语言吗? 最佳答案 我在Windows上使用Ruby的经验很少,但是当我开始使用Ruby时,我是在Windows上,我的总体印象是它不是Windows原生系统。因此,在主要使用Windows多年之后,开始使用Ruby促使我切换回原来的系统Unix,这次是Linux。Rub

随机推荐