草庐IT

B+ 树的简单认识

程序员翔仔 2023-03-28 原文

B+ 树的概念

基本概念

B+ 树是 B 树的一种变体,从某个程度上看,B+ 树可以认定是 B 树的升级版。

在 B+ 树中,关键字只存储在叶子结点,非叶子结点存储的是叶子结点所存储关键字的部分拷贝,所有的叶子结点也都在相同的高度,叶子结点本身按关键字大小从小到大链接。

因此,相对于 B 树而言,B+ 树更充分地利用了结点的空间,让查询速度更加稳定,其速度完全接近于二分查找。

特性

B+ 树拥有 B 树的大部分特性,但也具有独特的、与 B 树不同的特性,不同的地方有以下两点:

  • B+ 树的非叶子结点不直接存储数据的指针,所有数据的指针都存储在叶子结点
  • B+ 树叶子结点存储的数据从小到大有序排列,且相邻叶子结点之间具有链接

与 B 树的区别

与 B 树相比较,B+ 树具有以下特点:

  • B+ 树的非叶子结点不直接存储数据,存储的索引更多,树的层级更少,查询的速度更快
  • B+ 树所有数据的指针都存储在叶子结点,因此每次查找到数据的次数都相同,查询速度更稳定
  • B+ 树所有的叶子结点之间具有链接,构成了一个有序链表,查询范围区间的数据更方便
  • B+ 树遍历所有数据时只需要遍历所有叶子结点即可,相对 B 树遍历更快

为什么使用 B+ 树作为索引结构?

索引的本质是一种用于快速查找记录的数据结构,常见有二叉查找树、平衡二叉树、哈希表、B 树和 B+ 树等索引存储结构。

每一种索引结构都有其对应的应用场景,易用性也是选择的标准之一,这里讨论一下为什么选用 B+ 树作为索引存储结构。

为什么不采用二叉查找树?

使用普通的二叉树查找作为索引结构具有一个致命的问题:当一直插入数据的时候,有可能会退化成链表结构,时间复杂度也会从 \(O(\log n)\) 退化到 \(O(n)\)

因此,普通的二叉查找树比较适合数据基本没有变动的情况,这样查找效率不会发生较大的变化。

为什么不采用平衡二叉树?

为了解决普通二叉查找树有可能退化成链表的问题,可以使用自平衡的二叉查找树代替,如 AVL 树、红黑树等。

红黑树常见的一种自平衡二叉查找树,但是也有一个问题:红黑树是一个近似平衡的二叉树,当数据量较大的时候,会出现树层级较大的情况。

当数据量非常大时,索引占用的空间也会非常大,索引还是得存储在磁盘上,如果树的层级较大,则进行磁盘 IO 的次数就会越多,性能就会越差。

因此,红黑树不适合作为存储在磁盘上的索引结构。

为什么不采用哈希表?

哈希表是一个支持快速查找的数据结构,其查找的时间复杂度是 \(O(1)\),其也是最常见的索引存储结构之一。

但是哈希表也有其缺点,就是只存储键值对应关系的哈希表不支持范围查询,如果要做范围查询,需要做全量的数据扫描才行。

当然,如果是具有排序功能的哈希表,会非常适合作为存储在内存中的索引结果,如 Java 中的 TreeMap 对象。

为什么不采用 B 树?

使用 B 树可以解决红黑树层级较大的问题,通过一个结点可以存储多个元素,树变得更加矮胖,使得树的层级变得可控。

而且,通过给一个结点存储一页的数据量,最大化地优化操作系统和磁盘的交互,解决了多次磁盘 IO 的问题。

但是对应 B+ 树而言,B 树的层级仍然会比 B+ 树的高,且范围查询没有 B+ 树方便,这是舍弃 B 树而选择 B+ 树的主要原因。

当然,也有使用 B 树作为索引结构的数据库,如 MongoDB 等。

有关B+ 树的简单认识的更多相关文章

  1. ruby - 简单获取法拉第超时 - 2

    有没有办法在这个简单的get方法中添加超时选项?我正在使用法拉第3.3。Faraday.get(url)四处寻找,我只能先发起连接后应用超时选项,然后应用超时选项。或者有什么简单的方法?这就是我现在正在做的:conn=Faraday.newresponse=conn.getdo|req|req.urlurlreq.options.timeout=2#2secondsend 最佳答案 试试这个:conn=Faraday.newdo|conn|conn.options.timeout=20endresponse=conn.get(url

  2. ruby - 用 Ruby 编写一个简单的网络服务器 - 2

    我想在Ruby中创建一个用于开发目的的极其简单的Web服务器(不,不想使用现成的解决方案)。代码如下:#!/usr/bin/rubyrequire'socket'server=TCPServer.new('127.0.0.1',8080)whileconnection=server.acceptheaders=[]length=0whileline=connection.getsheaders想法是从命令行运行这个脚本,提供另一个脚本,它将在其标准输入上获取请求,并在其标准输出上返回完整的响应。到目前为止一切顺利,但事实证明这真的很脆弱,因为它在第二个请求上中断并出现错误:/usr/b

  3. ruby-on-rails - 简单的 Ruby on Rails 问题——如何将评论附加到用户和文章? - 2

    我意识到这可能是一个非常基本的问题,但我现在已经花了几天时间回过头来解决这个问题,但出于某种原因,Google就是没有帮助我。(我认为部分问题在于我是一个初学者,我不知道该问什么......)我也看过O'Reilly的RubyCookbook和RailsAPI,但我仍然停留在这个问题上.我找到了一些关于多态关系的信息,但它似乎不是我需要的(尽管如果我错了请告诉我)。我正在尝试调整MichaelHartl'stutorial创建一个包含用户、文章和评论的博客应用程序(不使用脚手架)。我希望评论既属于用户又属于文章。我的主要问题是:我不知道如何将当前文章的ID放入评论Controller。

  4. ruby - 使用 Ruby 通过 Outlook 发送消息的最简单方法是什么? - 2

    我的工作要求我为某些测试自动生成电子邮件。我一直在四处寻找,但未能找到可以快速实现的合理解决方案。它需要在outlook而不是其他邮件服务器中,因为我们有一些奇怪的身份验证规则,我们需要保存草稿而不是仅仅发送邮件的选项。显然win32ole可以做到这一点,但我找不到任何相当简单的例子。 最佳答案 假设存储了Outlook凭据并且您设置为自动登录到Outlook,WIN32OLE可以很好地完成此操作:require'win32ole'outlook=WIN32OLE.new('Outlook.Application')message=

  5. postman——集合——执行集合——测试脚本——pm对象简单示例02 - 2

    //1.验证返回状态码是否是200pm.test("Statuscodeis200",function(){pm.response.to.have.status(200);});//2.验证返回body内是否含有某个值pm.test("Bodymatchesstring",function(){pm.expect(pm.response.text()).to.include("string_you_want_to_search");});//3.验证某个返回值是否是100pm.test("Yourtestname",function(){varjsonData=pm.response.json

  6. Qt Designer的简单使用 - 2

    在前面两节的例子中,主界面窗口的尺寸和标签控件显示的矩形区域等,都是用C++代码编写的。窗口和控件的尺寸都是预估的,控件如果多起来,那就不好估计每个控件合适的位置和大小了。用C++代码编写图形界面的问题就是不直观,因此Qt项目开发了专门的可视化图形界面编辑器——QtDesigner(Qt设计师)。通过QtDesigner就可以很方便地创建图形界面文件*.ui,然后将ui文件应用到源代码里面,做到“所见即所得”,大大方便了图形界面的设计。本节就演示一下QtDesigner的简单使用,学习拖拽控件和设置控件属性,并将ui文件应用到Qt程序代码里。使用QtDesigner设计界面在开始菜单中找到「Q

  7. ruby - 使用 Ruby,计算 n x m 数组的每一列中有多少个 true 的简单方法是什么? - 2

    给定一个nxmbool数组:[[true,true,false],[false,true,true],[false,true,true]]有什么简单的方法可以返回“该列中有多少个true?”结果应该是[1,3,2] 最佳答案 使用转置得到一个数组,其中每个子数组代表一列,然后将每一列映射到其中的true数:arr.transpose.map{|subarr|subarr.count(true)}这是一个带有inject的版本,应该在1.8.6上运行,没有任何依赖:arr.transpose.map{|subarr|subarr.in

  8. ruby - 在 Ruby 中搜索大文件的更简单方法? - 2

    我正在编写一个简单的日志嗅探器,它将在日志中搜索表明我支持的软件存在问题的特定错误。它允许用户指定日志路径并指定他们想要搜索多少天前。如果用户关闭日志滚动,日志文件有时会变得非常大。目前我正在做以下事情(虽然还没有完成):File.open(@log_file,"r")do|file_handle|file_handle.eachdo|line|ifline.match(/\d+++-\d+-\d+/)etc...line.match显然会查找我们在日志中使用的日期格式,其余逻辑将在下面。但是,有没有更好的方法来搜索没有.each_line的文件?如果没有,我完全同意。我只是想确保我使

  9. ruby-on-rails - 在 Rails 中需要整个目录树的好方法是什么? - 2

    我正在使用Rails3.2.2并希望递归加载某个目录中的所有代码。例如:[Railsroot]/lib/my_lib/my_lib.rb[Railsroot]/lib/my_lib/subdir/support_file_00.rb[Railsroot]/lib/my_lib/subdir/support_file_01.rb...基于谷歌搜索,我试过:config.autoload_paths+=["#{Rails.root.to_s}/lib/my_lib/**"]config.autoload_paths+=["#{Rails.root.to_s}/lib/my_lib/**/"

  10. ruby - 如何排序不是简单的哈希(哈希的哈希) - 2

    我有一个这样的哈希{55=>{:value=>61,:rating=>-147},89=>{:value=>72,:rating=>-175},78=>{:value=>64,:rating=>-155},84=>{:value=>90,:rating=>-220},95=>{:value=>39,:rating=>-92},46=>{:value=>97,:rating=>-237},52=>{:value=>73,:rating=>-177},64=>{:value=>69,:rating=>-167},86=>{:value=>68,:rating=>-165},53=>{:va

随机推荐