草庐IT

range-tree

全部标签

B+Tree树

实际上它就是B树的变种,以一颗最大度数(max-degree)为4(4阶)的b+tree为例:所有的元素都会出现在叶子节点,叶子节点形成一个单向链表,每一个节点都会通过一个指针指向下一个元素。Mysql索引数据结构对经典的B+Tree树结构进行了优化。在原B+Tree树的基础上,增加了一个指向相邻叶子节点的链表指针,就形成了一个带有顺序指针的B+Tree,提高区间的访问性能。有利于数据库的排序操作。每个数据节点都是存储在一个页当中的。可以通过一个数据结构可视化的网站来简单演示一下。https://www.cs.usfca.edu/~galles/visualization/BPlusTree.

B+Tree树

实际上它就是B树的变种,以一颗最大度数(max-degree)为4(4阶)的b+tree为例:所有的元素都会出现在叶子节点,叶子节点形成一个单向链表,每一个节点都会通过一个指针指向下一个元素。Mysql索引数据结构对经典的B+Tree树结构进行了优化。在原B+Tree树的基础上,增加了一个指向相邻叶子节点的链表指针,就形成了一个带有顺序指针的B+Tree,提高区间的访问性能。有利于数据库的排序操作。每个数据节点都是存储在一个页当中的。可以通过一个数据结构可视化的网站来简单演示一下。https://www.cs.usfca.edu/~galles/visualization/BPlusTree.

PostgreSQL 的窗口函数 OVER, WINDOW, PARTITION BY, RANGE

最近在数据处理中用到了窗函数,把使用方法记录一下,暂时只有分组排序和滑动时间窗口的例子,以后再逐步添加场景在SQL查询时,会遇到有两类需要分组统计的场景,在之前的SQL语法中是不方便实现的场景1:顾客维修设备的记录表,每次维修产生一条记录,每个记录包含时间,顾客ID和维修金额,要取出每个顾客的维修次数和最后一次维修时的金额场景2:还是上面的维修记录表,要取出每个顾客的每次维修之间的时间间隔场景3:一个用户账户的交易流水表,要求每个小时的交易笔数和平均收支金额,这个平均数的统计范围是两个小时(整点时间的前后一个小时)使用窗函数直接SQL中使用窗函数就能解决这些问题,否则需要使用临时表,函数或存储

PostgreSQL 的窗口函数 OVER, WINDOW, PARTITION BY, RANGE

最近在数据处理中用到了窗函数,把使用方法记录一下,暂时只有分组排序和滑动时间窗口的例子,以后再逐步添加场景在SQL查询时,会遇到有两类需要分组统计的场景,在之前的SQL语法中是不方便实现的场景1:顾客维修设备的记录表,每次维修产生一条记录,每个记录包含时间,顾客ID和维修金额,要取出每个顾客的维修次数和最后一次维修时的金额场景2:还是上面的维修记录表,要取出每个顾客的每次维修之间的时间间隔场景3:一个用户账户的交易流水表,要求每个小时的交易笔数和平均收支金额,这个平均数的统计范围是两个小时(整点时间的前后一个小时)使用窗函数直接SQL中使用窗函数就能解决这些问题,否则需要使用临时表,函数或存储

Go for range 一不小心就掉坑里了

前言为了让大家更好的理解本期知识点,先介绍以下几个知识点:线性结构、非线性结构、循环、迭代、遍历、递归。线性结构:数组、队列非线性结构:树、图循环(loop):最基础的概念,所有重复的行为都是循环递归(recursion):在函数内调用自身,将复杂情况逐步转化成基本情况(数学)迭代(iterate):在多次循环中逐步接近结果(编程)迭代(iterate):按顺序访问线性结构中的每一项遍历(traversal):按规则访问非线性结构中的每一项下面会挑选几个经典的案例,一块来探讨下,看看如何避免掉坑,多积累积累采坑经验。1.for+传值先来到开胃菜,热热身~typestudentstruct{na

Go for range 一不小心就掉坑里了

前言为了让大家更好的理解本期知识点,先介绍以下几个知识点:线性结构、非线性结构、循环、迭代、遍历、递归。线性结构:数组、队列非线性结构:树、图循环(loop):最基础的概念,所有重复的行为都是循环递归(recursion):在函数内调用自身,将复杂情况逐步转化成基本情况(数学)迭代(iterate):在多次循环中逐步接近结果(编程)迭代(iterate):按顺序访问线性结构中的每一项遍历(traversal):按规则访问非线性结构中的每一项下面会挑选几个经典的案例,一块来探讨下,看看如何避免掉坑,多积累积累采坑经验。1.for+传值先来到开胃菜,热热身~typestudentstruct{na

索引 - B+Tree

B+树索引是B+树在数据库中的一种实现,是最常见也是数据库中使用最为频繁的一种索引。B+树中的B代表平衡(balance),而不是二叉(Binary),因为B+树是从最早的平衡二叉树演化而来的。二叉查找树二叉树性质:左子树的键值小于根的键值,右子树的键值大于根的键值二叉树搜索相当于一个二分查找,时间复杂度可以达到O(log2(n))二叉树以第一个插入的数据作为根节点,在数据基本有序的情况下,二叉树的构建基本上就是一个线性链表结构。查找最后一个数据等于遍历整个链表,查询效率很低,不稳定。平衡二叉树(AVLTree)平衡二叉树(AVL树)是一颗空树或它的左右两个子树的高度差的绝对值不能超过1,并且

索引 - B+Tree

B+树索引是B+树在数据库中的一种实现,是最常见也是数据库中使用最为频繁的一种索引。B+树中的B代表平衡(balance),而不是二叉(Binary),因为B+树是从最早的平衡二叉树演化而来的。二叉查找树二叉树性质:左子树的键值小于根的键值,右子树的键值大于根的键值二叉树搜索相当于一个二分查找,时间复杂度可以达到O(log2(n))二叉树以第一个插入的数据作为根节点,在数据基本有序的情况下,二叉树的构建基本上就是一个线性链表结构。查找最后一个数据等于遍历整个链表,查询效率很低,不稳定。平衡二叉树(AVLTree)平衡二叉树(AVL树)是一颗空树或它的左右两个子树的高度差的绝对值不能超过1,并且

LSM Tree 数据库底层索引

数据库中非常常用的索引数据结构——B+树,在过去很多年里它都是数据库索引的首选实现方式,但是这种数据结构也并不是很完美。因为,每次修改数据都很有可能破坏B+树的约束,我们需要对整棵树进行递归的合并、分裂等调整操作,而不同节点在磁盘上的位置很可能并不是连续的,这就导致我们需要不断地做随机写入的操作,而随机写入的性能是比较差的,这个问题在写多读少的场景下会更加明显。LSMTree(LogStructureMergeTree)是比B+树更适合写多读少场景的索引结构,也广泛应用在各大NoSQL中。比如基于LSM树实现底层索引结构的RocksDB、LevelDB。LSMTree的实现原理:LSM树包含了

LSM Tree 数据库底层索引

数据库中非常常用的索引数据结构——B+树,在过去很多年里它都是数据库索引的首选实现方式,但是这种数据结构也并不是很完美。因为,每次修改数据都很有可能破坏B+树的约束,我们需要对整棵树进行递归的合并、分裂等调整操作,而不同节点在磁盘上的位置很可能并不是连续的,这就导致我们需要不断地做随机写入的操作,而随机写入的性能是比较差的,这个问题在写多读少的场景下会更加明显。LSMTree(LogStructureMergeTree)是比B+树更适合写多读少场景的索引结构,也广泛应用在各大NoSQL中。比如基于LSM树实现底层索引结构的RocksDB、LevelDB。LSMTree的实现原理:LSM树包含了