草庐IT

分库$分表$TiDB

全部标签

分库分表ShardingJDBC最佳实践

1添加依赖org.apache.shardingspheresharding-jdbc-core${sharding.version}2分库分表数选择根据未来两年的业务量,估算两年的业务总量M,单表数据量不能超过N(需要看具体业务场景,字段少的可以适量多一些,可与架构师及部门经验丰富的同事探讨,最大不要超过1000W);总的分表数量K≥M/N,且K值向上取接近的最小2的次幂。例如业务总量M=10亿,单表数量N≤700W,则M/N≈143,向上取最小的2次幂为:143<2的8次方=256,故总的分表数量为256。可将分表数设定的尽可能的小,一台服务器存放多个库,业务增长后,磁盘不足时,可将该服务

深入了解 TiDB SQL 优化器

分享嘉宾:张建PingCAPTiDB优化器与执行引擎技术负责人编辑整理:Druid中国用户组第6次大数据MeetUp出品平台:DataFunTalk导读:本次报告张老师主要从原理上带大家深入了解TiDBSQL优化器中的关键模块,比如应用一堆逻辑优化规则的逻辑优化部分,基于代价的物理优化部分,还有和代价估算密切相关的统计信息等。本文将从以下几个方面介绍:首先讲一下TiDB的整体架构,接下来就是优化器的两个比较重要的模块,一个是SQL优化,做执行计划生成;另一个模块就是统计信息模块,其作用是辅助执行计划生成,为每一个执行计划计算cost提供帮助。最后介绍下优化器还有哪些后续工作需要完成。--01T

深入了解 TiDB SQL 优化器

分享嘉宾:张建PingCAPTiDB优化器与执行引擎技术负责人编辑整理:Druid中国用户组第6次大数据MeetUp出品平台:DataFunTalk导读:本次报告张老师主要从原理上带大家深入了解TiDBSQL优化器中的关键模块,比如应用一堆逻辑优化规则的逻辑优化部分,基于代价的物理优化部分,还有和代价估算密切相关的统计信息等。本文将从以下几个方面介绍:首先讲一下TiDB的整体架构,接下来就是优化器的两个比较重要的模块,一个是SQL优化,做执行计划生成;另一个模块就是统计信息模块,其作用是辅助执行计划生成,为每一个执行计划计算cost提供帮助。最后介绍下优化器还有哪些后续工作需要完成。--01T

TiDB 底层存储结构 LSM 树原理介绍

作者:京东物流刘家存随着数据量的增大,传统关系型数据库越来越不能满足对于海量数据存储的需求。对于分布式关系型数据库,我们了解其底层存储结构是非常重要的。本文将介绍下分布式关系型数据库TiDB所采用的底层存储结构LSM树的原理。1LSM树介绍LSM树(Log-Structured-Merge-Tree)日志结构合并树由PatrickO’Neil等人在论文《TheLog-StructuredMergeTree》(https://www.cs.umb.edu/~poneil/lsmtree.pdf)中提出,它实际上不是一棵树,而是2个或者多个不同层次的树或类似树的结构的集合。LSM树的核心特点是利用

TiDB 底层存储结构 LSM 树原理介绍

作者:京东物流刘家存随着数据量的增大,传统关系型数据库越来越不能满足对于海量数据存储的需求。对于分布式关系型数据库,我们了解其底层存储结构是非常重要的。本文将介绍下分布式关系型数据库TiDB所采用的底层存储结构LSM树的原理。1LSM树介绍LSM树(Log-Structured-Merge-Tree)日志结构合并树由PatrickO’Neil等人在论文《TheLog-StructuredMergeTree》(https://www.cs.umb.edu/~poneil/lsmtree.pdf)中提出,它实际上不是一棵树,而是2个或者多个不同层次的树或类似树的结构的集合。LSM树的核心特点是利用

分库分表很常见,但这些问题90%的人都答不全

  分库分表,是企业里面比较常见的针对高并发、数据量大的场景下的一种技术优化方案,也是一个非常高频的面试题。但是,因为很多人其实并没有非常丰富的分库分表的经验,所以能把这个问题回答得比较好的人其实还挺少的。 那么,本文就来试图把关于分库分表的事情,一次性讲个清楚。 一、分库,分表,分库分表 首先,我们需要知道所谓"分库分表",根本就不是一件事儿,而是三件事儿,他们要解决的问题也都不一样。 这三个事儿分别是"只分库不分表"、"只分表不分库"、以及"既分库又分表"。 1、什么时候分库? 其实,分库主要解决的是并发量大的问题。因为并发量一旦上来了,那么数据库就可能会成为瓶颈,因为数据库的连接数是有限

分库分表很常见,但这些问题90%的人都答不全

  分库分表,是企业里面比较常见的针对高并发、数据量大的场景下的一种技术优化方案,也是一个非常高频的面试题。但是,因为很多人其实并没有非常丰富的分库分表的经验,所以能把这个问题回答得比较好的人其实还挺少的。 那么,本文就来试图把关于分库分表的事情,一次性讲个清楚。 一、分库,分表,分库分表 首先,我们需要知道所谓"分库分表",根本就不是一件事儿,而是三件事儿,他们要解决的问题也都不一样。 这三个事儿分别是"只分库不分表"、"只分表不分库"、以及"既分库又分表"。 1、什么时候分库? 其实,分库主要解决的是并发量大的问题。因为并发量一旦上来了,那么数据库就可能会成为瓶颈,因为数据库的连接数是有限

一文读懂数据库优化之分库分表

   本文从5W1H角度介绍了分库分表手段,其在解决如IO瓶颈、读写性能、物理存储瓶颈、内存瓶颈、单机故障影响面等问题的同时也带来如事务性、主键冲突、跨库join、跨库聚合查询等问题。anyway,在综合业务场景考虑,正如缓存的使用一样,本着非必须勿使用原则。如数据库确实成为性能瓶颈时,在设计分库分表方案时也应充分考虑方案的扩展性,或者考虑采用成熟热门的分布式数据库解决方案,如TiDB。阅读此文你将了解:什么是分库分表以及为什么分库分表如何分库分表分库分表常见几种方式以及优缺点如何选择分库分表的方式 数据库常见优化方案对于后端程序员来说,绕不开数据库的使用与方案选型,那么随着业务规模的逐渐扩大

一文读懂数据库优化之分库分表

   本文从5W1H角度介绍了分库分表手段,其在解决如IO瓶颈、读写性能、物理存储瓶颈、内存瓶颈、单机故障影响面等问题的同时也带来如事务性、主键冲突、跨库join、跨库聚合查询等问题。anyway,在综合业务场景考虑,正如缓存的使用一样,本着非必须勿使用原则。如数据库确实成为性能瓶颈时,在设计分库分表方案时也应充分考虑方案的扩展性,或者考虑采用成熟热门的分布式数据库解决方案,如TiDB。阅读此文你将了解:什么是分库分表以及为什么分库分表如何分库分表分库分表常见几种方式以及优缺点如何选择分库分表的方式 数据库常见优化方案对于后端程序员来说,绕不开数据库的使用与方案选型,那么随着业务规模的逐渐扩大

【建议收藏】7000+字的TIDB保姆级简介,你见过吗

TIDB简介什么是TIDBTiDB是一个分布式NewSQL数据库。它支持水平弹性扩展、ACID事务、标准SQL、MySQL语法和MySQL协议,具有数据强一致的高可用特性,是一个不仅适合OLTP场景还适合OLAP场景的混合数据库。TiDB是PingCAP公司自主设计、研发的开源分布式关系型数据库,是一款同时支持在线事务处理与在线分析处理(HybridTransactionalandAnalyticalProcessing,HTAP)的融合型分布式数据库产品,具备水平扩容或者缩容、金融级高可用、实时HTAP、云原生的分布式数据库、兼容MySQL5.7协议和MySQL生态等重要特性。目标是为用户提