原文链接:袋鼠云数栈基于CBO在SparkSQL优化上的探索一、SparkSQLCBO选型背景SparkSQL的优化器有两种优化方式:一种是基于规则的优化方式(Rule-BasedOptimizer,简称为RBO);另一种是基于代价的优化方式(Cost-BasedOptimizer,简称为CBO)。1、RBO是传统的SQL优化技术RBO是发展比较早且比较成熟的一项SQL优化技术,它按照制定好的一系列优化规则对SQL语法表达式进行转换,最终生成一个最优的执行计划。RBO属于一种经验式的优化方法,严格按照既定的规则顺序进行匹配,所以不同的SQL写法直接决定执行效率不同。且RBO对数据不敏感,在表大