根据配置单元模板:hive.optimize.skewjoin:是否启用倾斜连接优化。算法如下:在运行时,检测具有较大偏斜的键。不处理这些key,而是将它们临时存储在HDFS目录中。在后续的map-reduce作业中,处理那些倾斜的键。不需要为所有表倾斜相同的键,因此,后续的map-reduce作业(对于倾斜的键)会快得多,因为它将是map-join。hive.groupby.skewindata:数据是否存在倾斜优化groupby查询但我不明白是否hive.groupby.skewindata是否依赖于hive.optimize.skewjoin? 最佳答