SQL中多表JOIN执行顺序由查询优化器基于统计信息、索引、表大小和选择性等估算代价后决定,而非书写顺序;优化器尝试合法排列组合,优先小表驱动、高选择性条件前置、利用有效索引,并依赖准确统计信息。
SQL中多表JOIN的执行顺序并不完全由SQL语句中表的书写顺序决定,而是由查询优化器基于统计信息、索引、表大小、连接条件选择性等因素综合估算代价后确定的。写法只是逻辑描述,真正执行计划可能完全不同。
优化器会尝试多种合法的JOIN排列组合(尤其是对INNER JOIN),计算每种顺序的预估I/O、CPU和内存开销,选择总代价最低的执行路径。关键依据包括:
id = ?)能快速过滤,优化器倾向提前应用ANALYZE TABLE或自动收集的行数、数据分布直方图直接影响代价估算质量即使逻辑等价,以下因素可能导致优化器放弃最优顺序:
STRAIGHT_JOIN或Oracle的USE_NL会强制顺序,覆盖优化器决策ON UPPER(a.name) = UPPER(b.name)可能使索引失效,影响选择性估算不依赖“猜顺序”,而是引导优化器做出更好选择:
ANALYZE TABLE(MySQL)、VACUUM ANALYZE(PostgreSQL)或更新统计信息(SQL Server)IS NULL替代= NULL
Extra列是否含Using join buffer(说明未走索引),或rows是否远超预期优化器的目标是降低整体资源消耗,不是让SQL看起来更“顺”。理解它看什么,比记住“先写小表”更有价值。