SQL WHERE 子句中的 IN 与 OR

发布于06月19日

在处理大型数据库时，SQL Where子句中的IN或OR哪个性能更好？

他们的执行方式有什么不同吗？

推荐答案

我假设您想知道以下各项之间的性能差异:

WHERE foo IN ('a', 'b', 'c')
WHERE foo = 'a' OR foo = 'b' OR foo = 'c'

根据manual for MySQL，如果值是常数，则IN对列表进行排序，然后使用二进制搜索.我可以想象OR会一个接一个地判断它们，没有特定的顺序.所以在某些情况下IN更快.

最好的了解方法是使用特定数据在数据库中分析这两种方法，以查看哪种方法更快.

我在一个有1000000行的MySQL上try 了这两种方法.当列被编入索引时，性能没有明显的差异——两者几乎都是即时的.当该列没有索引时，我得到了以下结果:

SELECT COUNT(*) FROM t_inner WHERE val IN (1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000);
1 row fetched in 0.0032 (1.2679 seconds)

SELECT COUNT(*) FROM t_inner WHERE val = 1000 OR val = 2000 OR val = 3000 OR val = 4000 OR val = 5000 OR val = 6000 OR val = 7000 OR val = 8000 OR val = 9000;
1 row fetched in 0.0026 (1.7385 seconds)

所以在这种情况下，使用OR的方法要慢30%.增加更多术语会使差异更大.结果可能因其他数据库和其他数据而异.