为了账号安全,请及时绑定邮箱和手机立即绑定

为什么尽量避免使用 IN 和 NOT IN?

标签:
MySQL 数据库

# 为什么尽量避免使用 `IN``NOT IN`


## 前言


![](https://ppt-1309784708.cos.ap-chongqing.myqcloud.com/pptback/article/2025/clipboard_20250128_051011.png)


在SQL查询中,`IN``NOT IN` 是常用的关键字,用于筛选符合条件的数据。


然而,尽管它们使用方便,但在某些情况下,使用它们可能会导致效率低下或查询结果不准确。


本文将从效率和潜在问题两个角度,深入探讨为什么应尽量避免使用 `IN``NOT IN`,并提供替代方案。


## 一、效率问题


### 1. `NOT IN` 的性能瓶颈


在SQL查询中,`NOT IN` 往往会导致性能问题,尤其是在处理大数据集时。


以下是一个典型的例子:


假设有两个表 `t1``t2`,每个表都有150万条数据,且 `phone` 字段上都有索引。


我们想查询 `t1``phone` 不在 `t2` 中的记录:


```sql

SELECT * FROM t1

WHERE phone NOT IN (SELECT phone FROM t2);

```


这条查询可能会运行得非常慢,甚至需要十几分钟才能完成。


原因是 `NOT IN` 子查询无法有效利用索引,尤其是在子查询返回的结果集较大时,数据库引擎需要逐条比较,导致性能急剧下降。


### 2. 使用 `NOT EXISTS` 优化


相比之下,`NOT EXISTS` 是一种更高效的替代方案。


同样的查询可以改写为:


```sql

SELECT * FROM t1

WHERE NOT EXISTS (SELECT 1 FROM t2 WHERE t1.phone = t2.phone);

```


这种写法通常只需要20秒左右即可完成查询,性能提升显著。原因是 `NOT EXISTS` 可以在子查询中利用索引,避免了全表扫描。


---


## 二、潜在问题


### 1. `IN` 子查询中的列名错误


`IN` 子查询的一个潜在问题是,如果列名写错,查询可能不会报错,但会返回错误的结果。


例如:


```sql

SELECT id1 FROM test1

WHERE id1 IN (SELECT id1 FROM test2);

```


在这个例子中,`test2` 表中并没有 `id1` 列,但查询不会报错,而是返回 `test1` 中的所有记录。


这是因为 `IN` 子查询中的列名错误被忽略,导致查询逻辑失效。


### 2. `NOT IN``NULL` 值的问题


`NOT IN` 在处理包含 `NULL` 值的数据时,可能会导致查询结果不准确。


例如:


```sql

SELECT id1 FROM test1

WHERE id1 NOT IN (SELECT id2 FROM test2);

```


如果 `test2` 中的 `id2` 列包含 `NULL` 值,查询将不会返回任何结果。


原因是 `NULL` 值与任何值的比较都会返回 `UNKNOWN`,导致 `NOT IN` 条件无法满足。


## 三、替代方案


为了避免上述问题,可以采用以下替代方案:


#### 1. 使用 `EXISTS``NOT EXISTS`


`EXISTS``NOT EXISTS` 是更安全和高效的替代方案。


例如:


```sql

-- 查询存在于 test2 中的 test1 记录

SELECT * FROM test1

WHERE EXISTS (SELECT 1 FROM test2 WHERE test2.id2 = test1.id1);


-- 查询不存在于 test2 中的 test1 记录

SELECT * FROM test1

WHERE NOT EXISTS (SELECT 1 FROM test2 WHERE test2.id2 = test1.id1);

```


### 2. 使用 `JOIN`


`JOIN` 也可以用来替代 `IN``NOT IN`


例如:


```sql

-- 查询存在于 test2 中的 test1 记录

SELECT test1.id1

FROM test1

INNER JOIN test2 ON test1.id1 = test2.id2;


-- 查询不存在于 test2 中的 test1 记录

SELECT test1.id1

FROM test1

LEFT JOIN test2 ON test1.id1 = test2.id2

WHERE test2.id2 IS NULL;

```


---


## 四、何时可以使用 `IN``NOT IN`


尽管 `IN``NOT IN` 存在一些问题,但在某些情况下仍然可以使用。


例如,当查询的条件是一个确定且有限的集合时,`IN` 是合适的:


```sql

SELECT * FROM test1

WHERE id1 IN (1, 2, 3);

```


这种写法简洁明了,且不会导致性能问题。


## 五、总结


- **效率问题**`NOT IN` 在处理大数据集时性能较差,建议使用 `NOT EXISTS``JOIN` 替代。

- **潜在问题**`IN``NOT IN` 容易因列名错误或 `NULL` 值导致查询结果不准确。

- **替代方案**:优先使用 `EXISTS``NOT EXISTS``JOIN`,以提高查询效率和准确性。

- **适用场景**:在确定且有限的集合中,`IN``NOT IN` 仍然可以使用。


通过合理选择查询方式,可以有效提升SQL查询的性能和可靠性。


– 欢迎点赞、关注、转发、收藏【我码玄黄】,各大平台同名。


点击查看更多内容
TA 点赞

若觉得本文不错,就分享一下吧!

评论

作者其他优质文章

正在加载中
  • 推荐
  • 评论
  • 收藏
  • 共同学习,写下你的评论
感谢您的支持,我会继续努力的~
扫码打赏,你说多少就多少
赞赏金额会直接到老师账户
支付方式
打开微信扫一扫,即可进行扫码打赏哦
今天注册有机会得

100积分直接送

付费专栏免费学

大额优惠券免费领

立即参与 放弃机会
意见反馈 帮助中心 APP下载
官方微信

举报

0/150
提交
取消