首页手记为什么尽量避免使用 IN 和 NOT IN？

为什么尽量避免使用 IN 和 NOT IN？

标签：

MySQL 数据库

# 为什么尽量避免使用 `IN` 和 `NOT IN`？

## 前言

![](https://ppt-1309784708.cos.ap-chongqing.myqcloud.com/pptback/article/2025/clipboard_20250128_051011.png)

在SQL查询中，`IN` 和 `NOT IN` 是常用的关键字，用于筛选符合条件的数据。

然而，尽管它们使用方便，但在某些情况下，使用它们可能会导致效率低下或查询结果不准确。

本文将从效率和潜在问题两个角度，深入探讨为什么应尽量避免使用 `IN` 和 `NOT IN`，并提供替代方案。

## 一、效率问题

### 1. `NOT IN` 的性能瓶颈

在SQL查询中，`NOT IN` 往往会导致性能问题，尤其是在处理大数据集时。

以下是一个典型的例子：

假设有两个表 `t1` 和 `t2`，每个表都有150万条数据，且 `phone` 字段上都有索引。

我们想查询 `t1` 中 `phone` 不在 `t2` 中的记录：

```sql

SELECT * FROM t1

WHERE phone NOT IN (SELECT phone FROM t2);

```

这条查询可能会运行得非常慢，甚至需要十几分钟才能完成。

原因是 `NOT IN` 子查询无法有效利用索引，尤其是在子查询返回的结果集较大时，数据库引擎需要逐条比较，导致性能急剧下降。

### 2. 使用 `NOT EXISTS` 优化

相比之下，`NOT EXISTS` 是一种更高效的替代方案。

同样的查询可以改写为：

```sql

SELECT * FROM t1

WHERE NOT EXISTS (SELECT 1 FROM t2 WHERE t1.phone = t2.phone);

```

这种写法通常只需要20秒左右即可完成查询，性能提升显著。原因是 `NOT EXISTS` 可以在子查询中利用索引，避免了全表扫描。

---

## 二、潜在问题

### 1. `IN` 子查询中的列名错误

`IN` 子查询的一个潜在问题是，如果列名写错，查询可能不会报错，但会返回错误的结果。

例如：

```sql

SELECT id1 FROM test1

WHERE id1 IN (SELECT id1 FROM test2);

```

在这个例子中，`test2` 表中并没有 `id1` 列，但查询不会报错，而是返回 `test1` 中的所有记录。

这是因为 `IN` 子查询中的列名错误被忽略，导致查询逻辑失效。

### 2. `NOT IN` 与 `NULL` 值的问题

`NOT IN` 在处理包含 `NULL` 值的数据时，可能会导致查询结果不准确。

例如：

```sql

SELECT id1 FROM test1

WHERE id1 NOT IN (SELECT id2 FROM test2);

```

如果 `test2` 中的 `id2` 列包含 `NULL` 值，查询将不会返回任何结果。

原因是 `NULL` 值与任何值的比较都会返回 `UNKNOWN`，导致 `NOT IN` 条件无法满足。

## 三、替代方案

为了避免上述问题，可以采用以下替代方案：

#### 1. 使用 `EXISTS` 或 `NOT EXISTS`

`EXISTS` 和 `NOT EXISTS` 是更安全和高效的替代方案。

例如：

```sql

-- 查询存在于 test2 中的 test1 记录

SELECT * FROM test1

WHERE EXISTS (SELECT 1 FROM test2 WHERE test2.id2 = test1.id1);

-- 查询不存在于 test2 中的 test1 记录

SELECT * FROM test1

WHERE NOT EXISTS (SELECT 1 FROM test2 WHERE test2.id2 = test1.id1);

```

### 2. 使用 `JOIN`

`JOIN` 也可以用来替代 `IN` 和 `NOT IN`。

例如：

```sql

-- 查询存在于 test2 中的 test1 记录

SELECT test1.id1

FROM test1

INNER JOIN test2 ON test1.id1 = test2.id2;

-- 查询不存在于 test2 中的 test1 记录

SELECT test1.id1

FROM test1

LEFT JOIN test2 ON test1.id1 = test2.id2

WHERE test2.id2 IS NULL;

```

---

## 四、何时可以使用 `IN` 和 `NOT IN`？

尽管 `IN` 和 `NOT IN` 存在一些问题，但在某些情况下仍然可以使用。

例如，当查询的条件是一个确定且有限的集合时，`IN` 是合适的：

```sql

SELECT * FROM test1

WHERE id1 IN (1, 2, 3);

```

这种写法简洁明了，且不会导致性能问题。

## 五、总结

- **效率问题**：`NOT IN` 在处理大数据集时性能较差，建议使用 `NOT EXISTS` 或 `JOIN` 替代。

- **潜在问题**：`IN` 和 `NOT IN` 容易因列名错误或 `NULL` 值导致查询结果不准确。

- **替代方案**：优先使用 `EXISTS`、`NOT EXISTS` 或 `JOIN`，以提高查询效率和准确性。

- **适用场景**：在确定且有限的集合中，`IN` 和 `NOT IN` 仍然可以使用。

通过合理选择查询方式，可以有效提升SQL查询的性能和可靠性。

– 欢迎点赞、关注、转发、收藏【我码玄黄】，各大平台同名。

点击查看更多内容

为 TA 点赞

若觉得本文不错，就分享一下吧！

评论

评论

共同学习，写下你的评论

评论加载中...

展开查看更多评论

作者其他优质文章

正在加载中

我码玄黄

软件工程师

手记
篇

粉丝

1

获赞与收藏

0

关注作者，订阅最新文章

阅读免费教程

MySQL 进阶教程

32个小节 53705 1002

MySQL 入门教程

32个小节 135902 1702

后端通用面试教程

41个小节 32882 371

推荐

评论

收藏

共同学习，写下你的评论



感谢您的支持，我会继续努力的～

扫码打赏，你说多少就多少

赞赏金额会直接到老师账户

支付方式

打开微信扫一扫，即可进行扫码打赏哦

今天注册有机会得

100积分直接送

付费专栏免费学

大额优惠券免费领

立即参与放弃机会

点击
抽奖

慕课手记新用户专享福利

恭喜你，你的运气太好了，居然抽中了 100个积分！

恭喜你，抽中了价值元的专栏！

太棒了，直接落到你账户里！

积分商城里的罗技鼠标、机械键盘、
Kindle 阅读器、小米平衡车
Apple iPad （10.2英寸）、大额优惠券
在等着你去兑换了噢

作者：

免费赠送

兑换码：1111222211 复制

优惠券可用于购买实战课、体系课
无门槛使用

先去看看，有什么好东西马上兑换我爱学习，选课去


热搜

最近搜索清空

为什么尽量避免使用 IN 和 NOT IN？

阅读免费教程