为了账号安全,请及时绑定邮箱和手机立即绑定

SQL分组函数和聚合函数的几点说明

标签:
MySQL 大数据

1 分组聚合的原因

SQL中分组函数和聚合函数之前的文章已经介绍过,单说这两个函数有可能比较好理解,分组函数就是group by,聚合函数就是COUNT、MAX、MIN、AVG、SUM。

image-20201129160054748

拿上图中的数据进行解释,假设按照product_type这个字段进行分组,分组之后结果如下图。

SELECT product_type from product
group by product_type

image-20201129160549529

从图中可以看出被分为了三组,分别为厨房用具、衣服和办公用品,就相当于对product_type这个字段进行了去重,确实group by函数有去重的作用。

SELECT DISTINCT product_type from product

假设分组之后,我想看一下价格,也就是sale_price这个字段的值,按照如下这个写法,会报如下错误。

SELECT product_type,sale_price from product
group by product_type

image-20201129164214376

这是为什么呢?原表按照product_type分组之后,厨房用具对应4个值,衣服对应2个值,办公用品对应2个值,这就是在取sale_price这个字段的时候为什么报错了,一个空格中不能填入多个值,这时候就可以用聚合函数了,比如求和,求平均,求最大最小值,求行数。聚合之后的值就只有一个值了。

image-20201129163008895

SELECT product_type,sum(sale_price),avg(sale_price),count(sale_price),max(sale_price) from product
group by product_type

image-20201129164033715

对于多个字段的分组,其原理是一样的。从上述中记住两点:分组去重和分组聚合。

2 distinct和group by去重的区别

  • Distinct 和group by 设计时侧重点不一样

distinct只是为了去重,而group by是为了聚合统计的。

  • 两者都有去重的效果,但是执行的效率不一样

单个字段去重

--DISTINCT
SELECT distinct product_type from product
--GROUP BY
select product_type from product
GROUP BY product_type

image-20201129173357923

多个字段去重

--DISTINCT
SELECT distinct product_name, product_type from product
--GROUP BY
select product_name, product_type from product
GROUP BY product_name, product_type

image-20201129173616585

执行效率

select <列名1>,<列名2>

from<表名>
where 查询条件
group by 分组类别
having 对分组结果指定条件

order by <列名>desclimit 数字

image-20201129174649616

SQL语言的运行顺序,先执行上图中的第一步,然后再执行select子句,最后对结果进行筛选。distinct是在select子句中,而group by在第一步中,所以group by去重比distinct去重在效率上要高。

点击查看更多内容
TA 点赞

若觉得本文不错,就分享一下吧!

评论

作者其他优质文章

正在加载中
  • 推荐
  • 评论
  • 收藏
  • 共同学习,写下你的评论
感谢您的支持,我会继续努力的~
扫码打赏,你说多少就多少
赞赏金额会直接到老师账户
支付方式
打开微信扫一扫,即可进行扫码打赏哦
今天注册有机会得

100积分直接送

付费专栏免费学

大额优惠券免费领

立即参与 放弃机会
意见反馈 帮助中心 APP下载
官方微信

举报

0/150
提交
取消