为了账号安全,请及时绑定邮箱和手机立即绑定

BigQuery中如何用LIMIT节省时间和提高效率

照片由 Daniel JanzenUnsplash 拍摄。

这里有一个简单的方法,能在分析数据或验证数据转换过程中帮你节省一些时间。

我之前写过一篇关于在BigQuery中使用LIMIT不会节省成本,因为它不影响处理的数据量,只是返回给你的结果数目的文章。

但还是有些时候我还会用LIMIT。

比如说,我在验证一些数据,并想验证我对数据的一个假设。比如说,如果知道哪怕有几个重复记录存在,就可以说明问题存在,并提供了一个可以调查的实例。

我不需要了解表格中的所有重复项,因此我用LIMIT来获取一个观察结果,以与我的预期相矛盾。

即使用了LIMIT,如果我没有收到任何返回结果,那就意味着查询没有找到任何匹配行,这证实了我的最初假设。

在一个足够大的桌子上,你可以注意到使用 LIMIT 和不使用 LIMIT 对查询执行时间的影响。再说一次,从成本角度来看没有区别,但你的时间也是宝贵的 😁。

附注:但这并不意味着LIMIT对BigQuery的性能完全没有影响。可以查看这篇帖子,了解LIMIT确实会对性能产生影响的实例。

原文发布于https://datawise.dev 2024年6月5日。

觉得有用的话,可以订阅我的 notjustsql.com 网站上的 Analytics 通讯,了解更多。

点击查看更多内容
TA 点赞

若觉得本文不错,就分享一下吧!

评论

作者其他优质文章

正在加载中
  • 推荐
  • 评论
  • 收藏
  • 共同学习,写下你的评论
感谢您的支持,我会继续努力的~
扫码打赏,你说多少就多少
赞赏金额会直接到老师账户
支付方式
打开微信扫一扫,即可进行扫码打赏哦
今天注册有机会得

100积分直接送

付费专栏免费学

大额优惠券免费领

立即参与 放弃机会
意见反馈 帮助中心 APP下载
官方微信

举报

0/150
提交
取消