本人用的hive,可以理解为关系型数据库,现在的需求是,有一塔数据,数据中都有手机号,我需要看看这一沓数据中有哪些是数据里已经有了的。目前我的做法是,先取一条,然后按照手机号遍历整张表,然后下一条,遍历,下一条,遍历。。。。。。我觉得此法即使加了索引效率也很低,求一个效率高的sql,或者思路 查看完整描述