Java spark2这两个语句有什么区别-Dataset<Row> Data; Data.repartition(new Column("key" )) ; and Data.repartition(Data.col("key" ) ;
1 回答

千巷猫影
TA贡献1829条经验 获得超7个赞
正在做
Data.repartition(new Column("key"));
相当于
import static org.apache.spark.sql.functions.col; Data.repartition(col("key"));
在这些情况下,该列不直接与数据集相关联,Spark 需要在分析阶段解析它。
如果你改用
Data.repartition(Data.col("key");
您正在向 Spark 发出指令,该指令是该列所属的数据集。此方法主要用于连接,例如,您可以拥有两个具有公共列名的数据集。
在您的示例中,结果是等效的,您可以使用两种形式。
添加回答
举报
0/150
提交
取消