为了账号安全,请及时绑定邮箱和手机立即绑定

Spark中parallelize函数和makeRDD函数的区别?

Spark中parallelize函数和makeRDD函数的区别?

呼啦一阵风 2018-11-14 19:15:55
Spark中parallelize函数和makeRDD函数的区别
查看完整描述

1 回答

?
紫衣仙女

TA贡献1839条经验 获得超15个赞

Spark主要提供了两种函数:parallelize和makeRDD:
1)parallelize的声明:
def parallelize[T: ClassTag](
seq: Seq[T],
numSlices: Int = defaultParallelism): RDD[T]
2)makeRDD的声明:
def makeRDD[T: ClassTag](
seq: Seq[T],
numSlices: Int = defaultParallelism): RDD[T]
def makeRDD[T: ClassTag](seq: Seq[(T, Seq[String])]): RDD[T]
3)区别:
A)makeRDD函数比parallelize函数多提供了数据的位置信息。



查看完整回答
反对 回复 2018-12-10
  • 1 回答
  • 0 关注
  • 1147 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信