-
Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。
查看全部 -
spark查看全部
-
python-shell scala-shell查看全部
-
map()接收函数,把函数应用到RDD的每一个元素,返回新的RDD
filter()接受函数返回只包含满足filter()函数的元素的薪RDD 例如只包含hello的list
flatMap()对每个输入元素,输出多个元素,将RDD元素压扁后返回一个新的RDD,spilt切割空格,他会将3行压扁为一行进行处理
查看全部 -
版本查看全部
-
Spark的含义:是一个快速且通用的集群计算平台
Spark的特点:
spark是快速的
spark是通用的
spark是高度开放的
查看全部 -
23232
查看全部 -
Spark不具有HDFS的存储能力。
查看全部 -
Spark组件--紧密集成
查看全部 -
Spark组件--Cluster Managers
查看全部 -
Spark组件--Graphx
查看全部 -
Spark组件--Mlib
查看全部 -
Spark组件--Spark Streaming
查看全部 -
Spark组件--Spark SQL
查看全部 -
Spark组件--Spark Core
查看全部
举报
0/150
提交
取消