-
Transformation查看全部
-
Hadoop离线处理、对时效性要求不高(中间数据会落到磁盘);Spark时效性要求高(基于内存),机器学习领域。查看全部
-
kayvalue对的常用操作查看全部
-
keyvalue对常用的一些函数查看全部
-
action常用函数-2查看全部
-
action 常用函数查看全部
-
匿名函数查看全部
-
lines代表整个弹性分布式数据集(RDD)(不管被切割多少份均可)查看全部
-
sparkcontext加载一个文本文件查看全部
-
SparkContext查看全部
-
spark 1.6.2--Scala 2.10 Spark 2.0.0-Scala 2.11查看全部
-
批处理,迭代式计算,交互查询,流处理其功能查看全部
-
spark shell 实例 val lines(变量)=sc.textFile("../../hellospark") lines.count() lines.first() 把文本文件加载成RDD复制给lines的RDD查看全部
-
hadoop 离线处理 时效性不高 但数据可以存储 spark 内存处理 高效 机器学习领域 不具备hdfs存储,需要借助hdfs查看全部
-
spark core 任务调度 内存管理 容错机制 RDDS API spark sql 数据存储 报表 sparl streaming 数据流处理 mlib 机器学习包查看全部
举报
0/150
提交
取消