-
sprak 快速,扩充了mapreduce计算模型 基于内存计算 通用 批处理 迭代式计算 交互查询 流处理 优点 降低维护成本 高度开放 有python java scala 与 hadoop kalfka查看全部
-
spark安装查看全部
-
lazy evaluation 延迟计算,有点类似hibernate的延迟加载查看全部
-
foreach() 结果不返回到本地查看全部
-
spark 和hadoop的比较 应用场景 hadoop的中间数据落在硬盘上 时效性不好 spark是基于内存的,中间数据在硬盘上,计算时间是秒级的 spark适合于机器学习 spark不具有HDFS的存储能力,要借助HDFS等持久化数据查看全部
-
spark有很多组件(紧密集成): spark core spark sql spark streaming(实时流处理) Mlib(机器学习) Graphx 图计算 继承了RDD API Cluster Managers 集群管理 紧密集成的优点:-----查看全部
-
spark是一个快速并且通用的集群计算平台 快速:t级别 秒级别 spark是基于内存的计算 spark的功能:批处理 迭代式计算 交互查询 流计算 spark是高度开放的 :提供了python java Scala sql的API 与其他的大数据工具整合的很好查看全部
-
rdd不可改变查看全部
-
resilient distributed datasets查看全部
-
不错查看全部
-
Action查看全部
-
启动master、worker 提交作业查看全部
-
mark查看全部
-
紧密集成的优点: Spark底层优化了,基于Spark底层的组件,也得到了相应的优化. 紧密集成,节省了各个组件组合使用时的步数,测试等时间. 向Spark增加新的组件时,其他组件,可立刻享用新组件的功能.查看全部
-
Cluster Managers:集群管理,Spark自带一个集群管理是单独调度器.查看全部
举报
0/150
提交
取消