-
Spark举例说明
查看全部 -
举例说明:
查看全部 -
Scala Shell:
查看全部 -
Python Shell
查看全部 -
Spark的Shell
查看全部 -
Spark目录
查看全部 -
Spark下载
查看全部 -
Spark运行环境
查看全部 -
Hadoop与Spark的比较
查看全部 -
Spark应用场景
1、时效性要求高的场景
2、机器学习领域
查看全部 -
Hadoop应用场景
1、离线处理
2、对时效性要求不高。
查看全部 -
Spark组件具有紧密集成的优点:
1、Spark底层优化了,基于Spark底层的组件,也得到了相应的优化。
2、紧密集成,节省了各个组件组合使用时的部署,测试等时间。
3、向Spark增加新的组件时,其他组件可以立刻享用新组件的功能。
查看全部 -
Clusters Managers:
就是集群管理,Spark自带一个集群管理的单独调度器。
常见的集群管理包括Hadoop YARN,Apache Mesos
查看全部 -
Graphx:
是处理图的库(例如,社交网络图),并进行图的并行计算。像Spark Streaming,Spark SQL一样,它也继承了RDD API。
它提供了各种图的操作,和常用的图算法,例如PangeRank算法。
应用场景,图计算。
查看全部 -
Mlib:
一个包含通用机器学习功能的包,Machine learning lib。
包含分类,聚类,回归等,还包括模型评估,和数据导入。
MLlib提供上面的这些方法,都支持集群上的横向拓展。
应用场景:机器学习
查看全部
举报
0/150
提交
取消