-
spark的组件
cluster managers,集群管理,单独调度器
查看全部 -
spark的组件
graphx,处理图的库
查看全部 -
spark的组件
mlib,用于机器学习,是集群的,而之前的python只用于单机模式
支持集群上的横向扩展
应用场景,机器学习
查看全部 -
spark的组件
spark streaming,类似storm 用作实时流数据操作
查看全部 -
spark的组件
spark sql就像hive sql、mysql一样
查看全部 -
spark的组件,spark core
查看全部 -
spark历史
转到apache项目,成为顶级项目
查看全部 -
spark历史介绍,引入内存存储
查看全部 -
spark课程大纲,需要动手搭建一套spark大数据平台
查看全部 -
spark是高度开放的,能很好的整合Hadoop、kafka等
查看全部 -
spark是通用的,不用再单独搭建批处理、交互查询和流处理等,即包括了Hadoop和sorm等功能。
查看全部 -
大数据 spark的特点
查看全部 -
RDDS基本操作之Transfrormation
查看全部 -
安装版本要求:
Spark1.6.2 - Scala 2.10
Spark2.0.0 - Scala 2.11
wget https://archive.apache.org/dist/spark/spark-2.3.2/spark-2.3.2-bin-hadoop2.6.tgz
解压:tar -zxvf sp.....
下载Scala: wget https://downloads.lightbend.com/scala/2.10.5/scala-2.10.5.tgz
解压:tar -zxvf xxxxxx
之后下载:IntelliJ IDEA https://www.jetbrains.com/idea/
IntelliJ IDEA注册码:http://idea.lanyus.com/
查看全部 -
map函数查看全部
举报