Spark从零开始_学习笔记

首页免费课 Spark从零开始笔记

Spark从零开始

最热最新

秋天的木头 00:36

Collect()遍历整个RDD 向drive program返回RDD的内容需要单机内存能够容纳下（因为要拷贝给driver，一般测试使用），大数据的时候，使用saveAsTextFile() action保存文件中去。 raduce() 接收一个函数，作用在RDD两个类型相同的元素上，返回新元素。可以实现RDD中元素的累加，计数，和其他类型的聚集操作。val sum=rdd.reduce((x,y)=>x+y)。 top()根据RDD中的数据的比较器 take(n) 返回RDD的n个元素（同时尝试访问最少的partitions）返回结果是无序的，一般测试使用。 foreach()计算RDD中的每个元素，但不返回到本地。可以配合println()友好的打印出数据。

查看全部

0 采集收起来源：RDD基本操作之Action
2018-03-22
秋天的木头 06:38

Transformat类型函数

查看全部

0 采集收起来源：RDDs基本操作之Transformations（二）
2017-06-14
秋天的木头 05:48

filter函数

查看全部

0 采集收起来源：RDDs基本操作之Transformations（一）
2017-06-14
秋天的木头 04:33

map函数

查看全部

0 采集收起来源：RDDs基本操作之Transformations（一）
2017-06-14
秋天的木头 07:38

spark-shell的使用

查看全部

0 采集收起来源：spark安装
2017-06-14
滕玉龙 01:44

比较

查看全部

0 采集收起来源：Spark与Hadoop的比较
2017-06-14
劉爺 00:30

combineByKey()

查看全部

0 采集收起来源：KeyValue对RDDs(二)
2017-06-11
劉爺 17:41

spark运行程序

查看全部

0 采集收起来源：开发第一个Spark程序
2017-06-11
劉爺 03:33

三种集群管理调度器 hadoop YARN (常用) Apache Mesos spark Cluster Managers

查看全部

0 采集收起来源：Spark生态介绍
2017-06-10
劉爺 01:02

spark组件

查看全部

0 采集收起来源：Spark生态介绍
2017-06-10
劉爺 02:35

spark特点批处理=hadoop 迭代计算=其它?? 交互查询=Hive 流处理=storm

查看全部

0 采集收起来源：Spark简介
2017-06-10
慕先生3168773 01:06

Spark组件

查看全部

0 采集收起来源：Spark生态介绍
2017-06-10
qq_凉城_7 00:37

rdds

查看全部

0 采集收起来源：Rdds介绍
2017-05-30
qq_凉城_7 11:30

启动集群

查看全部

0 采集收起来源：开发第一个Spark程序
2017-05-30
qq_凉城_7 05:22

项目版本

查看全部

0 采集收起来源：Spark开发环境搭建
2017-05-24

首页上一页 37 38 39 40 41 42 43 下一页尾页

0/150

提交

取消

开始学习

课程须知: 1、简单Linux的操作

老师告诉你能学到什么？: 1、了解Spark到底是什么 2、了解Spark和Hadoop的区别 3、了解Spark的基础知识和概念 4、掌握Spark RDD的基本操作和特性 5、掌握Spark程序的开发和部署流程

微信扫码，参与3人拼团

热搜

最近搜索清空

Spark从零开始