为了账号安全,请及时绑定邮箱和手机立即绑定

Spark从零开始

Terby JAVA开发工程师
难度初级
时长 2小时18分
学习人数
综合评分9.80
56人评价 查看评价
9.8 内容实用
9.7 简洁易懂
9.9 逻辑清晰
Key不是不能重复么
➢ 快速且通用的集群计算平台
➢ spark是快速的
○ Spark扩充了流行的Mapreduce计算模型
○ Spark是基于内存的计算
➢ spark是通用的
○ 容纳了其他分布式系统拥有的功能:批处理、迭代式计算、交互查询和流处理,方便维护
○ 优点:降低了维护成本
➢ spark是高度开放的
○ Spark提供了Python,Java,Scala,SQL的API和丰富的内置库。
○ Spark和其他的大数据工具整合的很好,包括hadoop,kafka等。

最新回答 / AnananananD
ssh是个网络协议,用于远程控制。配置ssh免密防止启动集群的时候每次都要输入密码
这里的匿名函数很像Python中的lambda表达式

+ 我来回答 回答最高可+2积分

最新回答 / 懂渊
没发现,只能看其他实战课程了
谢谢讲解 不错
你好,ppt能下载吗

最赞回答 / 哎呀阿坨
老师讲的那个500G文件分成5个文件是建立在文件在hdfs的基础上的,使用hdfs的文件系统路径,一次性拿文件全部内容
讲的还挺好>"'<

最新回答 / 慕妹9162326
sc is short for sparkContext stand for sparkContext

最新回答 / Coin_0003
本地和hdfs都可以,视频中示例写的是本地相对路径

最新回答 / 歪脖子的托雷斯
如果安装有hadoop环境,可以使用spark读取hdfs上的文件<...code...>

最新回答 / 慕的地1117626
使用standalone mode启动spark:命令行输入<...code...>参考https://uohzoaix.github.io/studies//2014/09/13/sparkRunning/
后续课程什么时候出呀
课程须知
1、 简单Linux的操作
老师告诉你能学到什么?
1、了解Spark到底是什么 2、了解Spark和Hadoop的区别 3、了解Spark的基础知识和概念 4、掌握Spark RDD的基本操作和特性 5、掌握Spark程序的开发和部署流程

微信扫码,参与3人拼团

意见反馈 帮助中心 APP下载
官方微信
友情提示:

您好,此课程属于迁移课程,您已购买该课程,无需重复购买,感谢您对慕课网的支持!

本次提问将花费2个积分

你的积分不足,无法发表

为什么扣积分?

本次提问将花费2个积分

继续发表请点击 "确定"

为什么扣积分?

举报

0/150
提交
取消