为了账号安全,请及时绑定邮箱和手机立即绑定

谁在听不懂大数据算我输——大数据核心技术spark

标签:
Spark

上次,小编给大家介绍什么是大数据以及大数据产生的五大原因!

那,大数据来了,作为程序员的我们如何迎接大数据的到来?

那便只有学好大数据,其中的重中之重我觉得就是spark ,那什么是spark呢?或者说Spark是干嘛的

我总结出四点:

1、Spark分布式的计算框架

2、类似Hadoop生态圈中的MapReduce(分布式计算框架)

3、计算思想和MR(MapReduce简称)非常的相似,都是分而治之的思想

4、Spark比MR火

为什么Spark比MR火呢?就是因为spark的优势所在

1、Speed 速度很快

从时间上来看,Spark计算效率比MR要高100倍以上

2、使用方便

1)支持使用多门语言来编写Spark Application

2)Spark提供了80多种方法来供我们使用

3、强通用性

Spark生态圈中的组件都是基于SparkCore封装起来

庞大的生态圈并且还能无缝集成

4、强适用性

1)Spark Application可以运行在各种各样的资源调度框架上

2)Spark可以接受上百种数据源

spark的现状

官网介绍,到2016年底,有1000多家组织机构正式使用Spark做数据处理。到现在Spark的发展也是如火如荼,到现在好多组织也是从MR往spark转。



作者:A尚学堂Nancy老师
链接:https://www.jianshu.com/p/2afb774c96fb


点击查看更多内容
TA 点赞

若觉得本文不错,就分享一下吧!

评论

作者其他优质文章

正在加载中
  • 推荐
  • 评论
  • 收藏
  • 共同学习,写下你的评论
感谢您的支持,我会继续努力的~
扫码打赏,你说多少就多少
赞赏金额会直接到老师账户
支付方式
打开微信扫一扫,即可进行扫码打赏哦
今天注册有机会得

100积分直接送

付费专栏免费学

大额优惠券免费领

立即参与 放弃机会
意见反馈 帮助中心 APP下载
官方微信

举报

0/150
提交
取消