为了账号安全,请及时绑定邮箱和手机立即绑定

走进大数据之storm流式计算基础

acmol 其它
难度初级
时长 1小时11分
学习人数
综合评分8.93
47人评价 查看评价
9.0 内容实用
8.6 简洁易懂
9.2 逻辑清晰
  • zookeeper配置
    查看全部
    0 采集 收起 来源:实际搭建Storm

    2018-01-01

  • Mapreduce的组成示例
    查看全部
  • 处理过程示例图
    查看全部
  • Spout、Bolt、Stream、Tuple
    查看全部
  • mvn exec:java "-Dstorm.topology=storm.starter.WordCountTopology"
    查看全部
    0 采集 收起 来源:Storm IDE的搭建

    2018-03-22

  • storm作业提交运行流程 1.用户编写storm Topolgy(wordCountTopology) 一个用户作业 2.使用client提交Topolgy给nimbus 3.nimbus提派Task给supervisor 4.supervisor为task启动worker 5.worker执行task -------------------------- storm采用主从结构,主Nimbus和多个从Supervisor,Nimbus只负责管理性的工作单点问题必须保证主节点是无状态的,重启就能恢复,相关元数据配置信息都是存储在zookeeper上。Supervisor主要听Nimbus的话管理启动和监控worker, worker是真正干活的进程负责数据传输和计算. ------------------------------- Storm 主从结构 Nimbus 主节点,只负责整体分配工作,不具体干活 Supervisor 从节点,维护每台机器,直接管理干活的Worker Worker 真正干活的(task)进程,数据计算和传输 DRPC Storm UI 监控WEB 运行流程 用户编写作业 使用客户端提交给Nimbus Nimbus指派Task给Supervisor Supervisor 为task启动Worker Worker 执行Task
    查看全部
    0 采集 收起 来源:Storm组件

    2017-12-31

  • Storm 主从结构 Nimbus 主节点,只负责整体分配工作,不具体干活 Supervisor 从节点,维护每台机器,直接管理干活的Worker Worker 真正干活的(task)进程,数据计算和传输 DRPC Storm UI 监控WEB 运行流程 用户编写作业 使用客户端提交给Nimbus Nimbus指派Task给Supervisor Supervisor 为task启动Worker Worker 执行Task
    查看全部
    0 采集 收起 来源:Storm组件

    2017-12-31

  • 批量计算 流式计算 数据到达 计算开始前数据已准备好 计算进行中数据持续到来 计算周期 计算完成后会结束计算 一般会作为服务持续运行 使用场景 时效性要求低的场景 时效性要求高的场景
    查看全部
    0 采集 收起 来源:Storm起源_2

    2017-12-31

  • hadoop生态
    查看全部
    0 采集 收起 来源:分布式起源

    2017-12-31

  • google的三篇论文
    查看全部
    0 采集 收起 来源:分布式起源

    2017-12-31

  • 1.分清流式计算(实效要求高的场景)与批量计算(实效要求不高的场景)各自的适用场景 2.知道流式计算中时效性和正确性的取舍 GFS,bigTable,Mapreduce只适合解决批量计算的场景,只能先收集数据收集得足够多之后,再进行Mapreduce处理,处理完后结束计算。 搜索引警恶意点击分析,需要实时知道点击是否是恶意点击.以减少损失. apache storm流式数据则是数据持续不断到来,一般做为一个服务持续不断运行. 流式计算与批量计算整合开源框架(summint bird(trite),cloud data flow(谷歌))
    查看全部
    0 采集 收起 来源:strom概述

    2017-12-31

  • 批量计算和流式计算
    查看全部
    0 采集 收起 来源:Storm起源_2

    2017-11-23

  • 用户编写Storm Topolgy 使用Client提交Topology给Nimbus Nimbus指派Task给Supervisor Supervisor为Task启动Worker Worker执行Task
    查看全部
    0 采集 收起 来源:Storm组件

    2017-11-14

  • 批量计算 流式计算 计算开始前数据已准备好 计算进行中数据持续到来 计算完成后结束计算 一般会作为服务持续运行 时效性要求低的场景 时效性要求高的场景
    查看全部
    0 采集 收起 来源:Storm起源_2

    2017-11-14

  • 分布式:把一个任务拆解给多个计算机去执行,多个计算机执行同一个任务。
    查看全部
    0 采集 收起 来源:分布式起源

    2017-11-14

举报

0/150
提交
取消
课程须知
本课程是Storm初级课程,对用户要求不多,但: 1.讲解API时使用的是Java API,需要用户掌握Java基本语法。 2.最好用过hadoop,或者其它分布式批处理计算系统,会更容易理解一些东西。
老师告诉你能学到什么?
1、流式计算起源 2、Storm组成与基本原理 3、Storm基本API用法 4、Storm集群搭建

微信扫码,参与3人拼团

意见反馈 帮助中心 APP下载
官方微信
友情提示:

您好,此课程属于迁移课程,您已购买该课程,无需重复购买,感谢您对慕课网的支持!