走进大数据之storm流式计算基础_学习笔记

首页免费课走进大数据之storm流式计算基础笔记

走进大数据之storm流式计算基础

最热最新

暗淡蓝点6730 03:10

zookeeper配置

查看全部

0 采集收起来源：实际搭建Storm
2018-01-01
暗淡蓝点6730 03:45

Mapreduce的组成示例

查看全部

0 采集收起来源：StormAPI基本概念
2018-01-01
暗淡蓝点6730 01:34

处理过程示例图

查看全部

0 采集收起来源：StormAPI基本概念
2018-01-01
暗淡蓝点6730 00:59

Spout、Bolt、Stream、Tuple

查看全部

0 采集收起来源：StormAPI基本概念
2018-01-01
暗淡蓝点6730 00:57

mvn exec:java "-Dstorm.topology=storm.starter.WordCountTopology"

查看全部

0 采集收起来源：Storm IDE的搭建
2018-03-22
暗淡蓝点6730 02:24

storm作业提交运行流程 1.用户编写storm Topolgy(wordCountTopology) 一个用户作业 2.使用client提交Topolgy给nimbus 3.nimbus提派Task给supervisor 4.supervisor为task启动worker 5.worker执行task -------------------------- storm采用主从结构，主Nimbus和多个从Supervisor,Nimbus只负责管理性的工作单点问题必须保证主节点是无状态的，重启就能恢复,相关元数据配置信息都是存储在zookeeper上。Supervisor主要听Nimbus的话管理启动和监控worker, worker是真正干活的进程负责数据传输和计算. ------------------------------- Storm 主从结构 Nimbus 主节点，只负责整体分配工作，不具体干活 Supervisor 从节点，维护每台机器，直接管理干活的Worker Worker 真正干活的（task）进程，数据计算和传输 DRPC Storm UI 监控WEB 运行流程用户编写作业使用客户端提交给Nimbus Nimbus指派Task给Supervisor Supervisor 为task启动Worker Worker 执行Task

查看全部

0 采集收起来源：Storm组件
2017-12-31
暗淡蓝点6730 00:30

Storm 主从结构 Nimbus 主节点，只负责整体分配工作，不具体干活 Supervisor 从节点，维护每台机器，直接管理干活的Worker Worker 真正干活的（task）进程，数据计算和传输 DRPC Storm UI 监控WEB 运行流程用户编写作业使用客户端提交给Nimbus Nimbus指派Task给Supervisor Supervisor 为task启动Worker Worker 执行Task

查看全部

0 采集收起来源：Storm组件
2017-12-31
暗淡蓝点6730 04:11

批量计算流式计算数据到达计算开始前数据已准备好计算进行中数据持续到来计算周期计算完成后会结束计算一般会作为服务持续运行使用场景时效性要求低的场景时效性要求高的场景

查看全部

0 采集收起来源：Storm起源_2
2017-12-31
暗淡蓝点6730 04:21

hadoop生态

查看全部

0 采集收起来源：分布式起源
2017-12-31
暗淡蓝点6730 03:54

google的三篇论文

查看全部

0 采集收起来源：分布式起源
2017-12-31
暗淡蓝点6730 02:24

1.分清流式计算(实效要求高的场景)与批量计算(实效要求不高的场景)各自的适用场景 2.知道流式计算中时效性和正确性的取舍 GFS,bigTable,Mapreduce只适合解决批量计算的场景,只能先收集数据收集得足够多之后,再进行Mapreduce处理，处理完后结束计算。搜索引警恶意点击分析,需要实时知道点击是否是恶意点击.以减少损失. apache storm流式数据则是数据持续不断到来,一般做为一个服务持续不断运行. 流式计算与批量计算整合开源框架(summint bird(trite),cloud data flow(谷歌))

查看全部

0 采集收起来源：strom概述
2017-12-31
moocer9527 04:15

批量计算和流式计算

查看全部

0 采集收起来源：Storm起源_2
2017-11-23
qq_向日葵_45

用户编写Storm Topolgy 使用Client提交Topology给Nimbus Nimbus指派Task给Supervisor Supervisor为Task启动Worker Worker执行Task

查看全部

0 采集收起来源：Storm组件
2017-11-14
qq_向日葵_45

批量计算流式计算计算开始前数据已准备好计算进行中数据持续到来计算完成后结束计算一般会作为服务持续运行时效性要求低的场景时效性要求高的场景

查看全部

0 采集收起来源：Storm起源_2
2017-11-14
qq_向日葵_45

分布式：把一个任务拆解给多个计算机去执行，多个计算机执行同一个任务。

查看全部

0 采集收起来源：分布式起源
2017-11-14

首页上一页 3 4 5 6 7 8 9 下一页尾页

0/150

提交

取消

开始学习

课程须知: 本课程是Storm初级课程，对用户要求不多，但： 1.讲解API时使用的是Java API，需要用户掌握Java基本语法。 2.最好用过hadoop，或者其它分布式批处理计算系统，会更容易理解一些东西。

老师告诉你能学到什么？: 1、流式计算起源 2、Storm组成与基本原理 3、Storm基本API用法 4、Storm集群搭建

微信扫码，参与3人拼团

热搜

最近搜索清空

走进大数据之storm流式计算基础