-
批量计算 流式计算 数据到达 计算开始前数据已准备好 计算进行中数据持续到来 计算周期 计算完成后会结束计算 一般会作为服务持续运行 使用场景 时效性要求低的场景 时效性要求高的场景查看全部
-
流式计算和批量计算的整合,目前的工具有查看全部
-
Grouping方式查看全部
-
Nimbus查看全部
-
111查看全部
-
Trident API替代了transcation API保证事务查看全部
-
石头查看全部
-
分布式查看全部
-
hdoop查看全部
-
google的三篇论文查看全部
-
Nimbus挂掉,换台机器重启就可 supervisor挂掉,将上面的worker迁移走就可以 worker挂掉,利用ack机制保证数据未处理成功,会通知spout重新发送.需要对记录通过msgId进行去重.也就是spout发送tuple时指定msgId, spout也挂掉: 可以将数据记录到外部存储,设置checkpoint。查看全部
-
Spout继承BaseRichSpout 并包含几个方法(声明字段、初始化、数据读取和输出) Spout中 nextTuple方法:随机读取String sentence中的句子通_collector.emit(next)发送给下游查看全部
-
官网下载地址:storm.apache.org/downloads.html 尽量不要选src,因为压缩包为src类型的是源码,需要编译。 0.9.5.zip版本下载,在current release下面。 maven是storm的项目管理工具,需要在maven官网下载maven。 Maven官网: 下载地址链接:archive.apache.org/dist/maven/binaries 解压maven.把maven的目录解压到bin目录里面查看全部
-
storm采用主从结构,主Nimbus和多个从Supervisor. Nimbus只负责管理性的工作. 单点问题必须保证主节点是无状态的,重启就能恢复,相关元数据配置信息都是存储在zookeeper上。 Supervisor主要听Nimbus的话管理启动和监控worker。 worker是真正干活的进程负责数据传输和计算.查看全部
-
storm 作业提交运行流程查看全部
举报
0/150
提交
取消