-
安装maven,将maven加入bin目录中,测试是否可以使用查看全部
-
storm ui时storm提供页面查看和管理的查看全部
-
完成一个分布式的rpc服务,只有用户使用rpc时用,一般情况下并不需要查看全部
-
加了个中间层进行管理查看全部
-
真正进行数据计算和传输的都是有里面的worder进行查看全部
-
听nimbus的话,但他也不进行数据的计算和传输查看全部
-
单点上,无状态,重启后就可以运行,只是一些管理的工作,如果当掉,其他的数据还会正常运行查看全部
-
strom 开源的分布式的流式系统查看全部
-
apache strorm 开源 分布式 流式系统查看全部
-
批量计算和流式计算对比查看全部
-
Google分布式计算的三个基础查看全部
-
一台机器 三年出一次故障 1000台机器 每天出故障的概率 1 - 0.999^1000 = 63.2% 故障处理 Nimbus故障,换台机器重启即可 Supervisor挂掉,迁移其上Worker即可 worker挂掉 数据丢失 处理超时 Spout数据保障 不丢:Acker机制保证数据如果未成功处理,可以及时发现,并通知Spout重发 不重:使用msgID去重 NextTuple中, emit时,指定msgID Bolt容错 emit时,锚定输入Tuple ack输入tuple Trident API 为用户屏蔽掉一些状态与计算一致的细节 使用户更方便的书写可容错的作业查看全部
-
批量计算与流式计算的区别查看全部
-
spout负责读取数据,下游bolt负责读取数据并shuffle,再由下面的bolt写到data-sink,总体和mr比较像。但因为是流式计算,不会像mr一样完成之后再输出结果,它会来一个数据就输出一次。查看全部
-
topology任务结构 -spout数据源节点 -bolt普通计算节点 -stream数据流 -tuple记录查看全部
举报
0/150
提交
取消