首页手记 Flink技术架构

Flink技术架构

标签：

机器学习

Apache Flink是一个面向分布式数据流处理和批量数据处理的开源计算平台，它能够基于同一个Flink运行时，提供支持流处理和批处理两种类型应用的功能。Flink将流处理和批处理统一起来，也就是说作为流处理看待时输入数据流是无界的；批处理被作为一种特殊的流处理，只是它的输入数据流被定义为有界的。

Flink特点

支持高吞吐、低延迟、高性能的流处理
支持有状态计算的Exactly-once语义
支持高度灵活的窗口（Window）操作，支持基于time、count、session，以及data-driven的窗口操作
支持基于轻量级分布式快照（Snapshot）实现的容错
一个运行时同时支持Batch on Streaming处理和Streaming处理
Flink在JVM内部实现了自己的内存管理
支持程序自动优化：避免特定情况下Shuffle、排序等昂贵操作，中间结果有必要进行缓存
支持迭代计算

Flink组件栈

Flink以层级式系统形式组件其软件栈、上层依赖下层服务
支持 local、cluster、cloud运行模式
运行时，将dataStream 和 dataSet抽象成jobGraph

Flink进程

JobManagers(master)：用于协调分布式程序执行。它们用来调度task，协调检查点，协调失败时恢复等
TaskManagers(worker)：用于执行一个dataflow的task(或者特殊的subtask)、数据缓冲和data stream的交换。
flink应用程序的执行流程图——standalone
flink应用程序的执行流程图——flink on yarn

Flink程序的核心概念

flink程序三个基本构建块

source：数据源
transformations：基于数据流的一组operate操作
sink：数据处理结果的目的地

并行数据流

One-to-one：类似于spark中的窄依赖
Redistributing：类似于spark中的宽依赖
在flink中，transformation是由一组operator组成，每一个operator被分割成operator subtask，同一个operator的多个 subtasks在不同的线程、不同的物理机或不同的容器中彼此互不依赖得并行执行。
Stream在operator有两种形式

operator chains
出于分布式程序效率考虑，Flink将前后有依赖关系的一组operator的subtask链接在一起形成operator chains。operator chain在一个线程中执行,它能减少线程之间的切换和基于缓存区的数据交换，在减少时延的同时提升吞吐量。链接的行为可以在编程API中进行指定
窗口
flink可以基于窗口对在流上对数据进行聚合操作。flink支持的窗口有：

时间窗口（tumbing windows(不重叠)，sliding windows（有重叠，session windows(有空隙的活动)）
数据窗口（tumbing windows(不重叠)，sliding windows（有重叠，session windows(有空隙的活动)）
事件窗口

时间
Stream中的记录时，记录中通常会包含各种典型的时间字段，Flink支持多种时间的处理:

event Time：表示事件创建时间
Ingestion Time：表示事件进入到Flink Dataflow的时间
Processing Time：表示某个Operator对事件进行处理事的本地系统时间（是在TaskManager节点上）

原文出处

点击查看更多内容

为 TA 点赞

若觉得本文不错，就分享一下吧！

评论

评论

共同学习，写下你的评论

评论加载中...

展开查看更多评论

作者其他优质文章

正在加载中

慕田峪9129951

手记
篇

粉丝

200

获赞与收藏

996

关注作者，订阅最新文章

阅读免费教程

后端通用面试教程

41个小节 32665 368

网络编程入门教程

20个小节 13529 255

Pandas 入门教程

25个小节 20155 383

推荐

1

收藏

共同学习，写下你的评论



感谢您的支持，我会继续努力的～

扫码打赏，你说多少就多少

赞赏金额会直接到老师账户

支付方式

打开微信扫一扫，即可进行扫码打赏哦

今天注册有机会得

100积分直接送

付费专栏免费学

大额优惠券免费领

立即参与放弃机会

点击
抽奖

慕课手记新用户专享福利

恭喜你，你的运气太好了，居然抽中了 100个积分！

恭喜你，抽中了价值元的专栏！

太棒了，直接落到你账户里！

积分商城里的罗技鼠标、机械键盘、
Kindle 阅读器、小米平衡车
Apple iPad （10.2英寸）、大额优惠券
在等着你去兑换了噢

作者：

免费赠送

兑换码：1111222211 复制

优惠券可用于购买实战课、体系课
无门槛使用

先去看看，有什么好东西马上兑换我爱学习，选课去


热搜

最近搜索清空

Flink技术架构

Flink特点

Flink组件栈

Flink进程

Flink程序的核心概念

阅读免费教程