为了账号安全,请及时绑定邮箱和手机立即绑定

百万架构师第二十五课:分布式架构的基础:分布式系统的基石TCP-IP通讯协议|JavaGuide

标签:
Java
  1. 通讯协议在分布式架构中的核心应用
  2. 深入料及TCP/IP和UDP/IP通信协议
  3. TCP流量整形
  4. 基于Java自身技术实现系统通讯
  5. 多任务处理及优化
  6. 了解什么是NIO
  7. 组播协议 Multicast

从集中式的架构到分布式架构粗粒度的架构模型图

从集中式的架构到分布式架构粗粒度的架构模型图

相当于是在整个架构层面上去做一个分层,分层以后会存在按照某一个领域去切分的服务层,存在web层。

​ 如果我们以前是在一个独立的服务模型里边,不需要涉及远程通信,唯一的远程通讯就是客户端和远程端的通讯,现在变成一个分布式架构,那么就意味着:服务层之间彼此会通讯,这样一个通讯的话,就会涉及到一个通讯协议,比如我们现在Web层调用Dubbo层是通过Dubbo协议去调用的,然后Dubbo调用基础服务,是通过socked的TCP通讯去完成一些服务间的对接。

​ 这是通讯在整个分布式架构中的用途。

​ 如果说没有一个远程通信的话,就意味着我们的分布式架构就没有存在的意义和价值。

所以说:

​ 在整个架构里边,通信会涉及协议、序列化、网络通信协议底层的TCP协议和UDP协议。

任务目标

怎么完成一个远程通信???

如果没有远程通信,就没有所谓的分布式系统,我们发送一个消息,会被某一个接收端去接收,那这个消息的形式有很多种。

传输的数据类型

1. 字节流

2. 字节数组

3. java对象

协议类型

外部的系统收到这样一个请求以后需要做一个相应的处理,那这种基于消息方式的通信,在我们的网络层里边,一般来说就涵盖两种。

  1. TCP/IP协议
    
  2. UDP/IP协议
    

网络领域的知识

协议:

TCP/UDP/multicast

IO

远程通信一定涉及IO的形式(BIO、NIO、AIO)

Socket

套接字

NIO

(Netty/Mina)

序列化和反序列化

在网络通信中需要传输一个对象的话,就涉及序列化和反序列化了。

一个Http请求在整个网络中的请求过程

基于OSI的七层网络模型

TCP/IP的四层概念模型

网络为什么要分层,以及在通信时,我们的数据是怎么去传输的。

首先是我们打开一个浏览器,浏览一个网站,这时候相当于应用程序和客户端会产生一个交互。交互就是 TCP的三次握手协议。握手协议是建立一个连接。那在整个通信过程中,数据到底是怎么一个传输方式呢?

一个请求四层协议的发送步骤

先增加一个TCP头,表示一个协议头,

第二个增加IP头,因为IP地址是网卡在网络中的一个通讯地址,相当于要给门牌号,有时候会提示IP地址冲突,因为IP地址是不能冲突的,相当于小区内部的门牌号,是我们网卡的唯一的通讯地址,相当于我们的门牌号。

增加MAC头,MAC头是我们的网卡地址,标识的是这个数据包要发送到的网卡地址,增加的IP头是目标的IP头,它本身自带当前的源IP头。

到了物理层,转换成一个Byte流进行一个传输,通过网络通讯进行一个传输。

比作寄包裹的话:

  • 选择快递公司
    • 地方,省市
      • 姓名,门牌号

IP定位到地方,MAC头定位到它是发给你的,

IP协议,提供了一组数据报文服务,每组服务都是由网络统一处理分发的

IP头有两个东西,一个目的IP地址,一个源IP地址。

接收方的接收步骤

一个请求四层协议的接收步骤

​ 当我们的目标主机收到这样一个目标以后,收到网络上的一个数据帧以后,它就会开始从协议层由底向上升。先到网卡,有两种形式,一种是所有数据包都接收,一种是,先判断这个MAC头是不是我的,如果不是我的就不会进来。所以拿到这个数据以后,到数据链路层去摘取这个MAC头,去判断当前的一个网卡地址,和发送的MAC是不是匹配。

​ 网络层,会摘取IP头,如果不是自己的就会做一个转发,最后到了传输层。协议层会携带端口号,通过端口号,定位到具体的进程内,把这个数据包发送到我们对应的接收端。

MAC头是唯一的,理论上是可以通过MAC头去发送消息,MAC就像身份证一样,他是一个唯一的,但是我要去定位,是用IP去定位到我要发送到那个服务器,是个分层结构!

​ 网络是一个分层,它会有四层。

IP协议

TCP/UDP协议都是基于IP网络协议之上的,IP协议会提供一组数据报文服务,每组报文会由网络去统一处理和分发的。

每组报文都必须包含目的地址的地址段、IP层地址段。

IP协议,不可靠,尽力而为的协议,报文丢失,无序,或者说重复发送的情况。

TCP可靠协议

UDP不可靠协议

TCP头里边有目标端口号

协议

协议是两种网络通讯中达成的一个约定。

协议目的:

就是规范好通讯之间的约定。

http

超文本传输协议

拿到服务器上不同格式的数据

返回给浏览器,去做一个解析。(html/json/xml/jpg/png)

基于约定,拿到我想要拿到的东西,就是协议。

请求DNS地址-拿到服务器上的内容

实现一个对我们产生作用的网络,必须解决一些问题,为了让这些问题便于管理和模块化。

基于模块化的东西,设计了两种协议

TCP协议

能够检测和恢复IP层提供的主机和主机的通讯中可能发生的报文丢失,重复和错误的情况。解决了数据丢失、重复发送的问题,提供了可以信赖的字节流通道。

UDP

不可信的协议,不会对协议进行改造修复,提供了一个扩展于IP之上的尽力而为的数据报文服务。能够提供应用之间的工作,而不是主机之间的工作。不会解决数据丢失和重复,和顺序混乱的问题。

用户输入域名,解析出ip,http请求报文

深入分析 TCP/IP

1) DNS解析

2) 网关进行数据传输

3) 路由协议

4) 握手协议

DNS解析

DNS解析得到IP地址,由网关进行数据传输,由路由协议传输到目的端。

(就像打电话,喂,你好,你好,我是…… 我是…… 就是我们的握手协议)

​ 握手协议防止了数据包的丢失。

TCP通过三次握手建立一个可靠的通道。

三次握手

相当于客户端和服务端进行通信时有三个数据包。

三个状态:SYN-SEND >> SYN-RCVD >> ESTAB-LISHED

三次握手SYN攻击

SYN攻击

在短时间内客户端伪造大量不存在的ip地址,发送给服务端

服务端发送给客户端之后,客户端的确认包一直不发给service,这时候存在大量的连接是空闲的,会消耗我们的资源,导致我们很多正常的请求没有办法进去,因为队列满了。

TCP协议断开:

四次挥手协议:

FIN_WAIT_1 CLOSE_WAIT FIN_WAIT2 LAST_WAIT TIME_WAIT.

客户端请求关闭发送给服务端,服务端发送ACK告诉客户端,我收到你的请求了,然后服务端全部请求处理完毕以后发送FIN到客户端,客户端收到FIN报文以后就代表我可以关闭这个连接了,服务端没有收到ACK,就可以重新传输,客户端在两个生命周期以内没有收到回复,服务端就已经关闭了,客户端也可以关闭了。

四次挥手协议步骤

为什么三次四次:

​ 接收端接收到报文以后可以直接告诉发送端,我收到你的消息了,

​ 关闭的时候,服务器知道告诉发送端,你发送的请求我收到了,我要等到连接处理完,才处理完。

TCP协议,全双工协议。

发送时间在两个报文的生命周期内,

协议是建立连接,建立连接之后通讯,针对会话发送数据包,发送数据包,基于这个协议去传输。如果接收方不及时接收的情况,发送方应该是可以调控的。

如果接收方不及时处理的时候,发送方是可以控制的。

TCP流量控制

滑动窗口,是一种流量控制技术,

为什么用滑动窗口

  1. 保证数据不会丢失

  2. 网络拥塞的情况下会存在数据阻塞

所以在这样的情况下,引入了滑动窗口,去对我们的流量去做一个整形

动态地址:

发送端-接收端-TCP缓冲区

缓冲区是有大小的,控制流量,

缓冲区的大小就是窗口大小,发送消息,收到ack以后就可以发送下一个窗口

可以设置缓冲区的大小。

根据接收端的缓冲区可以动态调整窗口大小,

发送窗口,允许发送的数据帧的数据量的大小,

接收窗口,

没有收到消息,会重新发,

TCP缓冲区发送缓冲区

TCP缓冲区发送接收

TCP缓冲区发送接收ACK

TCP缓冲区发送继续发送

TCP缓冲区发送再次发送

使用TCP协议进行通讯

协议层之上就是应用,协议这块会很复杂

在现在的编程语言中,提供很完整的机制,屏蔽复杂过程,便于开发应用程序

TCP、UDP都是基于socket概念上为某一个应用场景扩展出来的协议。

什么是Socket

socket可以认为是一个抽象层,应用程序通过它来发送和接收消息。

这个时候通过应用程序打开文件句柄,读取数据磁盘,或者把数据写入到磁盘上。

使用socket可以把我们的应用程序添加到网络上,而且能跟和它处于一个网络的应用去通信,这就是socket。

不同的类型的socket和底层的协议是有关系的。

Stream socket(TCP) 字节流
datagram socket (UDP) 数据报文

APP通过Socket和服务端通信

Socket 套接字。

基于socket 选择协议(TCP [1-65535端口] UDP),然后带上IP(基于IP协议)

Netty是一个基于NIO的框架

TCP协议是一个全双工的协议

BIO

Client-Server-BIO图解

BIO 是一个客户端请求分配一个线程

Client-Server-BIO图解-Server-Thread

BIO 阻塞

缓冲区被占用

TCP协议是一个基于缓冲区,内核里边都会有个发送缓冲区,接收缓冲区,TCP的全双工模式是以TCP的滑动窗口,和依赖于这两个独立的缓冲区的填充状态,去处理的, 接收缓冲区把数据缓存到内核里边,如果说应用程序,没有调用read方法去读取的话,就会存在我们的接收缓冲区里边,这个缓冲区都不会被清理掉。

我们接收端receive去调用read去读取数据,实际上就是把内核读取到的数据复制到我们应用程序的buffer里边,再做一个处理。

进程里边调用socket去发送数据

TCP-发送端-接收端-TCP缓冲区

在IO层存在一个IO的调度线程去不断扫描Socket缓冲区。

发现写某个写入缓冲区为空,扫描到了就可以产生一个socket可写事件,我们的程序就可以对数据进行socket写入。如果一次写入没有写完,等下次写入再去写。

(Epoll Selector机制)

当接收端发现socket接收缓冲区有数据时,会产生socket可读事件,即使缓冲区满了,我也可以去接收其他请求。

有一个事件通知,可以读取这个数据

NIO

​ 发现你不可写,会有一个事件通知,我这个事件告诉你什么时候可以写了,然后我就可以去调用,去做一个处理消息的过程。

​ 就是 Epoll 和 Selector 模型的概念。

​ New IO或者no black IO;

NIO 非阻塞通信 (Non-blocking I/O,在Java领域,也称为New I/O)

通过一个事件机制,实现解耦

多路复用基于的是NIO机制。

  • 客户端:都注册一个channel
  • 客户端:都注册一个channel

NIO以多路复用为基础。服务端有一个多路复用器,轮询每一个channel。选择一个具备已经能够运行任务的能力的channel。如果某个注册上来的channel上的TCP产生了一个可写事件的话,那么就能够被轮询出来,去做一个执行。如果满足状态,执行相应的机制,然后不断地轮询。

Client-Server-NIO图解

产生socket可写事件

组播协议

单播协议

TCP UDP 都是基于点对点的通讯, 可以称为单播协议。

广播

网络中的所有的主机都可以收到一份数据副本

多播

消息只发送给一个多播地址,网络会把数据发送给那些想要监听的主机

只有订阅了这个感兴趣的主机才能收到

广播:

子网主机发送消息,子网内的主机都能收到信息

NIO是基于IO的更好性能的技能

Java本身提供了NIO技术,netty基于NIO做了一个封装,提供了一个更优化的功能而已。

微信公众号:不止极客

点击查看更多内容
TA 点赞

若觉得本文不错,就分享一下吧!

评论

作者其他优质文章

正在加载中
  • 推荐
  • 评论
  • 收藏
  • 共同学习,写下你的评论
感谢您的支持,我会继续努力的~
扫码打赏,你说多少就多少
赞赏金额会直接到老师账户
支付方式
打开微信扫一扫,即可进行扫码打赏哦
今天注册有机会得

100积分直接送

付费专栏免费学

大额优惠券免费领

立即参与 放弃机会
意见反馈 帮助中心 APP下载
官方微信

举报

0/150
提交
取消