为了账号安全,请及时绑定邮箱和手机立即绑定

什么是消息队列?

标签:
Java 大数据

前言

只有光头才能变强。

文本已收录至我的GitHub仓库欢迎Starhttps://github.com/ZhongFuCheng3y/3y

公司用到的很多技术自己之前都没学过()于是只能慢慢补了。这次给大家写写我学习消息队列的笔记希望对大家有帮助。

一、什么是消息队列

消息队列不知道大家看到这个词的时候会不会觉得它是一个比较高端的技术反正我是觉得它好像是挺牛逼的。

消息队列一般我们会简称它为MQ(Message Queue)嗯就是很直白的简写。

我们先不管消息(Message)这个词来看看队列(Queue)。这一看队列大家应该都熟悉吧。

队列是一种先进先出的数据结构。

先进先出

在Java里边已经实现了不少的队列了

Java的队列实现类

那为什么还需要消息队列(MQ)这种中间件呢其实这个问题跟之前我学Redis的时候很像。Redis是一个以key-value形式存储的内存数据库明明我们可以使用类似HashMap这种实现类就可以达到类似的效果了那还为什么要Redis《Redis合集

  • 到这里大家可以先猜猜为什么要用消息队列(MQ)这种中间件下面会继续补充。

消息队列可以简单理解为把要传输的数据放在队列中

图片来源https://www.cloudamqp.com/blog/2014-12-03-what-is-message-queuing.html)

科普

  • 把数据放到消息队列叫做生产者
  • 从消息队列里边取数据叫做消费者

二、为什么要用消息队列

为什么要用消息队列也就是在问用了消息队列有什么好处。我们看看以下的场景

2.1 解耦

现在我有一个系统A系统A可以产生一个userId

系统A可以产生一个UserId

然后现在有系统B和系统C都需要这个userId去做相关的操作

系统A给系统B和系统C传入userId这个值

写成伪代码可能是这样的

public class SystemA {

    // 系统B和系统C的依赖
    SystemB systemB = new SystemB();
    SystemC systemC = new SystemC();

    // 系统A独有的数据userId
    private String userId = "Java3y";

    public void doSomething() {

        // 系统B和系统C都需要拿着系统A的userId去操作其他的事
        systemB.SystemBNeed2do(userId);
        systemC.SystemCNeed2do(userId);
        
    }
}

结构图如下

结构图

ok一切平安无事度过了几个天。

某一天系统B的负责人告诉系统A的负责人现在系统B的SystemBNeed2do(String userId)这个接口不再使用了让系统A别去调它了

于是系统A的负责人说"好的那我就不调用你了。"于是就把调用系统B接口的代码给删掉了

public void doSomething() {

  // 系统A不再调用系统B的接口了
  //systemB.SystemBNeed2do(userId);
  systemC.SystemCNeed2do(userId);

}

又过了几天系统D的负责人接了个需求也需要用到系统A的userId于是就跑去跟系统A的负责人说“老哥我要用到你的userId你调一下我的接口吧”

于是系统A说“没问题的这就搞”

系统A需要调用系统D的接口

然后系统A的代码如下

public class SystemA {

    // 已经不再需要系统B的依赖了
    // SystemB systemB = new SystemB();
    
    // 系统C和系统D的依赖
    SystemC systemC = new SystemC();
    SystemD systemD = new SystemD();

    // 系统A独有的数据
    private String userId = "Java3y";

    public void doSomething() {

       
        // 已经不再需要系统B的依赖了
        //systemB.SystemBNeed2do(userId);

        // 系统C和系统D都需要拿着系统A的userId去操作其他的事
        systemC.SystemCNeed2do(userId);
        systemD.SystemDNeed2do(userId);

    }
}

时间飞逝

  • 又过了几天系统E的负责人过来了告诉系统A需要userId。
  • 又过了几天系统B的负责人过来了告诉系统A还是重新掉那个接口吧。
  • 又过了几天系统F的负责人过来了告诉系统A需要userId。
  • ……

于是系统A的负责人每天都被这给骚扰着改来改去改来改去…

还有另外一个问题调用系统C的时候如果系统C挂了系统A还得想办法处理。如果调用系统D时由于网络延迟请求超时了那系统A是反馈fail还是重试

最后系统A的负责人觉得隔一段时间就改来改去没意思于是就跑路了。

然后公司招来一个大佬大佬经过几天熟悉上来就说将系统A的userId写到消息队列中这样系统A就不用经常改动了。为什么呢下面我们来一起看看

系统A将userId写到消息队列中系统C和系统D从消息队列中拿数据

系统A将userId写到消息队列中系统C和系统D从消息队列中拿数据。这样有什么好处

  • 系统A只负责把数据写到队列中谁想要或不想要这个数据(消息)系统A一点都不关心

    • 即便现在系统D不想要userId这个数据了系统B又突然想要userId这个数据了都跟系统A无关系统A一点代码都不用改。
  • 系统D拿userId不再经过系统A而是从消息队列里边拿。系统D即便挂了或者请求超时都跟系统A无关只跟消息队列有关

这样一来系统A与系统B、C、D都解耦了。

2.2 异步

我们再来看看下面这种情况系统A还是直接调用系统B、C、D

直接调接口

代码如下

public class SystemA {

    SystemB systemB = new SystemB();
    SystemC systemC = new SystemC();
    SystemD systemD = new SystemD();

    // 系统A独有的数据
    private String userId ;

    public void doOrder() {
     
        // 下订单
      	userId = this.order();
        // 如果下单成功则安排其他系统做一些事  
        systemB.SystemBNeed2do(userId);
        systemC.SystemCNeed2do(userId);
        systemD.SystemDNeed2do(userId);

    }
}

假设系统A运算出userId具体的值需要50ms调用系统B的接口需要300ms调用系统C的接口需要300ms调用系统D的接口需要300ms。那么这次请求就需要50+300+300+300=950ms

并且我们得知系统A做的是主要的业务而系统B、C、D是非主要的业务。比如系统A处理的是订单下单而系统B是订单下单成功了那发送一条短信告诉具体的用户此订单已成功而系统C和系统D也是处理一些小事而已。

那么此时为了提高用户体验和吞吐量其实可以异步地调用系统B、C、D的接口。所以我们可以弄成是这样的

此时才用了100ms

系统A执行完了以后将userId写到消息队列中然后就直接返回了(至于其他的操作则异步处理)。

  • 本来整个请求需要用950ms(同步)
  • 现在将调用其他系统接口异步化只需要100ms(异步)

(例子可能举得不太好但我觉得说明到点子上就行了见谅。)

2.3削峰/限流

我们再来一个场景现在我们每个月要搞一次大促大促期间的并发可能会很高的比如每秒3000个请求。假设我们现在有两台机器处理请求并且每台机器只能每次处理1000个请求。

削峰的场景

那多出来的1000个请求可能就把我们整个系统给搞崩了…所以有一种办法我们可以写到消息队列中

写到消息队列中系统从消息队列中拿到请求

系统B和系统C根据自己的能够处理的请求数去消息队列中拿数据这样即便有每秒有8000个请求那只是把请求放在消息队列中去拿消息队列的消息由系统自己去控制这样就不会把整个系统给搞崩。

三、使用消息队列有什么问题

经过我们上面的场景我们已经可以发现消息队列能做的事其实还是蛮多的。

说到这里我们先回到文章的开头"明明JDK已经有不少的队列实现了我们还需要消息队列中间件呢"其实很简单JDK实现的队列种类虽然有很多种但是都是简单的内存队列。为什么我说JDK是简单的内存队列呢下面我们来看看要实现消息队列(中间件)可能要考虑什么问题

3.1高可用

无论是我们使用消息队列来做解耦、异步还是削峰消息队列肯定不能是单机的。试着想一下如果是单机的消息队列万一这台机器挂了那我们整个系统几乎就是不可用了。

万一单机的队列挂掉了

所以当我们项目中使用消息队列都是得集群/分布式的。要做集群/分布式就必然希望该消息队列能够提供现成的支持而不是自己写代码手动去实现。

3.2 数据丢失问题

我们将数据写到消息队列上系统B和C还没来得及取消息队列的数据就挂掉了。如果没有做任何的措施我们的数据就丢了

数据丢失问题

学过Redis的都知道Redis可以将数据持久化磁盘上万一Redis挂了还能从磁盘从将数据恢复过来。同样地消息队列中的数据也需要存在别的地方这样才尽可能减少数据的丢失。

那存在哪呢

  • 磁盘
  • 数据库
  • Redis
  • 分布式文件系统

同步存储还是异步存储

3.3消费者怎么得到消息队列的数据

消费者怎么从消息队列里边得到数据有两种办法

  • 生产者将数据放到消息队列中消息队列有数据了主动叫消费者去拿(俗称push)
  • 消费者不断去轮训消息队列看看有没有新的数据如果有就消费(俗称pull)

3.4其他

除了这些我们在使用的时候还得考虑各种的问题

  • 消息重复消费了怎么办啊
  • 我想保证消息是绝对有顺序的怎么做
  • ………

虽然消息队列给我们带来了那么多的好处但同时我们发现引入消息队列也会提高系统的复杂性。市面上现在已经有不少消息队列轮子了每种消息队列都有自己的特点选取哪种MQ还得好好斟酌

最后

本文主要讲解了什么是消息队列消息队列可以为我们带来什么好处以及一个消息队列可能会涉及到哪些问题。希望给大家带来一定的帮助。

参考资料

乐于输出干货的Java技术号Java3y。

觉得我的文章写得不错不妨点一下

点击查看更多内容
69人点赞

若觉得本文不错,就分享一下吧!

评论

作者其他优质文章

正在加载中
JAVA开发工程师
手记
粉丝
1.5万
获赞与收藏
6488

关注作者,订阅最新文章

阅读免费教程

感谢您的支持,我会继续努力的~
扫码打赏,你说多少就多少
赞赏金额会直接到老师账户
支付方式
打开微信扫一扫,即可进行扫码打赏哦
今天注册有机会得

100积分直接送

付费专栏免费学

大额优惠券免费领

立即参与 放弃机会
意见反馈 帮助中心 APP下载
官方微信

举报

0/150
提交
取消