热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

开发笔记:消息中间件—RabbitMQ(集群原理与搭建篇)

本文由编程笔记#小编为大家整理,主要介绍了消息中间件—RabbitMQ(集群原理与搭建篇)相关的知识,希望对你有一定的参考价值。一般来说,
本文由编程笔记#小编为大家整理,主要介绍了消息中间件—RabbitMQ(集群原理与搭建篇)相关的知识,希望对你有一定的参考价值。


一般来说,如果只是为了学习RabbitMQ或者验证业务工程的正确性那么在本地环境或者测试环境上使用其单实例部署就可以了,但是出于MQ中间件本身的可靠性、并发性、吞吐量和消息堆积能力等问题的考虑,在生产环境上一般都会考虑使用RabbitMQ的集群方案。


对于RabbitMQ这么成熟的消息队列产品来说,搭建它并不难并且也有不少童鞋写过如何搭建RabbitMQ消息队列集群的博文,但可能仍然有童鞋并不了解其背后的原理,这会导致其遇到性能问题时无法对集群进行进一步的调优。


本篇主要介绍RabbitMQ集群方案的原理,如何搭建具备负载均衡能力的中小规模RabbitMQ集群,并最后给出生产环境构建一个能够具备高可用、高可靠和高吞吐量的中小规模RabbitMQ集群设计方案。



一、RabbitMQ集群方案的原理


RabbitMQ这款消息队列中间件产品本身是基于Erlang编写,Erlang语言天生具备分布式特性(通过同步Erlang集群各节点的magic COOKIE来实现)。


因此,RabbitMQ天然支持Clustering。这使得RabbitMQ本身不需要像ActiveMQ、Kafka那样通过ZooKeeper分别来实现HA方案和保存集群的元数据。集群是保证可靠性的一种方式,同时可以通过水平扩展以达到增加消息吞吐量能力的目的。下面先来看下RabbitMQ集群的整体方案:



上面图中采用三个节点组成了一个RabbitMQ的集群,Exchange A(交换器,对于RabbitMQ基础概念不太明白的童鞋可以看下基础概念)的元数据信息在所有节点上是一致的,而Queue(存放消息的队列)的完整数据则只会存在于它所创建的那个节点上。,其他节点只知道这个queue的metadata信息和一个指向queue的owner node的指针。



(1)RabbitMQ集群元数据的同步


RabbitMQ集群会始终同步四种类型的内部元数据(类似索引): a.队列元数据:队列名称和它的属性; b.交换器元数据:交换器名称、类型和属性; c.绑定元数据:一张简单的表格展示了如何将消息路由到队列; d.vhost元数据:为vhost内的队列、交换器和绑定提供命名空间和安全属性; 因此,当用户访问其中任何一个RabbitMQ节点时,通过rabbitmqctl查询到的queue/user/exchange/vhost等信息都是相同的。



(2)为何RabbitMQ集群仅采用元数据同步的方式


我想肯定有不少同学会问,想要实现HA方案,那将RabbitMQ集群中的所有Queue的完整数据在所有节点上都保存一份不就可以了么?(可以类似mysql的主主模式嘛)这样子,任何一个节点出现故障或者宕机不可用时,那么使用者的客户端只要能连接至其他节点能够照常完成消息的发布和订阅嘛。 


我想RabbitMQ的作者这么设计主要还是基于集群本身的性能和存储空间上来考虑。



第一,存储空间,如果每个集群节点都拥有所有Queue的完全数据拷贝,那么每个节点的存储空间会非常大,集群的消息积压能力会非常弱(无法通过集群节点的扩容提高消息积压能力);




第二,性能,消息的发布者需要将消息复制到每一个集群节点,对于持久化消息,网络和磁盘同步复制的开销都会明显增加。




(3)RabbitMQ集群发送/订阅消息的基本原理


RabbitMQ集群的工作原理图如下:


消息中间件—RabbitMQ(集群原理与搭建篇)




场景1:客户端直接连接队列所在节点


如果有一个消息生产者或者消息消费者通过amqp-client的客户端连接至节点1进行消息的发布或者订阅,那么此时的集群中的消息收发只与节点1相关,这个没有任何问题;如果客户端相连的是节点2或者节点3(队列1数据不在该节点上),那么情况又会是怎么样呢?



场景2:客户端连接的是非队列数据所在节点


如果消息生产者所连接的是节点2或者节点3,此时队列1的完整数据不在该两个节点上,那么在发送消息过程中这两个节点主要起了一个路由转发作用,根据这两个节点上的元数据(也就是上文提到的:指向queue的owner node的指针)转发至节点1上,最终发送的消息还是会存储至节点1的队列1上。 


同样,如果消息消费者所连接的节点2或者节点3,那这两个节点也会作为路由节点起到转发作用,将会从节点1的队列1中拉取消息进行消费。



二、RabbitMQ集群的搭建



(1)搭建RabbitMQ集群所需要安装的组件


在搭建RabbitMQ集群之前有必要在每台虚拟机上安装如下的组件包,分别如下:



a.Jdk 1.8


b.Erlang运行时环境,这里用的是otpsrc19.3.tar.gz (200MB+)


c.RabbitMq的Server组件,这里用的rabbitmq-server-generic-unix-3.6.10.tar.gz



关于如何安装上述三个组件的具体步骤,已经有不少博文对此进行了非常详细的描述,那么本文就不再赘述了。有需要的同学可以具体参考这些步骤来完成安装。



(2)搭建10节点组成的RabbitMQ集群


该节中主要展示的是集群搭建,需要确保每台机器上正确安装了上述三种组件,并且每台虚拟机上的RabbitMQ的实例能够正常启动起来。 


a.编辑每台RabbitMQ的COOKIE文件,以确保各个节点的COOKIE文件使用的是同一个值,可以scp其中一台机器上的COOKIE至其他各个节点,COOKIE的默认路径为/var/lib/rabbitmq/.erlang.COOKIE或者$HOME/.erlang.COOKIE,节点之间通过COOKIE确定相互是否可通信。 


b.配置各节点的hosts文件( vim /etc/hosts)









  1. xxx.xxx.xxx.xxx rmq-broker-test-1





  2. xxx.xxx.xxx.xxx rmq-broker-test-2





  3. xxx.xxx.xxx.xxx rmq-broker-test-3





  4. ......





  5. xxx.xxx.xxx.xxx rmq-broker-test-10






c.逐个节点启动RabbitMQ服务









  1. rabbitmq-server -detached






d.查看各个节点和集群的工作运行状态









  1. rabbitmqctl status, rabbitmqctl cluster_status






e.以rmq-broker-test-1为主节点,在rmq-broker-test-2上:










  1. rabbitmqctl stop_app





  2. rabbitmqctl reset





  3. rabbitmqctl join_cluster rabbit@rmq-broker-test-2





  4. rabbitmqctl start_app






在其余的节点上的操作步骤与rmq-broker-test-2虚拟机上的一样。 


f.在RabbitMQ集群中的节点只有两种类型:内存节点/磁盘节点,单节点系统只运行磁盘类型的节点。而在集群中,可以选择配置部分节点为内存节点。


内存节点将所有的队列,交换器,绑定关系,用户,权限,和vhost的元数据信息保存在内存中。而磁盘节点将这些信息保存在磁盘中,但是内存节点的性能更高,为了保证集群的高可用性,必须保证集群中有两个以上的磁盘节点,来保证当有一个磁盘节点崩溃了,集群还能对外提供访问服务。


在上面的操作中,可以通过如下的方式,设置新加入的节点为内存节点还是磁盘节点:









  1. #加入时候设置节点为内存节点(默认加入的为磁盘节点)





  2. [root@mq-testvm1 ~]# rabbitmqctl join_cluster rabbit@rmq-broker-test-1 --ram













  1. #也通过下面方式修改的节点的类型





  2. [root@mq-testvm1 ~]# rabbitmqctl changeclusternode_type disc | ram






g.最后可以通过“rabbitmqctl cluster_status”的方式来查看集群的状态,上面搭建的10个节点的RabbitMQ集群状态。


(3个节点为磁盘节点,7个节点为内存节点)如下:









  1. Cluster status of node 'rabbit@rmq-broker-test-1'





  2. [{nodes,[{disc,['rabbit@rmq-broker-test-1','rabbit@rmq-broker-test-2',





  3.                'rabbit@rmq-broker-test-3']},





  4.         {ram,['rabbit@rmq-broker-test-9','rabbit@rmq-broker-test-8',





  5.               'rabbit@rmq-broker-test-7','rabbit@rmq-broker-test-6',





  6.               'rabbit@rmq-broker-test-5','rabbit@rmq-broker-test-4',





  7.               'rabbit@rmq-broker-test-10']}]},





  8. {running_nodes,['rabbit@rmq-broker-test-10','rabbit@rmq-broker-test-5',





  9.                 'rabbit@rmq-broker-test-9','rabbit@rmq-broker-test-2',





  10.                 'rabbit@rmq-broker-test-8','rabbit@rmq-broker-test-7',





  11.                 'rabbit@rmq-broker-test-6','rabbit@rmq-broker-test-3',





  12.                 'rabbit@rmq-broker-test-4','rabbit@rmq-broker-test-1']},





  13. {cluster_name,<<"rabbit@mq-testvm1">>},





  14. {partitions,[]},





  15. {alarms,[{'rabbit@rmq-broker-test-10',[]},





  16.          {'rabbit@rmq-broker-test-5',[]},





  17.          {'rabbit@rmq-broker-test-9',[]},





  18.          {'rabbit@rmq-broker-test-2',[]},





  19.          {'rabbit@rmq-broker-test-8',[]},





  20.          {'rabbit@rmq-broker-test-7',[]},





  21.          {'rabbit@rmq-broker-test-6',[]},





  22.          {'rabbit@rmq-broker-test-3',[]},





  23.          {'rabbit@rmq-broker-test-4',[]},





  24.          {'rabbit@rmq-broker-test-1',[]}]}]










(3)配置HAProxy


HAProxy提供高可用性、负载均衡以及基于TCP和HTTP应用的代理,支持虚拟主机,它是免费、快速并且可靠的一种解决方案。根据官方数据,其最高极限支持10G的并发。HAProxy支持从4层至7层的网络交换,即覆盖所有的TCP协议。就是说,Haproxy 甚至还支持 Mysql 的均衡负载。


为了实现RabbitMQ集群的软负载均衡,这里可以选择HAProxy。 关于HAProxy如何安装的文章之前也有很多同学写过,这里就不再赘述了,有需要的同学可以参考下网上的做法。这里主要说下安装完HAProxy组件后的具体配置。 HAProxy使用单一配置文件来定义所有属性,包括从前端IP到后端服务器。下面展示了用于7个RabbitMQ节点组成集群的负载均衡配置(另外3个磁盘节点用于保存集群的配置和元数据,不做负载)。同时,HAProxy运行在另外一台机器上。


HAProxy的具体配置如下:









  1. #全局配置





  2. global





  3.        #日志输出配置,所有日志都记录在本机,通过local0输出





  4.        log 127.0.0.1 local0 info





  5.        #最大连接数





  6.        maxconn 4096





  7.        #改变当前的工作目录





  8.        chroot /apps/svr/haproxy





  9.        #以指定的UID运行haproxy进程





  10.        uid 99





  11.        #以指定的GID运行haproxy进程





  12.        gid 99





  13.        #以守护进程方式运行haproxy #debug #quiet





  14.        daemon





  15.        #debug





  16.        #当前进程pid文件





  17.        pidfile /apps/svr/haproxy/haproxy.pid









  18. #默认配置





  19. defaults





  20.        #应用全局的日志配置





  21.        log global





  22.        #默认的模式mode{tcp|http|health}





  23.        #tcp是4层,http是7层,health只返回OK





  24.        mode tcp





  25.        #日志类别tcplog





  26.        option tcplog





  27.        #不记录健康检查日志信息





  28.        option dontlognull





  29.        #3次失败则认为服务不可用





  30.        retries 3





  31.        #每个进程可用的最大连接数





  32.        maxconn 2000





  33.        #连接超时





  34.        timeout connect 5s





  35.        #客户端超时





  36.        timeout client 120s





  37.        #服务端超时





  38.        timeout server 120s









  39.        maxconn 2000





  40.        #连接超时





  41.        timeout connect 5s





  42.        #客户端超时





  43.        timeout client 120s





  44.        #服务端超时





  45.        timeout server 120s









  46. #绑定配置





  47. listen rabbitmq_cluster





  48.        bind 0.0.0.0:5672





  49.        #配置TCP模式





  50.        mode tcp





  51.        #加权轮询





  52.        balance roundrobin









  53.        server rmq_node1 ip1:5672 check inter 5000 rise 2 fall 3 weight 1





  54.        server rmq_node2 ip2:5672 check inter 5000 rise 2 fall 3 weight 1





  55.        server rmq_node3 ip3:5672 check inter 5000 rise 2 fall 3 weight 1





  56.        server rmq_node4 ip4:5672 check inter 5000 rise 2 fall 3 weight 1





  57.        server rmq_node5 ip5:5672 check inter 5000 rise 2 fall 3 weight 1





  58.        server rmq_node6 ip6:5672 check inter 5000 rise 2 fall 3 weight 1





  59.        server rmq_node7 ip7:5672 check inter 5000 rise 2 fall 3 weight 1













  60. listen monitor





  61.        bind 0.0.0.0:8100





  62.        mode http





  63.        option httplog





  64.        stats enable





  65.        stats uri /stats





  66.        stats refresh 5s







要含义如下:

(a)“server

”部分:定义HAProxy内RabbitMQ服务的标识; 



(c)“check inter

”部分:表示每隔多少毫秒检查RabbitMQ服务是否可用; (d)“rise

”部分:表示RabbitMQ服务在发生故障之后,需要多少次健康检查才能被再次确认可用; 






(e)“fall

”部分:表示需要经历多少次失败的健康检查之后,HAProxy才会停止使用此RabbitMQ服务。



















  1. #启用HAProxy服务





  2. [root@mq-testvm12 conf]# haproxy -f haproxy.cfg











启动后,即可看到如下的HAproxy的界面图:消息中间件—RabbitMQ(集群原理与搭建篇)




(4)RabbitMQ的集群架构设计图


经过上面的RabbitMQ10个节点集群搭建和HAProxy软弹性负载均衡配置后即可组建一个中小规模的RabbitMQ集群了,然而为了能够在实际的生产环境使用还需要根据实际的业务需求对集群中的各个实例进行一些性能参数指标的监控,从性能、吞吐量和消息堆积能力等角度考虑,可以选择Kafka来作为RabbitMQ集群的监控队列使用。


因此,这里先给出了一个中小规模RabbitMQ集群架构设计图:


消息中间件—RabbitMQ(集群原理与搭建篇)


对于消息的生产和消费者可以通过HAProxy的软负载将请求分发至RabbitMQ集群中的Node1~Node7节点,其中Node8~Node10的三个节点作为磁盘节点保存集群元数据和配置信息。鉴于篇幅原因这里就不在对监控部分进行详细的描述的,会在后续篇幅中对如何使用RabbitMQ的HTTP API接口进行监控数据统计进行详细阐述。



三、总结


本文主要详细介绍了RabbitMQ集群的工作原理和如何搭建一个具备负载均衡能力的中小规模RabbitMQ集群的方法,并最后给出了RabbitMQ集群的架构设计图。限于笔者的才疏学浅,对本文内容可能还有理解不到位的地方,如有阐述不合理之处还望留言一起探讨。








- END -


 往期推荐:








  • 死磕Java系列:





















  ……




  • Spring系列:












……


号外:

最近在做几个有意思的开源项目,感兴趣的朋友可以看看。



https://github.com/dyc87112/swagger-butler








深入交流、更多福利


扫码加入我的知识星球





点击“阅读原文”,看本号其他精彩内容




推荐阅读
  • 随着分布式系统的规模和复杂度提高,往往会出现如下问题:(1)系统间同步通信,客户端发出调用后,必 ... [详细]
  • 一、RabbitMQ是什么1、MQ的主要作用是:异步、消峰、解耦2、高并发、高可用的成熟方案,支持多种消息协议,易于部署和使用Rabbit ... [详细]
  • CentOs 7.3中搭建RabbitMQ 3.6单机多实例服务的步骤与使用
    CentOs7.3中搭建RabbitMQ3.6单机多实例服务的步骤与使用-RabbitMQ简介RabbitMQ是一个开源的AMQP实现,服务器端用Erlang语言编写,支持多种客户 ... [详细]
  • 分布式消息_58分布式消息队列WMB设计与实践
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了58分布式消息队列WMB设计与实践相关的知识,希望对你有一定的参考价值。 ... [详细]
  • celery 爬虫使用
    简介celery是一个基于分布式消息传输的异步任务队列,它专注于实时处理,同时也支持任务调度。它由三部分组成,消息中间件, ... [详细]
  • 讨伐Java多线程与高并发——MQ篇
    本文是学习Java多线程与高并发知识时做的笔记。这部分内容比较多,按照内容分为5个部分:多线程基础篇JUC篇同步容器和并发容器篇线程池篇MQ篇本篇 ... [详细]
  • 篇首语:本文由编程笔记#小编为大家整理,主要介绍了架构文摘:消息队列设计精要相关的知识,希望对你有一定的参考价值。消息队列已经逐渐成为企业IT系统内部通信的核心手段。它具 ... [详细]
  • rabbitmq集群搭建「建议收藏」
    rabbitmq集群搭建「建议收藏」一、基础安装前提:三个节点都主机映射,关防火墙网络,配好yum(后边出错,主机名和映射要对应)1.安装(三个节点)2.mq1启动rabbitmq ... [详细]
  • t-io 2.0.0发布-法网天眼第一版的回顾和更新说明
    本文回顾了t-io 1.x版本的工程结构和性能数据,并介绍了t-io在码云上的成绩和用户反馈。同时,还提到了@openSeLi同学发布的t-io 30W长连接并发压力测试报告。最后,详细介绍了t-io 2.0.0版本的更新内容,包括更简洁的使用方式和内置的httpsession功能。 ... [详细]
  • Tomcat/Jetty为何选择扩展线程池而不是使用JDK原生线程池?
    本文探讨了Tomcat和Jetty选择扩展线程池而不是使用JDK原生线程池的原因。通过比较IO密集型任务和CPU密集型任务的特点,解释了为何Tomcat和Jetty需要扩展线程池来提高并发度和任务处理速度。同时,介绍了JDK原生线程池的工作流程。 ... [详细]
  • 一句话解决高并发的核心原则
    本文介绍了解决高并发的核心原则,即将用户访问请求尽量往前推,避免访问CDN、静态服务器、动态服务器、数据库和存储,从而实现高性能、高并发、高可扩展的网站架构。同时提到了Google的成功案例,以及适用于千万级别PV站和亿级PV网站的架构层次。 ... [详细]
  • ejava,刘聪dejava
    本文目录一览:1、什么是Java?2、java ... [详细]
  • 消息中间件RabbitMQ 高级特性之消费端ACK与重回队列
    什么是消费端的ACK和重回队列?消费端的手工ACK和NACK消费端进行消费的时候,如果由于业务异常我们可以进行日志的记录,然后进行补偿如果由于服务器宕机等严重问题 ... [详细]
  • 先回顾一下,在之前的SpringCloudConfig的介绍中,我们还留了一个悬念:如何实现对配置信息的实时更新。虽然,我们 ... [详细]
  • 怎么去学java能达到最好的效果
    本文主要分享【怎么去学java能达到最好的效果】,技术文章【Java自学的话怎么样最有效果?】为【测试小扎】投稿,如果你遇到java,编程相关问题,本文相关知识或能到你。怎么去学java能达到最好的 ... [详细]
author-avatar
喏焿你一辈子_997
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有