热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

开发笔记:消息中间件—RabbitMQ(集群原理与搭建篇)

本文由编程笔记#小编为大家整理,主要介绍了消息中间件—RabbitMQ(集群原理与搭建篇)相关的知识,希望对你有一定的参考价值。一般来说,
本文由编程笔记#小编为大家整理,主要介绍了消息中间件—RabbitMQ(集群原理与搭建篇)相关的知识,希望对你有一定的参考价值。


一般来说,如果只是为了学习RabbitMQ或者验证业务工程的正确性那么在本地环境或者测试环境上使用其单实例部署就可以了,但是出于MQ中间件本身的可靠性、并发性、吞吐量和消息堆积能力等问题的考虑,在生产环境上一般都会考虑使用RabbitMQ的集群方案。


对于RabbitMQ这么成熟的消息队列产品来说,搭建它并不难并且也有不少童鞋写过如何搭建RabbitMQ消息队列集群的博文,但可能仍然有童鞋并不了解其背后的原理,这会导致其遇到性能问题时无法对集群进行进一步的调优。


本篇主要介绍RabbitMQ集群方案的原理,如何搭建具备负载均衡能力的中小规模RabbitMQ集群,并最后给出生产环境构建一个能够具备高可用、高可靠和高吞吐量的中小规模RabbitMQ集群设计方案。



一、RabbitMQ集群方案的原理


RabbitMQ这款消息队列中间件产品本身是基于Erlang编写,Erlang语言天生具备分布式特性(通过同步Erlang集群各节点的magic COOKIE来实现)。


因此,RabbitMQ天然支持Clustering。这使得RabbitMQ本身不需要像ActiveMQ、Kafka那样通过ZooKeeper分别来实现HA方案和保存集群的元数据。集群是保证可靠性的一种方式,同时可以通过水平扩展以达到增加消息吞吐量能力的目的。下面先来看下RabbitMQ集群的整体方案:



上面图中采用三个节点组成了一个RabbitMQ的集群,Exchange A(交换器,对于RabbitMQ基础概念不太明白的童鞋可以看下基础概念)的元数据信息在所有节点上是一致的,而Queue(存放消息的队列)的完整数据则只会存在于它所创建的那个节点上。,其他节点只知道这个queue的metadata信息和一个指向queue的owner node的指针。



(1)RabbitMQ集群元数据的同步


RabbitMQ集群会始终同步四种类型的内部元数据(类似索引): a.队列元数据:队列名称和它的属性; b.交换器元数据:交换器名称、类型和属性; c.绑定元数据:一张简单的表格展示了如何将消息路由到队列; d.vhost元数据:为vhost内的队列、交换器和绑定提供命名空间和安全属性; 因此,当用户访问其中任何一个RabbitMQ节点时,通过rabbitmqctl查询到的queue/user/exchange/vhost等信息都是相同的。



(2)为何RabbitMQ集群仅采用元数据同步的方式


我想肯定有不少同学会问,想要实现HA方案,那将RabbitMQ集群中的所有Queue的完整数据在所有节点上都保存一份不就可以了么?(可以类似mysql的主主模式嘛)这样子,任何一个节点出现故障或者宕机不可用时,那么使用者的客户端只要能连接至其他节点能够照常完成消息的发布和订阅嘛。 


我想RabbitMQ的作者这么设计主要还是基于集群本身的性能和存储空间上来考虑。



第一,存储空间,如果每个集群节点都拥有所有Queue的完全数据拷贝,那么每个节点的存储空间会非常大,集群的消息积压能力会非常弱(无法通过集群节点的扩容提高消息积压能力);




第二,性能,消息的发布者需要将消息复制到每一个集群节点,对于持久化消息,网络和磁盘同步复制的开销都会明显增加。




(3)RabbitMQ集群发送/订阅消息的基本原理


RabbitMQ集群的工作原理图如下:


消息中间件—RabbitMQ(集群原理与搭建篇)




场景1:客户端直接连接队列所在节点


如果有一个消息生产者或者消息消费者通过amqp-client的客户端连接至节点1进行消息的发布或者订阅,那么此时的集群中的消息收发只与节点1相关,这个没有任何问题;如果客户端相连的是节点2或者节点3(队列1数据不在该节点上),那么情况又会是怎么样呢?



场景2:客户端连接的是非队列数据所在节点


如果消息生产者所连接的是节点2或者节点3,此时队列1的完整数据不在该两个节点上,那么在发送消息过程中这两个节点主要起了一个路由转发作用,根据这两个节点上的元数据(也就是上文提到的:指向queue的owner node的指针)转发至节点1上,最终发送的消息还是会存储至节点1的队列1上。 


同样,如果消息消费者所连接的节点2或者节点3,那这两个节点也会作为路由节点起到转发作用,将会从节点1的队列1中拉取消息进行消费。



二、RabbitMQ集群的搭建



(1)搭建RabbitMQ集群所需要安装的组件


在搭建RabbitMQ集群之前有必要在每台虚拟机上安装如下的组件包,分别如下:



a.Jdk 1.8


b.Erlang运行时环境,这里用的是otpsrc19.3.tar.gz (200MB+)


c.RabbitMq的Server组件,这里用的rabbitmq-server-generic-unix-3.6.10.tar.gz



关于如何安装上述三个组件的具体步骤,已经有不少博文对此进行了非常详细的描述,那么本文就不再赘述了。有需要的同学可以具体参考这些步骤来完成安装。



(2)搭建10节点组成的RabbitMQ集群


该节中主要展示的是集群搭建,需要确保每台机器上正确安装了上述三种组件,并且每台虚拟机上的RabbitMQ的实例能够正常启动起来。 


a.编辑每台RabbitMQ的COOKIE文件,以确保各个节点的COOKIE文件使用的是同一个值,可以scp其中一台机器上的COOKIE至其他各个节点,COOKIE的默认路径为/var/lib/rabbitmq/.erlang.COOKIE或者$HOME/.erlang.COOKIE,节点之间通过COOKIE确定相互是否可通信。 


b.配置各节点的hosts文件( vim /etc/hosts)









  1. xxx.xxx.xxx.xxx rmq-broker-test-1





  2. xxx.xxx.xxx.xxx rmq-broker-test-2





  3. xxx.xxx.xxx.xxx rmq-broker-test-3





  4. ......





  5. xxx.xxx.xxx.xxx rmq-broker-test-10






c.逐个节点启动RabbitMQ服务









  1. rabbitmq-server -detached






d.查看各个节点和集群的工作运行状态









  1. rabbitmqctl status, rabbitmqctl cluster_status






e.以rmq-broker-test-1为主节点,在rmq-broker-test-2上:










  1. rabbitmqctl stop_app





  2. rabbitmqctl reset





  3. rabbitmqctl join_cluster rabbit@rmq-broker-test-2





  4. rabbitmqctl start_app






在其余的节点上的操作步骤与rmq-broker-test-2虚拟机上的一样。 


f.在RabbitMQ集群中的节点只有两种类型:内存节点/磁盘节点,单节点系统只运行磁盘类型的节点。而在集群中,可以选择配置部分节点为内存节点。


内存节点将所有的队列,交换器,绑定关系,用户,权限,和vhost的元数据信息保存在内存中。而磁盘节点将这些信息保存在磁盘中,但是内存节点的性能更高,为了保证集群的高可用性,必须保证集群中有两个以上的磁盘节点,来保证当有一个磁盘节点崩溃了,集群还能对外提供访问服务。


在上面的操作中,可以通过如下的方式,设置新加入的节点为内存节点还是磁盘节点:









  1. #加入时候设置节点为内存节点(默认加入的为磁盘节点)





  2. [root@mq-testvm1 ~]# rabbitmqctl join_cluster rabbit@rmq-broker-test-1 --ram













  1. #也通过下面方式修改的节点的类型





  2. [root@mq-testvm1 ~]# rabbitmqctl changeclusternode_type disc | ram






g.最后可以通过“rabbitmqctl cluster_status”的方式来查看集群的状态,上面搭建的10个节点的RabbitMQ集群状态。


(3个节点为磁盘节点,7个节点为内存节点)如下:









  1. Cluster status of node 'rabbit@rmq-broker-test-1'





  2. [{nodes,[{disc,['rabbit@rmq-broker-test-1','rabbit@rmq-broker-test-2',





  3.                'rabbit@rmq-broker-test-3']},





  4.         {ram,['rabbit@rmq-broker-test-9','rabbit@rmq-broker-test-8',





  5.               'rabbit@rmq-broker-test-7','rabbit@rmq-broker-test-6',





  6.               'rabbit@rmq-broker-test-5','rabbit@rmq-broker-test-4',





  7.               'rabbit@rmq-broker-test-10']}]},





  8. {running_nodes,['rabbit@rmq-broker-test-10','rabbit@rmq-broker-test-5',





  9.                 'rabbit@rmq-broker-test-9','rabbit@rmq-broker-test-2',





  10.                 'rabbit@rmq-broker-test-8','rabbit@rmq-broker-test-7',





  11.                 'rabbit@rmq-broker-test-6','rabbit@rmq-broker-test-3',





  12.                 'rabbit@rmq-broker-test-4','rabbit@rmq-broker-test-1']},





  13. {cluster_name,<<"rabbit@mq-testvm1">>},





  14. {partitions,[]},





  15. {alarms,[{'rabbit@rmq-broker-test-10',[]},





  16.          {'rabbit@rmq-broker-test-5',[]},





  17.          {'rabbit@rmq-broker-test-9',[]},





  18.          {'rabbit@rmq-broker-test-2',[]},





  19.          {'rabbit@rmq-broker-test-8',[]},





  20.          {'rabbit@rmq-broker-test-7',[]},





  21.          {'rabbit@rmq-broker-test-6',[]},





  22.          {'rabbit@rmq-broker-test-3',[]},





  23.          {'rabbit@rmq-broker-test-4',[]},





  24.          {'rabbit@rmq-broker-test-1',[]}]}]










(3)配置HAProxy


HAProxy提供高可用性、负载均衡以及基于TCP和HTTP应用的代理,支持虚拟主机,它是免费、快速并且可靠的一种解决方案。根据官方数据,其最高极限支持10G的并发。HAProxy支持从4层至7层的网络交换,即覆盖所有的TCP协议。就是说,Haproxy 甚至还支持 Mysql 的均衡负载。


为了实现RabbitMQ集群的软负载均衡,这里可以选择HAProxy。 关于HAProxy如何安装的文章之前也有很多同学写过,这里就不再赘述了,有需要的同学可以参考下网上的做法。这里主要说下安装完HAProxy组件后的具体配置。 HAProxy使用单一配置文件来定义所有属性,包括从前端IP到后端服务器。下面展示了用于7个RabbitMQ节点组成集群的负载均衡配置(另外3个磁盘节点用于保存集群的配置和元数据,不做负载)。同时,HAProxy运行在另外一台机器上。


HAProxy的具体配置如下:









  1. #全局配置





  2. global





  3.        #日志输出配置,所有日志都记录在本机,通过local0输出





  4.        log 127.0.0.1 local0 info





  5.        #最大连接数





  6.        maxconn 4096





  7.        #改变当前的工作目录





  8.        chroot /apps/svr/haproxy





  9.        #以指定的UID运行haproxy进程





  10.        uid 99





  11.        #以指定的GID运行haproxy进程





  12.        gid 99





  13.        #以守护进程方式运行haproxy #debug #quiet





  14.        daemon





  15.        #debug





  16.        #当前进程pid文件





  17.        pidfile /apps/svr/haproxy/haproxy.pid









  18. #默认配置





  19. defaults





  20.        #应用全局的日志配置





  21.        log global





  22.        #默认的模式mode{tcp|http|health}





  23.        #tcp是4层,http是7层,health只返回OK





  24.        mode tcp





  25.        #日志类别tcplog





  26.        option tcplog





  27.        #不记录健康检查日志信息





  28.        option dontlognull





  29.        #3次失败则认为服务不可用





  30.        retries 3





  31.        #每个进程可用的最大连接数





  32.        maxconn 2000





  33.        #连接超时





  34.        timeout connect 5s





  35.        #客户端超时





  36.        timeout client 120s





  37.        #服务端超时





  38.        timeout server 120s









  39.        maxconn 2000





  40.        #连接超时





  41.        timeout connect 5s





  42.        #客户端超时





  43.        timeout client 120s





  44.        #服务端超时





  45.        timeout server 120s









  46. #绑定配置





  47. listen rabbitmq_cluster





  48.        bind 0.0.0.0:5672





  49.        #配置TCP模式





  50.        mode tcp





  51.        #加权轮询





  52.        balance roundrobin









  53.        server rmq_node1 ip1:5672 check inter 5000 rise 2 fall 3 weight 1





  54.        server rmq_node2 ip2:5672 check inter 5000 rise 2 fall 3 weight 1





  55.        server rmq_node3 ip3:5672 check inter 5000 rise 2 fall 3 weight 1





  56.        server rmq_node4 ip4:5672 check inter 5000 rise 2 fall 3 weight 1





  57.        server rmq_node5 ip5:5672 check inter 5000 rise 2 fall 3 weight 1





  58.        server rmq_node6 ip6:5672 check inter 5000 rise 2 fall 3 weight 1





  59.        server rmq_node7 ip7:5672 check inter 5000 rise 2 fall 3 weight 1













  60. listen monitor





  61.        bind 0.0.0.0:8100





  62.        mode http





  63.        option httplog





  64.        stats enable





  65.        stats uri /stats





  66.        stats refresh 5s







要含义如下:

(a)“server

”部分:定义HAProxy内RabbitMQ服务的标识; 



(c)“check inter

”部分:表示每隔多少毫秒检查RabbitMQ服务是否可用; (d)“rise

”部分:表示RabbitMQ服务在发生故障之后,需要多少次健康检查才能被再次确认可用; 






(e)“fall

”部分:表示需要经历多少次失败的健康检查之后,HAProxy才会停止使用此RabbitMQ服务。



















  1. #启用HAProxy服务





  2. [root@mq-testvm12 conf]# haproxy -f haproxy.cfg











启动后,即可看到如下的HAproxy的界面图:消息中间件—RabbitMQ(集群原理与搭建篇)




(4)RabbitMQ的集群架构设计图


经过上面的RabbitMQ10个节点集群搭建和HAProxy软弹性负载均衡配置后即可组建一个中小规模的RabbitMQ集群了,然而为了能够在实际的生产环境使用还需要根据实际的业务需求对集群中的各个实例进行一些性能参数指标的监控,从性能、吞吐量和消息堆积能力等角度考虑,可以选择Kafka来作为RabbitMQ集群的监控队列使用。


因此,这里先给出了一个中小规模RabbitMQ集群架构设计图:


消息中间件—RabbitMQ(集群原理与搭建篇)


对于消息的生产和消费者可以通过HAProxy的软负载将请求分发至RabbitMQ集群中的Node1~Node7节点,其中Node8~Node10的三个节点作为磁盘节点保存集群元数据和配置信息。鉴于篇幅原因这里就不在对监控部分进行详细的描述的,会在后续篇幅中对如何使用RabbitMQ的HTTP API接口进行监控数据统计进行详细阐述。



三、总结


本文主要详细介绍了RabbitMQ集群的工作原理和如何搭建一个具备负载均衡能力的中小规模RabbitMQ集群的方法,并最后给出了RabbitMQ集群的架构设计图。限于笔者的才疏学浅,对本文内容可能还有理解不到位的地方,如有阐述不合理之处还望留言一起探讨。








- END -


 往期推荐:








  • 死磕Java系列:





















  ……




  • Spring系列:












……


号外:

最近在做几个有意思的开源项目,感兴趣的朋友可以看看。



https://github.com/dyc87112/swagger-butler








深入交流、更多福利


扫码加入我的知识星球





点击“阅读原文”,看本号其他精彩内容




推荐阅读
  • 网站访问全流程解析
    本文详细介绍了从用户在浏览器中输入一个域名(如www.yy.com)到页面完全展示的整个过程,包括DNS解析、TCP连接、请求响应等多个步骤。 ... [详细]
  • 本文深入解析了通过JDBC实现ActiveMQ消息持久化的机制。JDBC能够将消息可靠地存储在多种关系型数据库中,如MySQL、SQL Server、Oracle和DB2等。采用JDBC持久化方式时,数据库会自动生成三个关键表:`activemq_msgs`、`activemq_lock`和`activemq_ACKS`,分别用于存储消息数据、锁定信息和确认状态。这种机制不仅提高了消息的可靠性,还增强了系统的可扩展性和容错能力。 ... [详细]
  • 本指南详细介绍了在Linux环境中高效连接MySQL数据库的方法。用户可以通过安装并使用`mysql`客户端工具来实现本地连接,具体命令为:`mysql -u 用户名 -p 密码 -h 主机`。例如,使用管理员账户连接本地MySQL服务器的命令为:`mysql -u root -p pass`。此外,还提供了多种配置优化建议,以确保连接过程更加稳定和高效。 ... [详细]
  • 【并发编程】全面解析 Java 内存模型,一篇文章带你彻底掌握
    本文深入解析了 Java 内存模型(JMM),从基础概念到高级特性进行全面讲解,帮助读者彻底掌握 JMM 的核心原理和应用技巧。通过详细分析内存可见性、原子性和有序性等问题,结合实际代码示例,使开发者能够更好地理解和优化多线程并发程序。 ... [详细]
  • 2019年后蚂蚁集团与拼多多面试经验详述与深度剖析
    2019年后蚂蚁集团与拼多多面试经验详述与深度剖析 ... [详细]
  • 本文总结了一些开发中常见的问题及其解决方案,包括特性过滤器的使用、NuGet程序集版本冲突、线程存储、溢出检查、ThreadPool的最大线程数设置、Redis使用中的问题以及Task.Result和Task.GetAwaiter().GetResult()的区别。 ... [详细]
  • DVWA学习笔记系列:深入理解CSRF攻击机制
    DVWA学习笔记系列:深入理解CSRF攻击机制 ... [详细]
  • Unity与MySQL连接过程中出现的新挑战及解决方案探析 ... [详细]
  • 优化后的标题:深入探讨网关安全:将微服务升级为OAuth2资源服务器的最佳实践
    本文深入探讨了如何将微服务升级为OAuth2资源服务器,以订单服务为例,详细介绍了在POM文件中添加 `spring-cloud-starter-oauth2` 依赖,并配置Spring Security以实现对微服务的保护。通过这一过程,不仅增强了系统的安全性,还提高了资源访问的可控性和灵活性。文章还讨论了最佳实践,包括如何配置OAuth2客户端和资源服务器,以及如何处理常见的安全问题和错误。 ... [详细]
  • 在 Axublog 1.1.0 版本的 `c_login.php` 文件中发现了一个严重的 SQL 注入漏洞。该漏洞允许攻击者通过操纵登录请求中的参数,注入恶意 SQL 代码,从而可能获取敏感信息或对数据库进行未授权操作。建议用户尽快更新到最新版本并采取相应的安全措施以防止潜在的风险。 ... [详细]
  • 在Linux系统中,网络配置是至关重要的任务之一。本文详细解析了Firewalld和Netfilter机制,并探讨了iptables的应用。通过使用`ip addr show`命令来查看网卡IP地址(需要安装`iproute`包),当网卡未分配IP地址或处于关闭状态时,可以通过`ip link set`命令进行配置和激活。此外,文章还介绍了如何利用Firewalld和iptables实现网络流量控制和安全策略管理,为系统管理员提供了实用的操作指南。 ... [详细]
  • 在iOS开发中,基于HTTPS协议的安全网络请求实现至关重要。HTTPS(全称:HyperText Transfer Protocol over Secure Socket Layer)是一种旨在提供安全通信的HTTP扩展,通过SSL/TLS加密技术确保数据传输的安全性和隐私性。本文将详细介绍如何在iOS应用中实现安全的HTTPS网络请求,包括证书验证、SSL握手过程以及常见安全问题的解决方法。 ... [详细]
  • Kafka 是由 Apache 软件基金会开发的高性能分布式消息系统,支持高吞吐量的发布和订阅功能,主要使用 Scala 和 Java 编写。本文将深入解析 Kafka 的安装与配置过程,为程序员提供详尽的操作指南,涵盖从环境准备到集群搭建的每一个关键步骤。 ... [详细]
  • 第二章:Kafka基础入门与核心概念解析
    本章节主要介绍了Kafka的基本概念及其核心特性。Kafka是一种分布式消息发布和订阅系统,以其卓越的性能和高吞吐量而著称。最初,Kafka被设计用于LinkedIn的活动流和运营数据处理,旨在高效地管理和传输大规模的数据流。这些数据主要包括用户活动记录、系统日志和其他实时信息。通过深入解析Kafka的设计原理和应用场景,读者将能够更好地理解其在现代大数据架构中的重要地位。 ... [详细]
  • 本文详细介绍了如何安全地手动卸载Exchange Server 2003,以确保系统的稳定性和数据的完整性。根据微软官方支持文档(https://support.microsoft.com/kb833396/zh-cn),在进行卸载操作前,需要特别注意备份重要数据,并遵循一系列严格的步骤,以避免对现有网络环境造成不利影响。此外,文章还提供了详细的故障排除指南,帮助管理员在遇到问题时能够迅速解决,确保整个卸载过程顺利进行。 ... [详细]
author-avatar
喏焿你一辈子_997
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有