热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

分布式Raft算法介绍

高可用性,高稳定性以及数据一致性是衡量服务的三个基本要素。其中数据一致性在分布式服务中是根基----不管是强一致性还是最终一致性等都需要保证其数据的一致性࿰

 高可用性,高稳定性以及数据一致性是衡量服务的三个基本要素。其中数据一致性在分布式服务中是根基----不管是强一致性还是最终一致性等都需要保证其数据的一致性,不然高可用和高稳定没有任何意义(即便服务容忍一定时延的不一致)。

分布式一致性的保证:

数据保证一致性主要是这两种形式:一种是集群只有一个节点能进行数据的增删改,然后其它节点和单前节点进行同步数据。第二种就是集群节点通过沟通下在合适的时间大家一起进行数据的增删改数据来达到数据一致性。这两种方式细想下它们都需要有一个发起人,由发起人开个头然后集群开始数据的同步操作,这个发起人也就成为leader。

如何选leader比如:

方式一 :大家都读数据库然后读取时增加读锁,谁获取了值就是leader,这种方式在获取锁时需要连接数据库,执行查询操作,增加锁,执行完操作后释放锁,同时还有单点问题,性能瓶颈,通过这种方式提供的锁服务无法满足需求,同时获取了锁的节点如果挂了呢? 或者获取锁的节点在脑裂网络区间呢? 这种方式选取leader不合适。

方式二:由一台服务器与所有机器保持心跳,当需要选择leader时 就在其中随机选择一台,同时通知所有的,如果超过半数同意就成功了。问题关键是一台服务器和所有机器保持心跳,为了提高高可用性增加备用机器,在这台机器挂掉后,备用机器需要和所有机器建立连接,为了提高速度,使用热备,master和热备也用心跳保持关系,一旦挂掉,就接过master的权限,执行其职能,同时客户机的配置中需要增加关于这两台机器的配置,方便为其创建连接,同时检测连接是否正常,这种方式就算出现脑裂问题也不影响,一切以连接到master机器上的所有节点为准。

方式三:集群中每个节点与其余所有节点共同商量谁来当leader。

目前业界使用的不管是Paxos还是Raft算法以及它们的变种算法都是采用方式三来进行leader选举。方式二有点资源浪费,但是按照常理来讲参与决策方越多效率越低,方式二却是避免了这种方式(暂时用不上)。

Raft算法由于其容易理解和实现等原因开始在后期大受欢迎比如:etcd就是基于此实现的,而大名鼎鼎的Kubernetes是基于etcd实现的(间接基于Raft),以及百度的braft(raft变种)。

Raft算法实现一致性通过实现下面:

》选择leader----这个是用来保证其是第一个执行操作的,保证独立性,不会在别的节点同时出现别的操作。

》日志复制----这是leader节点执行操作产生的操作日志,用来和leader节点保存一致,这是选举leader的原因,然后把日志复制到其余节点,每个节点执行成功以后就可以保证和leader节点保证一致了,这和传统的2pc(2 phase commit 2阶段提交) 优势在于---2pc在整个过程中是hold全部资源的,需要全部节点执行成功后才能释放而这个只需要leader节点执行成功,然后保存到日志并复制到别的节点后就可以了,其余节点什么时候执行,自有各个节点来保证日志的执行, 在leader任期内执行别的操作时必须 上一个执行的操作的log的日志已经分发到别的所有大部分节点了,不需要执行,只需要保存,后期执行就可以。

Raft这种算法选举时对性能有一定影响,不仅是Raft,其余的选举算法,随着节点的增加,选举的效率就越低,比如etcd就是建议部署3或5个节点就可以。如果需要大规模选举可以采用上面的方式二。(这就好比股票的撮合交易竞价或者是区块链中有比特币的公共链到联盟链等转换)。

问题:

选举时如何得知其获得了大多数选票,节点是会挂的,会随时变化:

当前节点参加选举时会和其余节点通讯,如果在通讯的大多数节点都同意,那就ok,那问题又来了,如何保障能和其它节点都能通讯? 这个除非节点挂掉,如果在投后节点挂掉了也不影响,因为只能投给一个节点不能再投别的节点,投票前挂掉不没有影响。还有一种就是脑裂问题,这可能会在不同区域都选举一个区域的leader,对于脑裂问题 可以人工干预或者定时检查,对于脑裂区域是否不提供服务或者提供部分服务这个依据具体业务场景来。




推荐阅读
  • 2018年3月31日,CSDN、火星财经联合中关村区块链产业联盟等机构举办的2018区块链技术及应用峰会(BTA)核心分会场圆满举行。多位业内顶尖专家深入探讨了区块链的核心技术原理及其在实际业务中的应用。 ... [详细]
  • 本文探讨了如何在日常工作中通过优化效率和深入研究核心技术,将技术和知识转化为实际收益。文章结合个人经验,分享了提高工作效率、掌握高价值技能以及选择合适工作环境的方法,帮助读者更好地实现技术变现。 ... [详细]
  • 网络攻防实战:从HTTP到HTTPS的演变
    本文通过一系列日记记录了从发现漏洞到逐步加强安全措施的过程,探讨了如何应对网络攻击并最终实现全面的安全防护。 ... [详细]
  • 1:有如下一段程序:packagea.b.c;publicclassTest{privatestaticinti0;publicintgetNext(){return ... [详细]
  • 深入理解Cookie与Session会话管理
    本文详细介绍了如何通过HTTP响应和请求处理浏览器的Cookie信息,以及如何创建、设置和管理Cookie。同时探讨了会话跟踪技术中的Session机制,解释其原理及应用场景。 ... [详细]
  • 数据库内核开发入门 | 搭建研发环境的初步指南
    本课程将带你从零开始,逐步掌握数据库内核开发的基础知识和实践技能,重点介绍如何搭建OceanBase的开发环境。 ... [详细]
  • 网络运维工程师负责确保企业IT基础设施的稳定运行,保障业务连续性和数据安全。他们需要具备多种技能,包括搭建和维护网络环境、监控系统性能、处理突发事件等。本文将探讨网络运维工程师的职业前景及其平均薪酬水平。 ... [详细]
  • Hadoop入门与核心组件详解
    本文详细介绍了Hadoop的基础知识及其核心组件,包括HDFS、MapReduce和YARN。通过本文,读者可以全面了解Hadoop的生态系统及应用场景。 ... [详细]
  • 本文探讨了MariaDB在当前数据库市场中的地位和挑战,分析其可能面临的困境,并提出了对未来发展的几点看法。 ... [详细]
  • 随着网络安全威胁的不断演变,电子邮件系统成为攻击者频繁利用的目标。本文详细探讨了电子邮件系统中的常见漏洞及其潜在风险,并提供了专业的防护建议。 ... [详细]
  • 探讨如何真正掌握Java EE,包括所需技能、工具和实践经验。资深软件教学总监李刚分享了对毕业生简历中常见问题的看法,并提供了详尽的标准。 ... [详细]
  • 探讨架构师在项目中应如何平衡对产品的关注和对团队成员的关注,以实现最佳的开发成果。 ... [详细]
  • 深入理解一致性哈希算法及其应用
    本文详细介绍了分布式系统中的一致性哈希算法,探讨其原理、优势及应用场景,帮助读者全面掌握这一关键技术。 ... [详细]
  • 本文探讨了2012年4月期间,淘宝在技术架构上的关键数据和发展历程。涵盖了从早期PHP到Java的转型,以及在分布式计算、存储和网络流量管理方面的创新。 ... [详细]
  • 本文详细探讨了Java中的24种设计模式及其应用,并介绍了七大面向对象设计原则。通过创建型、结构型和行为型模式的分类,帮助开发者更好地理解和应用这些模式,提升代码质量和可维护性。 ... [详细]
author-avatar
龙娃爸爸3
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有