当前位置: 开发笔记 > 编程语言 > 正文

[分布式系统学习]阅读笔记Distributedsystemsforfunandprofit之三时间和顺序

作者：Jolina | 来源：互联网 | 2023-09-25 13:11

这是阅读http:book.mixu.netdistsystime.html的笔记，是该系列的第三章。为什么时间和顺序很重要呢？为什么我们关系事件A发生在事件B之前？因为分布式系统

这是阅读 http://book.mixu.net/distsys/time.html 的笔记，是该系列的第三章。

为什么时间和顺序很重要呢？为什么我们关系事件A发生在事件B之前？

因为分布式系统要解决的问题是把单机上的问题通过多机来解决。然而传统单机的程序总是假设确定的顺序。对于分布式程序来说，正确性最简单的定义就是，跑起来像一台单机上运行的程序。

全序和偏序

具体的定义大家可以去翻离散书。简单地说，全序就是在集合里任何两个元素都可以比较，分出大小。偏序中，某些元素是没办法比较大小的。

在单节点系统中，全序是必然的。因为单机上指令顺序执行。程序运行可预测。这个性质在分布式系统上不是不能实现，但是要付出代价。通信非常昂贵，时间同步困难且脆弱。

什么是时间

时间是顺序的来源。有了时间，我们才可以定义谁先谁后。分秒时只不过为了让人理解恰好出现的记号。

假设时间以同样的速率推进，（这是一个非常强的假设），时间和时间戳有下面解释：

顺序（Order）例如，通过时间戳对事件进行排序
持续时间（Duration）计算某事件持续时间，用于算法判断条件（例如监控心跳，判断是否出现网络分割）
解读（Interpretaion）时间作为日期，本身包含一定意义，例如判断下周日是否下雨。

分布式系统中每个节点都有独立的本地时间和时间戳，于是事件的发生有本地的顺序。但是该顺序和其他节点完全独立。给决定分布式系统中的全局顺序造成一定困难。

不可假设时间匀速流逝

分布式系统中应该尽量避免假设时间在不同节点上都以同样的速率流逝，否则系统实现会比较脆弱。

那是否可以做到不同节点事件，一致而顺序发生呢？有三个设计（假设）选择。

全局时钟（Global Clock）：是
本地时钟（Local Clock）：不全是
没有时钟存在（No Clock）：没有

同步系统模型有全局时钟，部分同步模型有本地时钟，而异步系统模型没有时钟。

全局时钟假设

全局时钟是全序的源泉。

完美的时钟，走时同步，存在于所有节点。这是分布式系统的理想假设。实际上，时钟同步只能保证有限的精度。用户可能随机地改变本机时间，新节点加入，都有可能破坏全局时钟的假设。

当然，现实系统也有做出这个假设的。FB的Cassandra，就是使用时间戳来解决write的冲突的。时间戳较大的write会赢。那么，如果时间不同步，那么旧的write有可能覆盖新的。

本地时钟假设

假设，可能是目前比较合理的假设，本地有时钟，但是不存在一个全局时钟。两个节点的本地时间戳是不能比较的。

这和真实世界比较接近。事件在本地是可以排序的，但是在多节点分布式系统里不行。不过可以在单机上计算timeout。

没有时钟假设

完全不使用”时钟”这个概念，取而代之，“逻辑时间”。因为时间戳么，只不过是当前世界状态的一个快照，那我们用一个计数器（Counter），并和节点之间交流就可以做到了。

这样，我们可以在不同的节点之间决定事件顺序。不过有个坏处，因为缺乏时钟，没办法决定timeout。

“没有时钟”的假设的一个实现是“Vector clocks”。后面会详细讲到。Cassandra的cousin Riak 和 Vodemort（LinkedIn）是它的应用。这些系统避免了全局or本地时钟漂移带来的不确定性。

那么事件的顺序的准确性，完全是由通信的延时来决定了。

向量时钟 (Vector clocks)

Lamport时钟和向量时钟通过计数器和通信来决定分布式系统中事件发生顺序的。计数器可以在不同节点之前进行比较。

Lamport时钟

每个进程都维护一个计时器。

当进程做了任意一件事，增加计时器计数。
进程发送的消息中包含计时器计数。
当收到消息以后，计数器设置如下：max(local_counter, received_counter) + 1

Lamport时钟定义了一个偏序，如果 timestamp(a)

a 可能发生在b之前
a和b压根没法比较

第二种情况发生在a和b所在的Partition没有发送通信。

Vector clocks

向量时钟是Lamport时钟的一种扩展。它维护大小为N的数列[t1, t2, ....]，N为节点数。每个节点都更新自己的时钟。

每当进程做了事情，更新该node的时钟。
进程发送的消息，包含上面提到的数组。
当收到消息以后，更新本地的数组里面的每个元素max(local, received)；为当前节点的counter加1。

如下图：

向量时钟潜在的问题是每个节点都有个时钟计数，对于大型的系统来说，向量本身可能变得很大。

失灵检测

对于一个节点上的程序，它怎么知道远程某个节点失效了呢？在缺乏有效准确的全局信息下，我们可以通过一个合理的timeout值来确定。

但是合理的timeout值该怎么确定呢？

失灵检测器可以通过使用心跳消息来实现timeout。节点之间交换心跳消息。如果消息在timeout之前没有收到响应，就可以认为出现失效。

这种检测要么太冲动(把正常的节点算成失效），要么太保守，很长时间才能检测出错误。

论文 http://www.google.com/search?q=Unreliable%20Failure%20Detectors%20for%20Reliable%20Distributed%20Systems 讨论了失灵检测在解决一致性问题中的两大属性：完整性和精准性。

时间，顺序和性能

我们知道在分布式系统中应假设偏序而不是全序。而要承诺全序也是可能的，但是代价非常大。通常的做法是告诉某一个master节点顺序，让它去执行。（GFS的control path做法）。这可能造成性能瓶颈。

时间，顺序和同步真的必要么？看情况。有时候可能你只不过需要最后的结果而不关系中间事件发生的顺序。（Map Reduce）

推荐阅读

timestamp
超分辨率技术的全球研究进展与应用现状综述

本文综述了图像超分辨率（Super-Resolution, SR）技术在全球范围内的最新研究进展及其应用现状。超分辨率技术旨在从单幅或多幅低分辨率（Low-Resolution, LR）图像中恢复出高质量的高分辨率（High-Resolution, HR）图像。该技术在遥感、医疗成像、视频处理等多个领域展现出广泛的应用前景。文章详细分析了当前主流的超分辨率算法，包括基于传统方法和深度学习的方法，并探讨了其在实际应用中的优缺点及未来发展方向。 ... [详细]

蜡笔小新 2024-10-31 15:10:48
php
Java中高级工程师面试必备：JVM核心知识点全面解析

对于软件开发人员而言，随着技术框架的不断演进和成熟，许多高级功能已经被高度封装，使得初级开发者只需掌握基本用法即可迅速完成项目。然而，对于中高级工程师而言，深入了解Java虚拟机（JVM）的核心知识点是必不可少的。这不仅有助于优化性能和解决复杂问题，还能在面试中脱颖而出。本文将全面解析JVM的关键概念和技术细节，帮助读者全面提升技术水平。 ... [详细]

蜡笔小新 2024-10-31 10:20:42
php
深入解析设计模式之开闭原则的应用与实践

本文深入探讨了设计模式中的开闭原则，详细解析了其核心理念及其在多种设计模式中的应用。文章首先介绍了开闭原则的基本概念，随后通过实例分析了该原则在策略模式、简单工厂模式、工厂方法模式、抽象工厂模式、建造者模式、桥梁模式以及外观模式中的具体实现。通过对这些模式的对比和讨论，旨在帮助读者更好地理解和应用开闭原则，提升软件系统的可扩展性和可维护性。 ... [详细]

蜡笔小新 2024-11-01 16:04:50
php
PHP中元素的计量单位是什么？

PHP中元素的计量单位是什么？ ... [详细]

蜡笔小新 2024-11-01 15:06:51
php
BZOJ4240 Gym 102082G：贪心算法与树状数组的综合应用

BZOJ4240 Gym 102082G 题目 "有趣的家庭菜园" 结合了贪心算法和树状数组的应用，旨在解决在有限时间和内存限制下高效处理复杂数据结构的问题。通过巧妙地运用贪心策略和树状数组，该题目能够在 10 秒的时间限制和 256MB 的内存限制内，有效处理大量输入数据，实现高性能的解决方案。提交次数为 756 次，成功解决次数为 349 次，体现了该题目的挑战性和实际应用价值。 ... [详细]

蜡笔小新 2024-11-01 09:27:15
php
PHP应用性能优化实战指南：从理论到实践的全面解析

在《PHP应用性能优化实战指南：从理论到实践的全面解析》一文中，作者分享了一次实际的PHP应用优化经验。文章回顾了先前进行的一次优化项目，指出即使系统运行时间较长后出现的各种问题和性能瓶颈，通过采用一些通用的优化策略仍然能够有效解决。文中不仅详细阐述了优化的具体步骤和方法，还结合实例分析了优化前后的性能对比，为读者提供了宝贵的参考和借鉴。 ... [详细]

蜡笔小新 2024-10-31 20:54:49
php
微信支付授权目录配置详解及操作步骤

在使用微信支付时，若通过WeixinJSBridge.invoke方法调用支付功能，可能会遇到“当前页面URL未注册”的错误提示，导致get_brand_wcpay_request:fail调用微信JSAPI支付失败。为解决这一问题，需要正确配置微信支付授权目录，确保支付页面的URL已成功注册。本文将详细介绍微信支付授权目录的配置步骤和注意事项，帮助开发者顺利完成支付功能的集成与调试。 ... [详细]

蜡笔小新 2024-10-31 18:13:25
format
深入解析 MXOTDLL.dll 在 C# 中的应用与优化策略

本文深入探讨了 MXOTDLL.dll 在 C# 环境中的应用与优化策略。针对近期公司从某生物技术供应商采购的指纹识别设备，该设备提供的 DLL 文件是用 C 语言编写的。为了更好地集成到现有的 C# 系统中，我们对原生的 C 语言 DLL 进行了封装，并利用 C# 的互操作性功能实现了高效调用。此外，文章还详细分析了在实际应用中可能遇到的性能瓶颈，并提出了一系列优化措施，以确保系统的稳定性和高效运行。 ... [详细]

蜡笔小新 2024-10-31 17:21:11
php
掌握PHP框架开发与应用的核心知识点：构建高效PHP框架所需的技术与能力综述

掌握PHP框架开发与应用的核心知识点对于构建高效PHP框架至关重要。本文综述了开发PHP框架所需的关键技术和能力，包括但不限于对PHP语言的深入理解、设计模式的应用、数据库操作、安全性措施以及性能优化等方面。对于初学者而言，熟悉主流框架如Laravel、Symfony等的实际应用场景，有助于更好地理解和掌握自定义框架开发的精髓。 ... [详细]

蜡笔小新 2024-10-31 14:51:01
php
全栈工程师在当今技术领域的角色与价值探析

当前，众多初创企业对全栈工程师的需求日益增长，但市场中却存在大量所谓的“伪全栈工程师”，尤其是那些仅掌握了Node.js技能的前端开发人员。本文旨在深入探讨全栈工程师在现代技术生态中的真实角色与价值，澄清对这一角色的误解，并强调真正的全栈工程师应具备全面的技术栈和综合解决问题的能力。 ... [详细]

蜡笔小新 2024-10-31 10:28:12
uri
深入解析Tomcat：开发者的实用指南

深入解析Tomcat：开发者的实用指南 ... [详细]

蜡笔小新 2024-10-31 09:46:02
php
MySQL性能优化与调参指南【数据库管理】

本文详细探讨了MySQL数据库的性能优化与参数调整技巧，旨在帮助数据库管理员和开发人员提升系统的运行效率。内容涵盖索引优化、查询优化、配置参数调整等方面，结合实际案例进行深入分析，提供实用的操作建议。此外，还介绍了常见的性能监控工具和方法，助力读者全面掌握MySQL性能优化的核心技能。 ... [详细]

蜡笔小新 2024-10-31 03:13:07
split
自定义文本的烟花效果，专为清洁工人设计

本文介绍了一种专为清洁工人设计的自定义文本烟花效果。通过该功能，用户可以输入特定的感谢或祝福语句，系统将生成绚丽的烟花动画，以表达对清洁工人的敬意和感激之情。该特效不仅美观，还能增强用户的互动体验，提升公共场合的氛围。 ... [详细]

蜡笔小新 2024-10-28 16:20:40
range
【Java新手进阶指南】——深入解析顶级类Object的源码实现

本文将深入探讨Java编程语言中顶级类`Object`的源码实现，旨在为Java新手提供进阶指导。`Object`类是所有Java类的基类，了解其内部机制对于提升编程技能至关重要。文章首先介绍了API文档的使用方法，这对于有开发经验的Java程序员来说是不可或缺的工具。通过详细解析`Object`类的关键方法和属性，读者可以更好地理解Java的核心原理和设计思想。此外，文章还提供了实际代码示例，帮助读者在实践中掌握这些知识。 ... [详细]

蜡笔小新 2024-10-28 04:43:04
php
如何在微信公众平台构建新浪云服务应用程序

如何在微信公众平台集成新浪云服务应用摘要：新浪云服务平台SinaAppEngine（简称SAE）自2009年启动内部研发，并于同年对外开放。本文详细介绍了如何利用SAE的强大功能，在微信公众平台上构建高效、稳定的云服务应用程序，涵盖从环境配置到应用部署的全流程，为开发者提供详尽的技术指导与实践案例。 ... [详细]

蜡笔小新 2024-10-26 19:45:54

Jolina

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章