python读取只读word只读_10.9只读数据库（ReadonlyDatabase）

作者：dfdzgf_542 | 来源：互联网 | 2023-08-30 19:08

如果你查看论文的图3，你可以发现，Aurora不仅有主数据库实例，同时多个数据库的副本。对于Aurora的许多客户来说，相比

如果你查看论文的图3&＃xff0c;你可以发现&＃xff0c;Aurora不仅有主数据库实例&＃xff0c;同时多个数据库的副本。对于Aurora的许多客户来说&＃xff0c;相比读写查询&＃xff0c;他们会有多得多的只读请求。你可以设想一个Web服务器&＃xff0c;如果你只是查看Web页面&＃xff0c;那么后台的Web服务器需要读取大量的数据才能生成页面所需的内容&＃xff0c;或许需要从数据库读取数百个条目。但是在浏览Web网页时&＃xff0c;写请求就要少的多&＃xff0c;或许一些统计数据要更新&＃xff0c;或许需要更新历史记录&＃xff0c;所以读写请求的比例可能是100&＃xff1a;1。所以对于Aurora来说&＃xff0c;通常会有非常大量的只读数据库查询。

对于写请求&＃xff0c;可以只发送给一个数据库&＃xff0c;因为对于后端的存储服务器来说&＃xff0c;只能支持一个写入者。背后的原因是&＃xff0c;Log需要按照数字编号&＃xff0c;如果只在一个数据库处理写请求&＃xff0c;非常容易对Log进行编号&＃xff0c;但是如果有多个数据库以非协同的方式处理写请求&＃xff0c;那么为Log编号将会非常非常难。

但是对于读请求&＃xff0c;可以发送给多个数据库。Aurora的确有多个只读数据库&＃xff0c;这些数据库可以从后端存储服务器读取数据。所以&＃xff0c;图3中描述了&＃xff0c;除了主数据库用来处理写请求&＃xff0c;同时也有一组只读数据库。论文中宣称可以支持最多15个只读数据库。如果有大量的读请求&＃xff0c;读请求可以分担到这些只读数据库上。

当客户端向只读数据库发送读请求&＃xff0c;只读数据库需要弄清楚它需要哪些data page来处理这个读请求&＃xff0c;之后直接从存储服务器读取这些data page&＃xff0c;并不需要主数据库的介入。所以只读数据库向存储服务器直接发送读取page的请求&＃xff0c;之后它会缓存读取到的page&＃xff0c;这样对于将来的一些读请求&＃xff0c;可以直接根据缓存中的数据返回。

当然&＃xff0c;只读数据库也需要更新自身的缓存&＃xff0c;所以&＃xff0c;Aurora的主数据库也会将它的Log的拷贝发送给每一个只读数据库。这就是你从论文中图3看到的蓝色矩形中间的那些横线。主数据库会向这些只读数据库发送所有的Log条目&＃xff0c;只读数据库用这些Log来更新它们缓存的page数据&＃xff0c;进而获得数据库中最新的事务处理结果。

这的确意味着只读数据库会落后主数据库一点&＃xff0c;但是对于大部分的只读请求来说&＃xff0c;这没问题。因为如果你查看一个网页&＃xff0c;如果数据落后了20毫秒&＃xff0c;通常来说不会是一个大问题。

这里其实有一些问题&＃xff0c;其中一个问题是&＃xff0c;我们不想要这个只读数据库看到未commit的事务。所以&＃xff0c;在主数据库发给只读数据库的Log流中&＃xff0c;主数据库需要指出&＃xff0c;哪些事务commit了&＃xff0c;而只读数据库需要小心的不要应用未commit的事务到自己的缓存中&＃xff0c;它们需要等到事务commit了再应用对应的Log。

另一个问题是&＃xff0c;数据库背后的B-Tree结构非常复杂&＃xff0c;可能会定期触发rebalance。而rebalance是一个非常复杂的操作&＃xff0c;对应了大量修改树中的节点的操作&＃xff0c;这些操作需要有原子性。因为当B-Tree在rebalance的过程中&＃xff0c;中间状态的数据是不正确的&＃xff0c;只有在rebalance结束了才可以从B-Tree读取数据。但是只读数据库直接从存储服务器读取数据库的page&＃xff0c;它可能会看到在rebalance过程中的B-Tree。这时看到的数据是非法的&＃xff0c;会导致只读数据库崩溃或者行为异常。

论文中讨论了微事务&＃xff08;Mini-Transaction&＃xff09;和VDL/VCL。这部分实际讨论的就是&＃xff0c;数据库服务器可以通知存储服务器说&＃xff0c;这部分复杂的Log序列只能以原子性向只读数据库展示&＃xff0c;也就是要么全展示&＃xff0c;要么不展示。这就是微事务&＃xff08;Mini-Transaction&＃xff09;和VDL。所以当一个只读数据库需要向存储服务器查看一个data page时&＃xff0c;存储服务器会小心的&＃xff0c;要么展示微事务之前的状态&＃xff0c;要么展示微事务之后的状态&＃xff0c;但是绝不会展示中间状态。

以上就是所有技术相关的内容&＃xff0c;我们来总结一下论文中有意思的地方&＃xff0c;以及我们可以从论文中学到的一些东西。

一件可以学到的事情其实比较通用&＃xff0c;并不局限于这篇论文。大家都应该知道事务型数据库是如何工作的&＃xff0c;并且知道事务型数据库与后端存储之间交互带来的影响。这里涉及了性能&＃xff0c;故障修复&＃xff0c;以及运行一个数据库的复杂度&＃xff0c;这些问题在系统设计中会反复出现。
另一个件可以学到的事情是&＃xff0c;Quorum思想。通过读写Quorum的重合&＃xff0c;可以确保总是能看见最新的数据&＃xff0c;但是又具备容错性。这种思想在Raft中也有体现&＃xff0c;Raft可以认为是一种强Quorum的实现&＃xff08;读写操作都要过半服务器认可&＃xff09;。
这个论文中另一个有趣的想法是&＃xff0c;数据库和存储系统基本是一起开发出来的&＃xff0c;数据库和存储系统以一种有趣的方式集成在了一起。通常我们设计系统时&＃xff0c;需要有好的隔离解耦来区分上层服务和底层的基础架构。所以通常来说&＃xff0c;存储系统是非常通用的&＃xff0c;并不会为某个特定的应用程序定制。因为一个通用的设计可以被大量服务使用。但是在Aurora面临的问题中&＃xff0c;性能问题是非常严重的&＃xff0c;它不得不通过模糊服务和底层基础架构的边界来获得35倍的性能提升&＃xff0c;这是个巨大的成功。
最后一件有意思的事情是&＃xff0c;论文中的一些有关云基础架构中什么更重要的隐含信息。例如&＃xff1a;
- 需要担心整个AZ会出现故障&＃xff1b;
- 需要担心短暂的慢副本&＃xff0c;这是经常会出现的问题&＃xff1b;
- 网络是主要的瓶颈&＃xff0c;毕竟Aurora通过网络发送的是极短的数据&＃xff0c;但是相应的&＃xff0c;存储服务器需要做更多的工作&＃xff08;应用Log&＃xff09;&＃xff0c;因为有6个副本&＃xff0c;所以有6个CPU在复制执行这些redo Log条目&＃xff0c;明显&＃xff0c;从Amazon看来&＃xff0c;网络容量相比CPU要重要的多。

小广告&＃xff1a;

MIT6.824的中文翻译&＃xff0c;我也会连载在微信公众号&＃xff1a; honghui_writing&＃xff0c;微信的内容更加整齐一些。

推荐阅读

web
开发中遇到的一些常见问题及解决方案

本文总结了一些开发中常见的问题及其解决方案，包括特性过滤器的使用、NuGet程序集版本冲突、线程存储、溢出检查、ThreadPool的最大线程数设置、Redis使用中的问题以及Task.Result和Task.GetAwaiter().GetResult()的区别。 ... [详细]

蜡笔小新 2024-11-12 08:20:05
tree
深入解析JDK 8 HashMap源代码：put方法详解及capacity、size、loadFactor和红黑树转换阈值的设定原理

本文深入解析了JDK 8中HashMap的源代码，重点探讨了put方法的工作机制及其内部参数的设定原理。HashMap允许键和值为null，但键为null的情况只能出现一次，因为null键在内部通过索引0进行存储。文章详细分析了capacity（容量）、size（大小）、loadFactor（加载因子）以及红黑树转换阈值的设定原则，帮助读者更好地理解HashMap的高效实现和性能优化策略。 ... [详细]

蜡笔小新 2024-11-10 14:10:53
web
秒建一个后台管理系统？用这5个开源免费的Java项目就够了

秒建一个后台管理系统？用这5个开源免费的Java项目就够了 ... [详细]

蜡笔小新 2024-11-12 03:21:33
get
使用 Matplotlib 保存 Python 动态图像为视频文件的方法与技巧

本文介绍了如何利用 `matplotlib` 库中的 `FuncAnimation` 类将 Python 中的动态图像保存为视频文件。通过详细解释 `FuncAnimation` 类的参数和方法，文章提供了多种实用技巧，帮助用户高效地生成高质量的动态图像视频。此外，还探讨了不同视频编码器的选择及其对输出文件质量的影响，为读者提供了全面的技术指导。 ... [详细]

蜡笔小新 2024-11-11 22:11:30
get
Python应用实例大揭秘：七大令人惊叹的高阶技巧展示

2020年，Python无疑成为了最炙手可热的编程语言，其影响力已远远超出程序员的范畴。从初学者到资深从业者，甚至小学生，都在纷纷加入Python的学习热潮中。凭借其低门槛、易上手和强大的功能，Python正逐渐成为各行业不可或缺的工具。本文将揭示七个令人惊叹的Python高级应用技巧，帮助读者进一步提升编程水平。 ... [详细]

蜡笔小新 2024-11-11 15:04:48
web
阿里巴巴终面技术挑战：如何利用 UDP 实现 TCP 功能？

在阿里巴巴的技术面试中，技术总监曾提出一道关于如何利用 UDP 实现 TCP 功能的问题。当时回答得不够理想，因此事后进行了详细总结。通过与总监的进一步交流，了解到这是一道常见的阿里面试题。面试官的主要目的是考察应聘者对 UDP 和 TCP 在原理上的差异的理解，以及如何通过 UDP 实现类似 TCP 的可靠传输机制。 ... [详细]

蜡笔小新 2024-11-11 11:50:49
tree
机器学习的持续探索与进展

在机器学习领域，深入探讨了概率论与数理统计的基础知识，特别是这些理论在数据挖掘中的应用。文章重点分析了偏差（Bias）与方差（Variance）之间的平衡问题，强调了方差反映了不同训练模型之间的差异，例如在K折交叉验证中，不同模型之间的性能差异显著。此外，还讨论了如何通过优化模型选择和参数调整来有效控制这一平衡，以提高模型的泛化能力。 ... [详细]

蜡笔小新 2024-11-11 10:27:39
tree
Git命令基础应用指南

本指南详细介绍了Git命令的基础应用，包括如何使用`git clone`从远程服务器克隆仓库（例如：`git clone [url/path/repository]`）以及如何克隆本地仓库（例如：`git clone [local/path/repository]`）。此外，还提供了常见的Git操作技巧，帮助开发者高效管理代码版本。 ... [详细]

蜡笔小新 2024-11-11 09:19:38
web
Bootstrap 学习指南：全面掌握前端框架的核心知识点与实战技巧

### 优化后的摘要本学习指南旨在帮助读者全面掌握 Bootstrap 前端框架的核心知识点与实战技巧。内容涵盖基础入门、核心功能和高级应用。第一章通过一个简单的“Hello World”示例，介绍 Bootstrap 的基本用法和快速上手方法。第二章深入探讨 Bootstrap 与 JSP 集成的细节，揭示两者结合的优势和应用场景。第三章则进一步讲解 Bootstrap 的高级特性，如响应式设计和组件定制，为开发者提供全方位的技术支持。 ... [详细]

蜡笔小新 2024-11-09 16:58:21
web
优化后的标题：深入探讨网关安全：将微服务升级为OAuth2资源服务器的最佳实践

本文深入探讨了如何将微服务升级为OAuth2资源服务器，以订单服务为例，详细介绍了在POM文件中添加 `spring-cloud-starter-oauth2` 依赖，并配置Spring Security以实现对微服务的保护。通过这一过程，不仅增强了系统的安全性，还提高了资源访问的可控性和灵活性。文章还讨论了最佳实践，包括如何配置OAuth2客户端和资源服务器，以及如何处理常见的安全问题和错误。 ... [详细]

蜡笔小新 2024-11-09 16:13:27
web
深入解析NoSQL数据库：键值对、文档、列式存储与图数据库的应用与特点

本文深入探讨了NoSQL数据库的四大主要类型：键值对存储、文档存储、列式存储和图数据库。NoSQL（Not Only SQL）是指一系列非关系型数据库系统，它们不依赖于固定模式的数据存储方式，能够灵活处理大规模、高并发的数据需求。键值对存储适用于简单的数据结构；文档存储支持复杂的数据对象；列式存储优化了大数据量的读写性能；而图数据库则擅长处理复杂的关系网络。每种类型的NoSQL数据库都有其独特的优势和应用场景，本文将详细分析它们的特点及应用实例。 ... [详细]

蜡笔小新 2024-11-09 14:47:28
web
Web开发框架概览：Java与JavaScript技术及框架综述

Web开发涉及服务器端和客户端的协同工作。在服务器端，Java是一种优秀的编程语言，适用于构建各种功能模块，如通过Servlet实现特定服务。客户端则主要依赖HTML进行内容展示，同时借助JavaScript增强交互性和动态效果。此外，现代Web开发还广泛使用各种框架和库，如Spring Boot、React和Vue.js，以提高开发效率和应用性能。 ... [详细]

蜡笔小新 2024-11-09 11:59:38
php
深入解析Java多线程同步机制与应用

本文深入探讨了Java多线程环境下的同步机制及其应用，重点介绍了`synchronized`关键字的使用方法和原理。`synchronized`关键字主要用于确保多个线程在访问共享资源时的互斥性和原子性。通过具体示例，如在一个类中使用`synchronized`修饰方法，展示了如何实现线程安全的代码块。此外，文章还讨论了`ReentrantLock`等其他同步工具的优缺点，并提供了实际应用场景中的最佳实践。 ... [详细]

蜡笔小新 2024-11-08 16:11:26
include
Android中将独立SO库封装进JAR包并实现SO库的加载与调用

在Android开发中，将独立的SO库封装进JAR包并实现其加载与调用是一个常见的需求。本文详细介绍了如何将SO库嵌入到JAR包中，并确保在外部应用调用该JAR包时能够正确加载和使用这些SO库。通过这种方式，开发者可以更方便地管理和分发包含原生代码的库文件，提高开发效率和代码复用性。文章还探讨了常见的问题及其解决方案，帮助开发者避免在实际应用中遇到的坑。 ... [详细]

蜡笔小新 2024-11-07 14:28:55
tree
深入解析MySQL中的回表查询与索引覆盖技术

在MySQL中，回表查询与索引覆盖技术是优化查询性能的重要手段。回表查询是指当使用非聚集索引进行查询时，由于非聚集索引的B-Tree叶子节点中仅存储了对应行数据的主键值，因此需要通过主键再次访问聚簇索引来获取完整数据记录。而索引覆盖则是在查询所需的所有列都包含在某个索引中，从而避免了额外的回表操作，显著提高了查询效率。本文将深入探讨这两种技术的原理及其应用场景，帮助读者更好地理解和优化MySQL查询性能。 ... [详细]

蜡笔小新 2024-11-06 15:20:30

dfdzgf_542

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章