当前位置: 开发笔记 > 编程语言 > 正文

Oriented_CStore:AColumnorientedDBMSMike

作者：小编106 | 来源：互联网 | 2023-08-30 15:52

篇首语：本文由编程笔记#小编为大家整理，主要介绍了C-Store:AColumn-orientedDBMSMike相关的知识，希望对你有一定的参考价值。这篇pap

篇首语：本文由编程笔记#小编为大家整理，主要介绍了C-Store: A Column-oriented DBMS Mike相关的知识，希望对你有一定的参考价值。

这篇paper比较老，是列存比较基础的论文

几乎所有列存，或olap的论文都会引用这篇

行存面向写，支持OLTP

列存面向读，支持OLAP

基于磁盘的DBMS，瓶颈基本在磁盘IO，所有做的工作都是用多余的cpu来换取磁盘IO

总体的思路，压缩让需要存的数据更小，densepack，更多的数据一起存，这样会更紧凑？

本论文的创新点，如下

Hybrid架构

这个架构很有借鉴意义，因为一种结构很难同时满足TP和AP的需要

所以用两个系统，一个用于write-optimized，一个用于read-optimized，中间用一个tuple mover进行数据的同步

后续很多列存和ap系统都是用的这种架构

数据模型

这里提出的数据模型，比较有意思

Table只是一个逻辑概念，真正存储的是projections，

projection是columns的集合，并且projection之间是可以overlap的

这其实不就是把一张表，拆成多张表吗？或者可以认为是一种行存和列存的balance？类似Hbase的column family

降低了数据库管理的成本

可以对不同的projection不同的排序，当前不同排序的成本是很高的，需要多存一份数据

数据冗余可以用于数据恢复，因为一个colunm往往在不同的projections中存了多份

避免join，因为这个projection可以包含外表的字段，但是由于表拆的更小了，所以又增加了join的概率，双刃剑

数据压缩

在RS端，需要对数据进行压缩来降低磁盘IO

在WS端，就不需要加压缩了，因为本身数据在memory，而且WS只是cache实时数据，数据量不大

分成4种情况，

自身有序，大量重复，记录length

自身无序，大量重复，bitmap

自身有序，少量重复，记录delta

自身无序，少量重复，无解

并且对于数据value，可以再加上B-tree索引，因为RS是没有更新的，所以索引可以建的非常紧凑，不会有空洞，densepack

Snapshot Isolation

SI的核心问题，是在查询时间ET，我们要决定在WS和RS中哪些records是visible的？

SI，之所以是Snapshot，就是不能update in place，写不影响原来的读

所以update变成，一个insert和一个delete，这样如果我们记录下，insert和delete的时间，然后和ET比较，就可以判断这个record是否可见

这里决定以绝对时间来作为visible的判断，粒度太小，所以提出epoch

所以会保存insertion vector和deleted record vector，记录每个record的insert和delete的epoch

Epoch是什么，

对时间的划分

有个leader TA，会定期发送message，告诉大家可以epoch+1

然后大家会进入下一个epoch，并且等当前epoch的Transaction都结束后，reply到TA

TA收到所有的reply，就会把HWM设为改epoch，然后广播给大家，这样HWM以下的数据都是被读到的

推荐阅读

get
深入理解Redis的数据结构与对象系统

本文详细探讨了Redis中的数据结构和对象系统的实现，包括字符串、列表、集合、哈希表和有序集合等五种核心对象类型，以及它们所使用的底层数据结构。通过分析源码和相关文献，帮助读者更好地理解Redis的设计原理。 ... [详细]

蜡笔小新 2024-12-25 04:11:22
get
优化ListView性能

本文深入探讨了如何通过多种技术手段优化ListView的性能，包括视图复用、ViewHolder模式、分批加载数据、图片优化及内存管理等。这些方法能够显著提升应用的响应速度和用户体验。 ... [详细]

蜡笔小新 2024-12-28 10:36:30
js
MySQL架构在大规模应用中的进化路径

本文探讨了随着并发需求的增长，MySQL数据库架构如何从简单的单一实例发展到复杂的分布式系统，以及每一步演进背后的原理和技术解决方案。 ... [详细]

蜡笔小新 2024-12-16 09:00:35
get
深入理解 SQL 视图、存储过程与事务

本文详细介绍了SQL中的视图、存储过程和事务的概念及应用。视图为用户提供了一种灵活的数据查询方式，存储过程则封装了复杂的SQL逻辑，而事务确保了数据库操作的完整性和一致性。 ... [详细]

蜡笔小新 2024-12-27 17:40:42
get
MyBatis 动态 SQL 详解与应用

本文深入探讨 MyBatis 中动态 SQL 的使用方法，包括 if/where、trim 自定义字符串截取规则、choose 分支选择、封装查询和修改条件的 where/set 标签、批量处理的 foreach 标签以及内置参数和 bind 的用法。 ... [详细]

蜡笔小新 2024-12-27 16:20:10
bit
深入解析Redis内存对象模型

本文详细介绍了Redis内存对象模型的关键知识点，包括内存统计、内存分配、数据存储细节及优化策略。通过实际案例和专业分析，帮助读者全面理解Redis内存管理机制。 ... [详细]

蜡笔小新 2024-12-23 14:50:23
cmd
golang常用库：配置文件解析库/管理工具viper使用

golang常用库：配置文件解析库管理工具-viper使用-一、viper简介viper配置管理解析库，是由大神SteveFrancia开发，他在google领导着golang的 ... [详细]

蜡笔小新 2024-12-28 13:47:52
command
Windows服务与数据库交互问题解析

本文探讨了在Windows 10（64位）环境下开发的Windows服务，旨在定期向本地MS SQL Server (v.11)插入记录。尽管服务已成功安装并运行，但记录并未正确插入。我们将详细分析可能的原因及解决方案。 ... [详细]

蜡笔小新 2024-12-28 10:30:14
range
SQL 触发器实现视图插入操作

本文介绍如何通过创建替代插入触发器，使对视图的插入操作能够正确更新相关的基本表。涉及的表包括：飞机（Aircraft）、员工（Employee）和认证（Certification）。 ... [详细]

蜡笔小新 2024-12-26 15:53:40
import
使用Python在SAE上开发新浪微博应用的初步探索

最近重新审视了新浪云平台（SAE）提供的服务，发现其已支持Python开发。本文将详细介绍如何利用Django框架构建一个简单的新浪微博应用，并分享开发过程中的关键步骤。 ... [详细]

蜡笔小新 2024-12-26 13:36:52
import
PHP 5.5.0rc1 发布：深入解析 Zend OPcache

2013年5月9日，PHP官方发布了PHP 5.5.0rc1和PHP 5.4.15正式版，这两个版本均支持64位环境。本文将详细介绍Zend OPcache的功能及其在Windows环境下的配置与测试。 ... [详细]

蜡笔小新 2024-12-26 12:56:20
import
网易严选Java开发面试：MySQL索引深度解析

本文详细记录了网易严选Java开发岗位的面试经验，特别针对MySQL索引相关的技术问题进行了深入探讨。通过本文，读者可以了解面试官常问的索引问题及其背后的原理。 ... [详细]

蜡笔小新 2024-12-24 19:50:16
import
企业级项目中 Webpack 配置优化指南

本文详细介绍了在企业级项目中如何优化 Webpack 配置，特别是在 React 移动端项目中的最佳实践。涵盖资源压缩、代码分割、构建范围缩小、缓存机制以及性能优化等多个方面。 ... [详细]

蜡笔小新 2024-12-24 14:41:48
timestamp
Netflix利用Druid实现高效实时数据分析

本文探讨了全球领先的在线娱乐公司Netflix如何通过采用Apache Druid，实现了高效的数据采集、处理和实时分析，从而显著提升了用户体验和业务决策的准确性。文章详细介绍了Netflix在系统架构、数据摄取、管理和查询方面的实践，并展示了Druid在大规模数据处理中的卓越性能。 ... [详细]

蜡笔小新 2024-12-23 11:10:01
timestamp
Spring Cloud学习指南：深入理解微服务架构

本文介绍了微服务架构的基本概念及其在Spring Cloud中的实现。讨论了微服务架构的主要优势，如简化开发和维护、快速启动、灵活的技术栈选择以及按需扩展的能力。同时，也探讨了微服务架构面临的挑战，包括较高的运维要求、分布式系统的复杂性、接口调整的成本等问题。最后，文章提出了实施微服务时应遵循的设计原则。 ... [详细]

蜡笔小新 2024-12-19 09:25:36

小编106

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章