当前位置: 开发笔记 > 编程语言 > 正文

SQL：数据世界的通用语

作者：孙衍龙 | 来源：互联网 | 2023-10-12 22:29

目录摘要SQL的现在NoSQL,NotOnlySQL要分布式，也要SQL总结引用摘要毫不夸张的说，关系数据库是企业软件系统的核心，企业形形色色信息行为的背后，都有关系数据库的支撑。

摘要

毫不夸张的说，关系数据库是企业软件系统的核心，企业形形色色信息行为的背后，都有
关系数据库的支撑。

SQL 作为关系型数据库最重要的功能之一，有着悠久的历史。随着数字化大潮的到来，
关系数据库(SQL) 又面临着新的机遇和挑战。对于 IT 行业的从业人员，了解关系数据库
和 SQL 新的发展，对于解决企业 IT 的核心问题十分必要。

SQL 的现在

Not Only SQL

NoSQL 的兴起是对于传统的关系型数据库（SQL) 的最近的一次颠覆尝试。有几个原因导
致了 NoSQL 的兴起：

相对于传统的关系型数据库，NoSQL 更容易为企业提供更好数据库可扩展性，是的企业能够应对日益增长的庞大的数据量。
相比于传统的关系型数据库，很多优秀的 NoSQL 以开源的形式存在。
很多操作在关系型数据库中没有支持，比如 JSON 数据格式全文搜索。
没有严格的 Schema 限制，因此在很多情况下比较灵活。

然而很快，NoSQL 便暴露除了很多不足：

没有标准的数据查询语言，不同的 NoSQL 提供了不同且不完备的 SQL 替代品；随着应用程序的演进，应用程序所累积的数据会越来越多，数据之间的关系会变得越来越复杂，在这种情况下由于 NoSQL 所提供的简单的数据查询语句不成熟且不完备，尤其是考虑到 NoSQL 没有严格的 Schema 限制的情况下，导致大量的应用程序和数据库之间的脆弱的胶水代码。
NoSQL 中很多数据处理和聚合实际上都是开发人员在应用程序中手写，相比于 SQL 广泛的标准适用性和成熟的优化方案，NoSQL 在处理数据之间的多对一和多对多关系以及数据之间的关联时，性能差距非常明显。

人们很快发现，原来 NoSQL 的真正的意思是 Not Only SQL。

要水平扩展，也要 SQL

2017 年 Google 发布论文 Spanner:Becoming a SQL System1 在这篇论文里，有如下描
述：

尽管这些 NoSQL 系统提供了一些优势，但也确实了很多传统的关系型数据库所拥有的、
程序员所依赖的功能。其中最关键的是缺失了健壮的数据库查询语句，其后果是开发
人员需要在应用程序中手写复杂的数据处理和聚合的逻辑。因此，Google 决定将
Spanner 转变为提供全部 SQL 特性的系统。查询的执行跟 Spanner 的其他架构特性
紧密集成。

论文的后续部分还总结了 Spanner 从 NoSQL 到 SQL 的转变原因：

尽管 NoSQL 功能使得用户可以很简易的加载 Spanner，在一些简单的应用场景中也显
得十分有用；
但 SQL 在复杂数据读取和数据运算方面提供了显著的价值。

无独有偶，2017年8月，Kafka 发布了流式 SQL 引擎 KSQL ，为 Kafka 在处理数据时，
提供完整的 SQL 支持。不仅仅 Kafka，RabbitMQ、Spark、Flink 等纷纷开始支持 SQL。

这种趋势正是目前正在进行当中的 NewSQL2 大潮。其目标是提供 NoSQL 一样的水
平扩展能力的和同等读写性能的情况下，支持保证原子性、一致性、隔离性和持久性
(ACID) 的事物。也就是说在可扩展性方面匹敌 NoSQL，但同时保留关系型数据库模型。
就目前来看 NewSQL 大体上可以分为三类：

全新的设计的 NewSQL 系统，包括 Google Spanner、CockroachDB 和 ClustrixDB 等。
基于分片中间件的传统数据库集群，比如 Oracle 就提供了 MySQL 的 proxy。
云化的数据库服务 (DBaaS)，其中最成功的莫过于 AWS Aurora

《SQL：数据世界的通用语》

尽管新的技术不断涌现，但 SQL 这一古老的技术示出 强大的生命力 ；作为一个广泛
使用的标准技术，在大数据随处可见的今天， 宛然成为数据世界的通用语 。这背后
的原因是什么呢？

首先 SQL 一个成熟的标准。SQL 诞生于1974年，并在1986年正式成为国际标准。随后尽管数据库系统如过江之鲫，但大体上这些数据库还是会遵守这个标准。
SQL 是一个非常优秀的抽象模型；对于使用者来讲，SQL 简单易用，不用关心 SQL 背后的诸如存储、同步及先写日志等细节；对于数据库的实现着来讲，SQL 对于如何实现查询完全没有约束，使得查询优化成为可能，且查询优化比绝大多数普通程序员基于 C 和 C++ 手写的形同逻辑的实现性能更胜一筹。
基于 SQL 的极致性能优化。基于生产力的考量，现代的开发大多基于高阶语言，这些高阶语言大多基于通用的抽象模型，比如 SQL 基于关系型代数3 ，然而站在 CPU 执行的角度来看，所有的这些通用抽象模型无一例外都是以增加额外的开销，也就是牺牲性能为代价；但最近运行时 SQL 编译技术的兴起使得牺牲性能最小化，开发人员基于 SQL 快速开发业务，SQL 在运行时由 LLVM 编译成机器码4 已获得最佳的性能。也就是说使用 SQL 兼顾了生产力和性能。

总结

SQL 这一古老的技术，实际上是一个非常优秀的抽象模型，对使用者来讲简单易用；对数
据库开发者来讲可以灵活的优化；因此展现出十分强大的生命力，随着 NewSQL 的兴起，
在数据日益重要的今天，逐渐成为数据世界的通用语。

引用

1 https://static.googleusercontent.com/media/research.google.com/en//pubs/archive/46103.pdf

2 https://15721.courses.cs.cmu.edu/spring2018/papers/01-intro/pavlo-newsql-sigmodrec2016.pdf

3 https://en.wikipedia.org/wiki/Relational_algebra

4 https://15721.courses.cs.cmu.edu/spring2018/papers/03-compilation/p539-neumann.pdf

推荐阅读

input
Hadoop入门与核心组件详解

本文详细介绍了Hadoop的基础知识及其核心组件，包括HDFS、MapReduce和YARN。通过本文，读者可以全面了解Hadoop的生态系统及应用场景。 ... [详细]

蜡笔小新 2024-12-26 13:12:48
input
对MariaDB未来发展的思考与担忧

本文探讨了MariaDB在当前数据库市场中的地位和挑战，分析其可能面临的困境，并提出了对未来发展的几点看法。 ... [详细]

蜡笔小新 2024-12-25 18:20:32
jar
掌握Java EE的全面指南

探讨如何真正掌握Java EE，包括所需技能、工具和实践经验。资深软件教学总监李刚分享了对毕业生简历中常见问题的看法，并提供了详尽的标准。 ... [详细]

蜡笔小新 2024-12-25 13:38:29
buffer
新浪笔试题

1:有如下一段程序：packagea.b.c;publicclassTest{privatestaticinti0;publicintgetNext(){return ... [详细]

蜡笔小新 2024-12-27 19:32:17
buffer
深入理解 SQL 视图、存储过程与事务

本文详细介绍了SQL中的视图、存储过程和事务的概念及应用。视图为用户提供了一种灵活的数据查询方式，存储过程则封装了复杂的SQL逻辑，而事务确保了数据库操作的完整性和一致性。 ... [详细]

蜡笔小新 2024-12-27 17:40:42
buffer
MySQL缓存机制深度解析

本文详细探讨了MySQL的缓存机制，包括主从复制、读写分离以及缓存同步策略等内容。通过理解这些概念和技术，读者可以更好地优化数据库性能。 ... [详细]

蜡笔小新 2024-12-26 15:15:06
ip
网络运维工程师的前景与薪酬分析

网络运维工程师负责确保企业IT基础设施的稳定运行，保障业务连续性和数据安全。他们需要具备多种技能，包括搭建和维护网络环境、监控系统性能、处理突发事件等。本文将探讨网络运维工程师的职业前景及其平均薪酬水平。 ... [详细]

蜡笔小新 2024-12-26 14:35:04
ip
技术变现之道：从日常工作中挖掘潜力

本文探讨了如何在日常工作中通过优化效率和深入研究核心技术，将技术和知识转化为实际收益。文章结合个人经验，分享了提高工作效率、掌握高价值技能以及选择合适工作环境的方法，帮助读者更好地实现技术变现。 ... [详细]

蜡笔小新 2024-12-24 15:21:23
search
Java时代的淘宝技术演进

本文探讨了2012年4月期间，淘宝在技术架构上的关键数据和发展历程。涵盖了从早期PHP到Java的转型，以及在分布式计算、存储和网络流量管理方面的创新。 ... [详细]

蜡笔小新 2024-12-24 12:12:13
ip
深入解析网络存储技术

本文详细介绍了网络存储技术的基本概念、分类及应用场景。通过分析直连式存储（DAS）、网络附加存储（NAS）和存储区域网络（SAN）的特点，帮助读者理解不同存储方式的优势与局限性。 ... [详细]

蜡笔小新 2024-12-24 10:38:34
ip
Netflix利用Druid实现高效实时数据分析

本文探讨了全球领先的在线娱乐公司Netflix如何通过采用Apache Druid，实现了高效的数据采集、处理和实时分析，从而显著提升了用户体验和业务决策的准确性。文章详细介绍了Netflix在系统架构、数据摄取、管理和查询方面的实践，并展示了Druid在大规模数据处理中的卓越性能。 ... [详细]

蜡笔小新 2024-12-23 11:10:01
schema
优化SQL Server批量数据插入存储过程的实现

本文介绍了一种改进的SQL Server存储过程，用于生成批量插入语句。该方法不仅提高了性能，还支持单行和多行模式，适用于SQL Server 2005及以上版本。 ... [详细]

蜡笔小新 2024-12-21 06:43:52
input
备战BAT面试：掌握这些MySQL核心问题

本文深入探讨了MySQL中常见的面试问题，包括事务隔离级别、存储引擎选择、索引结构及优化等关键知识点。通过详细解析，帮助读者在面对BAT等大厂面试时更加从容。 ... [详细]

蜡笔小新 2024-12-20 18:58:01
input
创邻科技成功举办Graph+X生态合作伙伴大会，30余家行业领军企业共聚杭州

9月22日，创邻科技在杭州举办“Graph+X”生态合作伙伴大会，汇聚了超过30家行业头部企业的50多位企业家和技术领袖，共同探讨图技术的前沿应用与发展前景。 ... [详细]

蜡笔小新 2024-12-20 16:56:32
schema
解决MySQL InnoDB表中索引键长度限制问题

尝试执行数据库模式加载时遇到错误'Mysql2::Error: 指定的键太长；最大键长度为767字节'。本文将探讨这一问题的成因及解决方案。 ... [详细]

蜡笔小新 2024-12-20 13:14:00

孙衍龙

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章