当前位置: 开发笔记 > 编程语言 > 正文

SQLVSNoSQL如何选择数据库

作者：大女人小诺 | 来源：互联网 | 2023-08-21 14:42

在前一篇文章中我们主要的讨论了SQL与NoSQL数据库之间的主要的差别。接下来，我们将会利用上一篇中的知识来确定在特定的场景中如何确定比较好的选择。首先我们先来总结一下：SQL数据库：使用表存储相关

在前一篇文章中我们主要的讨论了SQL与NoSQL数据库之间的主要的差别。接下来，我们将会利用上一篇中的知识来确定在特定的场景中如何确定比较好的选择。

首先我们先来总结一下：

SQL数据库：

使用表存储相关的数据
在使用表之前需要先定义标的模式
鼓励使用规范化来减少数据的冗余
支持使用JOIN操作，使用一条SQL语句从多张表中取出相关的数据
需要满足数据完整性约束规则
使用事务来保证数据的一致性
能够大规模的使用
使用强大的SQL语言进行查询操作
提供大量的支持，专业技能和辅助工具

NoSQL数据库：

使用类JSON格式的文档来存储键值对信息
存储数据不需要特定的模式
使用非规范化的标准存储信息，以保证一个文档中包含一个条目的所有信息
不需要使用JOIN操作
允许数据不用通过验证就可以存储到任意的位置
保证更新的单个文档，而不是多个文档
提供卓越的性能和可扩展性
使用JSON数据对象进行查询
是一种新型的技术

SQL数据库适合那些需求确定和对数据完整性要去严格的项目。NoSQL数据库适用于那些对速度和可扩展性比较看重的那些不相关的，不确定和不断发展的需求。简单来说就是：

SQL是精确的。它最适合于具有精确标准的定义明确的项目。典型的使用场景是在线商店和银行系统。
NoSQL是多变的。它最适合于具有不确定需求的数据。典型的使用场景是社交网络，客户管理和网络分析系统。

很少有项目能够很好的适用于一种数据库。如果你对数据的需求比较小或是非标准化的数据任何一种数据库都是可以的。你比我更了解你的项目，我不建议你将SQL上的数据移植到NoSQL上反之亦然，除非它能够提供非常可观的收益。当然选择权在于你自己。在项目的一开始就要考虑好使用它们的利弊，这样才不会导致选择错误。

场景一：通讯记录

我们来重新的定义操作并基于SQL实现通讯录系统。我们初始简单的定义contact表拥有如下几个字段;

id
title
firstname
lastname
gender
telephone
email
address1
address2
address3
city
region
zipcode
country

问题一：很少有人只拥有一个手机号。或许我们可以再添加三个字段：固定电话，移动电话和工作电话，但是无论我们给一个联系人分配了多少个字段总会有人需要更多。我们需要创建一个单独的telephone表，这样就可以给一个联系人存多个号码了。这样也就规范化了我们的数据— 我们不需要一个没有电话的联系人：

contact_id
name (说明字段：固定，工作，私人等.)
number

问题二：对于联系人邮箱我们也会遇到上述问题，因此我们也需要创建一个email的表：

contact_id
name (说明字段：固定，工作，私人等.)
address

问题三：我们在填写联系人信息是我们并不希望填写他的地理位置，或者我们想记录他工作、生活、旅游的地方等。因此我们需要一个address表：

contact_id
name (text such as home, office, etc.)
address1
address2
address3
city
region
zipcode
country

我们原先设计的contact表就精简为：

id
title
firstname
lastname
gender

好了，我们已经设计了一个规范化的数据库，可以用来存储任何一个联系人的电话号码，邮箱地址和住址了。但是......

模式是固定不变的

我们并没有考虑到联系人的生日，公司或者职位。不管我们添加多少个字段，我们会得到更多的需求：备注，周年纪念日，关系，社交账号，喜欢巧克力的种类等等。预测每一个需求对于我们来说是非常困难的，因此我们需要创建一张表其中存储的形式是键值对来应对不断增加的需求。

数据是碎片化的

对于开发人员和系统管理员来说不断地检查数据库是比较麻烦的。程序的逻辑会变得更复杂效率更慢，因为使用一条select语句来JOIN多个表来取出一个联系人的全部信息不太实际。（当然这也是可以实现的，但是当一个联系人中国包含电话号码，邮件地址和住址信息时：如果一个人有3个电话号码，五个邮箱和两个住址，那么SQL查询会产生30个结果，也就是说说这样的效率会很慢。）

最后，全文搜索是非常困难的。如果一个人要查询一个字符型：favorite，我们需要依次查询上述的四张表判断是否是一个联系人的姓名，电话，邮件或者地址依据这些把结果进行排序。如果你使用过WordPress的搜索，你就会发现是都么的烦人了！

使用NoSQL来替代SQL

我们的联系人关注的是人这个实体。然而关于人的信息是不可预测的并且在不同的阶段的需求也会不一样。如果我们使用NoSQL数据库会比较方便，NoSQL将一个人的信息存储为一个文档并放入contacts的集合中：

{
  name: [
    "Billy", "Bob", "Jones"
  ],
  company: "Fake Goods Corp",
  jobtitle: "Vice President of Data Management",
  telephone: {
    home: "0123456789",
    mobile: "9876543210",
    work: "2244668800"
  },
  email: {
    personal: "bob@myhomeemail.net",
    work: "bob@myworkemail.com"
  },
  address: {
    home: {
      line1: "10 Non-Existent Street",
      city: "Nowhere",
      country: "Australia"
    }
  },
  birthdate: ISODate("1980-01-01T00:00:00.000Z"),
  twitter: '@bobsfakeaccount',
  note: "Don't trust this guy",
  weight: "200lb",
  photo: "52e86ad749e0b817d25c8892.jpg"
}

在这个示例中，我们没有存储这个人的性别和职衔，并且可以添加一些别的联系人没用的信息。在NoSQL中这样的存储是合法的，并且我们可以按照各人的意愿来添加和删除一个字段。

因为一个联系人存储在一个文档中，因此我们可以使用一个查询语句取出一个人的所有信息。对于全文搜索，在MongoDB中我们可以在contact的字段中定义一个索引：

db.contact.createIndex({ "$**": "text" });

然后我们就可以使用如下的语句进行全文搜索:

db.contact.find({
  $text: { $search: "something" }
});

场景二：社交网络

一个典型的社交网络使用的联系人的信息是相似，但是也会增加一些新的功能例如：社交网络，状态更新，私信和点赞。这些功能会根据用户的需求进行添加或者删除，预测用户的需求对开发人员来说是非常困难的。

另外：

大多数的更新都有一个原始的出发点：用户。但是，对于开发人员来说一次性的把所有的回馈都进行更新是不可能的。
不管用户怎么想，一个失败的版本并可能造成太大的经济损失。一个应用的接口设计和功能表现是比数据的完整性的优先级要高。

因此，NoSQL是一个不错的选择。数据库允许我们存储不同类型的数据以便于我们快速的开发出新的功能。例如，因为所有的数据状态的更新都可以在status的集合中的一个文档中进行：

{
  user_id: ObjectID("65f82bda42e7b8c76f5c1969"),
  update: [
    {
      date: ISODate("2015-09-18T10:02:47.620Z"),
      text: "feeling more positive today"
    },
    {
      date: ISODate("2015-09-17T13:14:20.789Z"),
      text: "spending far too much time here"
    }
    {
      date: ISODate("2015-09-17T12:33:02.132Z"),
      text: "considering my life choices"
    }
  ]
}

尽管对于这个文档来说数据会变得多一些，但是我们可以仅仅取出文档的一个子集，例如：最新的状态等。对于每一个用户来说历史记录也会很容易搜索的到。

场景三：仓库管理系统

现在，我们来分析一下一个仓库的管理系统。我们需要记录如下的信息：

货物入库的信息和存放的位置信息
货物在仓库中的移动，例如：为相同的货物分配相邻的位置存放
货物的摆放顺序以及配送货物之后的一系列问题。

数据需求：

保存货物的基本信息例如：尺寸、大小、颜色等，这些不相关的数据我们要能够用到任何的货物上。我们不可能去考虑一些货物个性化的信息例如：笔记本处理器的速度或者是一部手机电池的寿命。
我们要尽可能的避免错误的发生。我们不能让货物凭空消失或者将货物存放到已经存放货物的位置上去。
以更加简单的方式操作。我们记录将一件货物从一个位置移动到另一个位置或者从A移动到B的操作是相同的。

因此，我们需要考虑对数据的完整性和对于事务的支持。目前来说也就是SQL能够很好地满足我们的需求。

总结

我希望上述的案例能够对你有一定的帮助，但是每一个实际的项目都是不同的，对一无二的你需要自己去做决定选择一种适合的。（尽管，对于我们开发人员来说我们不太愿意去改变我们现有的选择，无论新的技术有多好！O(∩_∩)O）

建议：去尝试了解更多新的技术。这样我们就可以非常有理由的选择一种数据库进行开发。祝你好运！

推荐阅读

object
FastJSON解析与数据提取技巧

探讨如何高效使用FastJSON进行JSON数据解析，特别是从复杂嵌套结构中提取特定字段值的方法。 ... [详细]

蜡笔小新 2024-12-27 19:49:07
char
深入理解 SQL 视图、存储过程与事务

本文详细介绍了SQL中的视图、存储过程和事务的概念及应用。视图为用户提供了一种灵活的数据查询方式，存储过程则封装了复杂的SQL逻辑，而事务确保了数据库操作的完整性和一致性。 ... [详细]

蜡笔小新 2024-12-27 17:40:42
email
MyBatis 动态 SQL 详解与应用

本文深入探讨 MyBatis 中动态 SQL 的使用方法，包括 if/where、trim 自定义字符串截取规则、choose 分支选择、封装查询和修改条件的 where/set 标签、批量处理的 foreach 标签以及内置参数和 bind 的用法。 ... [详细]

蜡笔小新 2024-12-27 16:20:10
object
Akka BackoffSupervisor的深入解析与实践

本文详细介绍了Akka中的BackoffSupervisor机制，探讨其在处理持久化失败和Actor重启时的应用。通过具体示例，展示了如何配置和使用BackoffSupervisor以实现更细粒度的异常处理。 ... [详细]

蜡笔小新 2024-12-27 15:04:09
email
解析猫鼬 findOne 方法返回 null 的原因

本文探讨了在通过 API 端点调用时，使用猫鼬（Mongoose）的 findOne 方法总是返回 null 的问题，并提供了详细的解决方案和建议。 ... [详细]

蜡笔小新 2024-12-25 17:40:33
command
解决macOS下Electron Builder签名验证失败问题

在macOS环境下使用Electron Builder进行应用打包时遇到签名验证失败的问题，具体表现为签名后spctl命令检测到应用程序未通过公证（Notarization）。本文将详细探讨该问题的原因及解决方案。 ... [详细]

蜡笔小新 2024-12-28 13:08:30
object
编写有趣的VBScript恶作剧脚本

本文将介绍如何编写一些有趣的VBScript脚本，这些脚本可以在朋友之间进行无害的恶作剧。通过简单的代码示例，帮助您了解VBScript的基本语法和功能。 ... [详细]

蜡笔小新 2024-12-28 09:46:23
get
Transforming the Future of Virtual Worlds

Explore how Matterverse is redefining the metaverse experience, creating immersive and meaningful virtual environments that foster genuine connections and economic opportunities. ... [详细]

蜡笔小新 2024-12-28 09:44:49
object
Handling Null Object Encoding in OAuth 1.0a API Implementation

Explore a common issue encountered when implementing an OAuth 1.0a API, specifically the inability to encode null objects and how to resolve it. ... [详细]

蜡笔小新 2024-12-28 08:54:34
get
技术分享：从动态网站提取站点密钥的解决方案

本文探讨了如何从动态网站中提取站点密钥，特别是针对验证码（reCAPTCHA）的处理方法。通过结合Selenium和requests库，提供了详细的代码示例和优化建议。 ... [详细]

蜡笔小新 2024-12-28 04:11:47
ip
数据管理权威指南：《DAMA-DMBOK2 数据管理知识体系》

本书提供了全面的数据管理职能、术语和最佳实践方法的标准行业解释，构建了数据管理的总体框架，为数据管理的发展奠定了坚实的理论基础。适合各类数据管理专业人士和相关领域的从业人员。 ... [详细]

蜡笔小新 2024-12-27 18:29:55
filter
Yii2 GridView 实现列表页数据直接编辑的完整指南

本文详细介绍了如何使用 Yii2 的 GridView 组件在列表页面实现数据的直接编辑功能。通过具体的代码示例和步骤，帮助开发者快速掌握这一实用技巧。 ... [详细]

蜡笔小新 2024-12-27 16:27:52
default
使用 Azure Service Principal 和 Microsoft Graph API 获取 AAD 用户列表

本文介绍了一段通用代码示例，该代码不仅能够操作 Azure Active Directory (AAD)，还可以通过 Azure Service Principal 的授权访问和管理 Azure 订阅资源。Azure 的架构可以分为两个层级：AAD 和 Subscription。 ... [详细]

蜡笔小新 2024-12-27 16:07:12
char
分页插件3指定到某一页

前言--页数多了以后需要指定到某一页（只做了功能，样式没有细调）html ... [详细]

蜡笔小新 2024-12-27 15:19:01
object
解析JSON格式文本并处理数据

本文介绍如何使用阿里云的fastjson库解析包含时间戳、IP地址和参数等信息的JSON格式文本，并进行数据处理和保存。 ... [详细]

蜡笔小新 2024-12-26 16:06:09

大女人小诺

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章