当前位置: 开发笔记 > 编程语言 > 正文

一文总结高并发大数据量下MySQL开发规范【军规】

作者：钓鱼翁玩围脖 | 来源：互联网 | 2023-10-12 18:29

在互联网公司中，MySQL是使用最多的数据库，那么在并发量大、数据量大的互联网业务中，如何高效的使用MySQL才能保证服务的稳定呢？根据本人多年运维管理经验的总结，梳理了一些核心的

在互联网公司中，MySQL是使用最多的数据库，那么在并发量大、数据量大的互联网业务中，如何高效的使用MySQL才能保证服务的稳定呢？根据本人多年运维管理经验的总结，梳理了一些核心的开发规范，希望能给大家带来一些帮助。

一、基础规范

数据库字符集默认使用utf8mb4，兼容utf8，并支持存储emoji表情等四字节内容
禁止在线上生产环境做数据库压力测试
禁止从测试、开发环境、本机直连线上生产数据库
禁止在数据库中存储明文密码
禁止在数据库中存储图片、文件等大数据
禁止将业务日志实时保存到数据库，建议保存到日志文件，对于统计后的结果再存放到mysql中
禁止线上核心业务使用mysql存储过程、视图、触发器、Event、InnoDB外键约束等，这些容易将业务逻辑和db耦合在一起，而且在MySQL的这些特性中存在严重BUG
业务部门的推广活动，请提前通知dba进行服务和访问评估。

二、库表设计

库名、表名、字段名必须使小写字母，并采用下划线分割；对相关功能的表应当使用相同前缀，如job_xxx，前缀通常为库名或依赖主实体对象,数据库名称约定：db_xxx
数据库表默认存储引擎为InnoDB，所有环境禁止使用MyISAM、Memory等其他存储引擎
所有的表及字段都必须有备注，详细说明表及字段的含义
涉及货币金额或其他精度敏感的数据必须使用定点数DECIMAL替代FLOAT和DOUBLE
库名、表名、字段名禁止使用MySQL保留字，如date、like、desc、return等
控制表字段数，单表不超过50个纯INT/20个VARCHAR(10)字段等同存储体积的字段数，上限控制在20~50
字段长度只分配真正需要的空间

问题：使用VARCHAR(5) 和VARCHAR(200) 存储’hello’的磁盘空间开销是一样的,使用更短的列有什么优势吗？

更大的定义列会消耗更多的内存，因为MySQL通常会分配固定大小的内存块来保存内部值,尤其是使用内存临时表进行排序或操作时会特别糟糕。

三、索引设计

基本规则：索引不是越多越好，能不添加的索引尽量不要添加，过多的索引会严重降低数据插入和更新的效率，并带来更多的读写冲突和死锁！

索引名称必须使用小写，普通索引按照“idx_字段名_字段名[_字段名]”进行命名，唯一索引按照“uniq_字段名_字段名[_字段名]”进行命名”
表必须有主键，推荐使用独立于业务的AUTO_INCREMENT列或全局ID生成器做主键，禁止使用多字段做联合主键
不使用UUID/MD5/HASH等函数生成的无规则值做主键，效率极差
索引数量控制

单张表中索引数量不超过5个
单个索引中的字段数不超过5个
对字符串使用前缀索引，前缀索引长度不超过10个字符

索引字段的顺序需要考虑每个字段去重之后的数量，区分度最大的【个数最多的】放在前面。
合理创建联合索引（避免冗余），符合最左前缀原则：(a,b,c) 相当于 (a) 、(a,b) 、(a,b,c)
可能需要添加索引的字段：

ORDER BY，GROUP BY，DISTINCT的字段需要添加在索引的后面
UPDATE、DELETE语句需要根据WHERE条件添加索引
对于JOIN操作，需要在JOIN字段上建立索引

线上慎用FORCE INDEX，使用前需要和DBA沟通，并得到DBA的测试允许
线上OLTP系统中禁止使用外键，高并发时极易引起死锁等问题
索引使用禁忌

不使用%前导的查询，如like “%ab”
不使用负向查询，如not in/not like/<>
不在低区分度的列上建立索引，例如“性别”
不在索引列进行数学运算和函数运算

示例：假设在表tab中id建立了索引

Select col_A,col_B from tab where id + 1 > 10001 不会使用索引
Select col_A,col_B from tab where id > 10001 – 1 会使用索引

四、SQL优化

线上尽量少使用大SQL，可能一条大SQL就把整个数据库堵死，将复杂SQL拆分为多条简单SQL，化繁为简

一条SQL只能在一个CPU上运算，如果SQL比较复杂执行效率会非常低【8.0之后开始支持单SQL多CPU核执行，但是效果有限】
简单SQL缓存命中率更高
减少锁表时间
充分利用多核CPU，提高并发效率

减少MySQL端的数学运算和逻辑判断，避免SQL语句出现md5()、order by rand()等
尽量少用SELECT * ,只取需要的数据列, 避免无谓的IO、CPU和网络开销
WHERE条件中，同一字段改写OR为IN()，IN包含的值不应过多，默认不超过200个，IN里禁止使用子查询
过滤表记录合并且不去重的情况，改写UNION为UNION ALL
减少使用拼接SQL,使用预编译语句，降低SQL注入概率
WHERE条件中的非等值条件（IN、BETWEEN、<、<=、>、>=）会导致使用不了联合索引的后续字段，注意避免
WHERE条件比较，字段类型和传入值必须保证类型一致，避免隐式转换

示例：

字段： code varchar(50) NOT NULL COMENT ‘编码’ #code上建立了索引

SELECT id,name,addr from tab_name where code=10001; 不会使用索引

SELECT id,name,addr from tab_name where code='10001'; 会使用索引

Limit分页优化

传统分页：

Select * from table limit 10000,10；

LIMIT原理：

Limit 10000,10 偏移量越大则越慢

推荐分页：

分页方式一：

Select * from table WHERE id>=23423 limit 11; #10+1 (每页10条)

Select * from table WHERE id>=23434 limit 11;

分页方式二：

Select * from table WHERE id >= ( select id from table limit 10000,1 ) limit 10;

分页方式三：

Select * from table INNER JOIN (SELECT id from table limit 10000,10) USING(id)

分页方式四：

程序取ID: Select id from table limit 10000,10;
Select * from table WHERE ID in(123,456…);

最后说明：

上述规范是多年MySQL数据库使用的经验总结，希望能给大家带来一些启发和帮助！

如果你还想看更多优质原创文章，欢迎关注我的公众号「数据库架构师」，提升数据库技能。

推荐阅读

php
MySQL索引详解与优化

本文深入探讨了MySQL中的索引机制，包括索引的基本概念、优势与劣势、分类及其实现原理，并详细介绍了索引的使用场景和优化技巧。通过具体示例，帮助读者更好地理解和应用索引以提升数据库性能。 ... [详细]

蜡笔小新 2024-12-25 19:52:47
php
优化ListView性能

本文深入探讨了如何通过多种技术手段优化ListView的性能，包括视图复用、ViewHolder模式、分批加载数据、图片优化及内存管理等。这些方法能够显著提升应用的响应速度和用户体验。 ... [详细]

蜡笔小新 2024-12-28 10:36:30
php
数据库内核开发入门 | 搭建研发环境的初步指南

本课程将带你从零开始，逐步掌握数据库内核开发的基础知识和实践技能，重点介绍如何搭建OceanBase的开发环境。 ... [详细]

蜡笔小新 2024-12-27 16:38:48
web
深入解析 Apache Shiro 安全框架架构

本文详细介绍了 Apache Shiro，一个强大且灵活的开源安全框架。Shiro 专注于简化身份验证、授权、会话管理和加密等复杂的安全操作，使开发者能够更轻松地保护应用程序。其核心目标是提供易于使用和理解的API，同时确保高度的安全性和灵活性。 ... [详细]

蜡笔小新 2024-12-25 16:03:57
import
Python 的 10 个开发技巧！太实用了

1.如何在运行状态查看源代码？查看函数的源代码，我们通常会使用IDE来完成。比如在PyCharm中，你可以Ctrl+鼠标点击进入函数的源代码。那如果没有IDE呢？当我们想使用一个函 ... [详细]

蜡笔小新 2024-12-27 18:36:54
select
构建基于BERT的中文NL2SQL模型：一个简明的基准

本文探讨了将自然语言转换为SQL语句（NL2SQL）的任务，这是人工智能领域中一项非常实用的研究方向。文章介绍了笔者在公司举办的首届中文NL2SQL挑战赛中的实践，该比赛提供了金融和通用领域的表格数据，并标注了对应的自然语言与SQL语句对，旨在训练准确的NL2SQL模型。 ... [详细]

蜡笔小新 2024-12-27 17:36:19
grid
Yii2 GridView 实现列表页数据直接编辑的完整指南

本文详细介绍了如何使用 Yii2 的 GridView 组件在列表页面实现数据的直接编辑功能。通过具体的代码示例和步骤，帮助开发者快速掌握这一实用技巧。 ... [详细]

蜡笔小新 2024-12-27 16:27:52
select
MyBatis 动态 SQL 详解与应用

本文深入探讨 MyBatis 中动态 SQL 的使用方法，包括 if/where、trim 自定义字符串截取规则、choose 分支选择、封装查询和修改条件的 where/set 标签、批量处理的 foreach 标签以及内置参数和 bind 的用法。 ... [详细]

蜡笔小新 2024-12-27 16:20:10
default
Akka BackoffSupervisor的深入解析与实践

本文详细介绍了Akka中的BackoffSupervisor机制，探讨其在处理持久化失败和Actor重启时的应用。通过具体示例，展示了如何配置和使用BackoffSupervisor以实现更细粒度的异常处理。 ... [详细]

蜡笔小新 2024-12-27 15:04:09
object
2023年京东Android面试真题解析与经验分享

本文由一位拥有6年Android开发经验的工程师撰写，详细解析了京东面试中常见的技术问题。涵盖引用传递、Handler机制、ListView优化、多线程控制及ANR处理等核心知识点。 ... [详细]

蜡笔小新 2024-12-26 17:45:48
web
从零开始构建完整手机站：Vue CLI 3 实战指南（第一部分）

本系列教程将引导您使用 Vue CLI 3 构建一个功能齐全的移动应用。我们将深入探讨项目中涉及的每一个知识点，并确保这些内容与实际工作中的需求紧密结合。 ... [详细]

蜡笔小新 2024-12-26 13:30:37
replace
深入解析 org.apache.xmlbeans.SchemaType.getBaseEnumType() 方法及其应用

本文详细介绍了 Java 中 org.apache.xmlbeans.SchemaType 类的 getBaseEnumType() 方法，提供了多个代码示例，并解释了其在不同场景下的使用方法。 ... [详细]

蜡笔小新 2024-12-26 11:46:55
import
Python文本处理与可视化：分词及词云生成

本文介绍如何使用Python进行文本处理，包括分词和生成词云图。通过整合多个文本文件、去除停用词并生成词云图，展示文本数据的可视化分析方法。 ... [详细]

蜡笔小新 2024-12-26 08:37:18
default
Scala 实现 UTF-8 编码属性文件读取与克隆

本文介绍如何使用 Scala 以 UTF-8 编码方式读取属性文件，并实现属性文件的克隆功能。通过这种方式，可以确保配置文件在多线程环境下的一致性和高效性。 ... [详细]

蜡笔小新 2024-12-26 08:25:19
python
PHP Eloquent ORM 中的关联查询扩展

本文探讨了如何在 PHP 的 Eloquent ORM 中实现数据表之间的关联查询，并通过具体示例详细解释了如何将关联数据嵌入到查询结果中。这不仅提高了数据查询的效率，还简化了代码逻辑。 ... [详细]

蜡笔小新 2024-12-25 18:14:14

钓鱼翁玩围脖

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章