当前位置: 开发笔记 > 编程语言 > 正文

MySQL性能扩展的架构优化方案(三)

作者：手机用户2502918445 | 来源：互联网 | 2023-10-12 15:00

这是学习笔记的第 1816篇文章在前几天分享过一个小系列的文章。在后续也做了跟进和补充，从最初的方案到最后的落地，今天总算是做了一个初步的了结。上次聊到关于一个密集型写入的MySQ

这是学习笔记的第 1816篇文章

在前几天分享过一个小系列的文章。

在后续也做了跟进和补充，从最初的方案到最后的落地，今天总算是做了一个初步的了结。

上次聊到关于一个密集型写入的MySQL业务，通过读写分离完成了写入和统计的负载均衡，初步解决了写入的问题，但是统计的问题就开始日趋严重。

严重到整个从库的负载开始难以满足业务的需求，到最后无法满足。

MySQL性能扩展的架构优化方案(三)

这部分的主要瓶颈在IO层面。主要是因为大量的统计语句导致。

在和业务同学讨论的过程中，其实使用Redis方向是一个相对合适的技术方向，对于统计的支持力度还是不错的，但是限于存储成本和程序改造的工作量，业务更倾向于暂时按照已有的方案，通过对比infobright的统计优势和MySQL的协议兼容性，从而得出在目前的情况下选择这种方案是一个比较快捷高效的方案。

在具体落地的过程中，发现有一大堆的事情需要提前搞定。

比如第一个头疼的问题就是全量的同步，第一次同步肯定是全量的，这么多的数据怎么同步到infobright里面。

第二个问题随之而来，也是更为关键的，那就是同步策略是怎么设定的，是否可以支持的更加灵活。

第三个问题是基于现有的增量同步方案，需要在时间字段上添加索引。对于线上的操作而言又是一个巨大的挑战。

从目前的业务需求来说，最多能够允许一个小时的统计延迟，如果后期要做大量的运营活动，需要更精确的数据支持，要得到半个小时的统计数据，按照现有的方案是否能够支持。

这两个主要的问题，任何一个解决不了，数据流转能够落地都是难题，这个问题留给我的时间只有一天。所以我准备把前期的准备和测试做得扎实一些，后期接入的时候就会顺畅得多。

部分脚本实现如下：

echo  $1 $2
#tab_name=$1
starttime=$1
endtime=$2
/usr/local/mysql/bin/mysql -udba_admin -pDxxxx -h127.0.0.1 -P4306
 -Ne  "select table_name from information_schema.tables where table_schema='testdata' 
and table_name like 'receipt_%' order by table_rows ;" >/tmp/tablst

function data_sync_to_infobright
{
#rm  /tmp/a.csv
echo "export data...start "`date`
/usr/local/mysql/bin/mysql -udba_admin -pDxxxx -h127.0.0.1 -P4306 <select *from testdata.${tab_name} where create_time between '$2' and '$3'  into outfile '/data/dump_data/${tab_name}.csv' FIELDS TERMINATED BY ' ' ENCLOSED BY '\"'; 
EOF

echo "export data...done "`date`

echo "load data...start "`date`
/usr/local/mysql/bin/mysql -umsg_data_sync -pxxxx -h10.x.2.0 -P5029 <CREATE TABLE if not exists testdata.${tab_name} (
id int(11)  NOT NULL  COMMENT '自增主键',
userid int(11)  NOT NULL DEFAULT '0' COMMENT '用户ID',
action int(11)  NOT NULL DEFAULT '0' COMMENT '动作',
readtimes int(11)  NOT NULL DEFAULT '0' COMMENT '阅读次数',
create_time datetime NOT NULL  COMMENT '创建时间'
)  COMMENT='广播回执接收明细';

load data local infile '/data/dump_data/${tab_name}.csv' into table testdata.${tab_name} FIELDS TERMINATED BY ' ' ENCLOSED BY '"'; 

EOF

echo "load data...done "`date`
rm -f /data/dump_data/${tab_name}.csv
}

while read line
do
  echo $tab_name  "$starttime"  "$endtime"
  tab_name=`echo $line|awk '{print $1}'` 
  data_sync_to_infobright $tab_name "$starttime" "$endtime"
done echo $endtime  >/tmp/end_time

脚本的输入参数有两个，一个是起始时间，一个是截止时间。第一次全量同步的时候，可以把起始时间给的很早，这样截止时间是固定的，对于整个脚本的结构来说就不需要做大的变化了。另外全量同步的时候一定要确保主从延迟已经最低或者暂时停掉查询业务，使得数据全量抽取更加顺利。

考虑到每天落盘的数据量大概在10G左右，日志量在30G左右，所以考虑先使用客户端导入infobright的方式来操作。

从实践来看，涉及的表有600多个，我先导出了一个列表，按照数据量来排序，这样小表就可以快速导入，大表放在最后，整个数据量有150G左右，通过网络传输导入infobright，从导出到导入完成，这个过程大概需要1个小时。

而导入数据到infobright之后的性能提升也是极为明显的。原来的一组查询持续时间在半个小时，现在在70秒钟即可完成。对于业务的体验来说大大提高。完成了第一次同步之后，后续的同步都可以根据实际的情况来灵活控制。所以数据增量同步暂时是手动挡控制。

从整个数据架构分离之后的效果来看，从库的压力大大降低，而效率也大大提高。

MySQL性能扩展的架构优化方案(三)

推荐阅读

ip
Dockerfile 编写与 Docker 网络配置详解

本文详细介绍了 Dockerfile 的编写方法及其在网络配置中的应用，涵盖基础指令、镜像构建与发布流程，并深入探讨了 Docker 的默认网络、容器互联及自定义网络的实现。 ... [详细]

蜡笔小新 2024-12-27 17:31:41
php
PHP 编程疑难解析与知识点汇总

本文详细解答了 PHP 编程中的常见问题，并提供了丰富的代码示例和解决方案，帮助开发者更好地理解和应用 PHP 知识。 ... [详细]

蜡笔小新 2024-12-28 12:22:34
perl
解决 IIS 中 PHP 页面无法访问的问题

本文介绍如何解决在 IIS 环境下 PHP 页面无法找到的问题。主要步骤包括配置 Internet 信息服务管理器中的 ISAPI 扩展和 Active Server Pages 设置，确保 PHP 脚本能够正常运行。 ... [详细]

蜡笔小新 2024-12-28 11:54:54
text
编写有趣的VBScript恶作剧脚本

本文将介绍如何编写一些有趣的VBScript脚本，这些脚本可以在朋友之间进行无害的恶作剧。通过简单的代码示例，帮助您了解VBScript的基本语法和功能。 ... [详细]

蜡笔小新 2024-12-28 09:46:23
tree
新浪笔试题

1:有如下一段程序：packagea.b.c;publicclassTest{privatestaticinti0;publicintgetNext(){return ... [详细]

蜡笔小新 2024-12-27 19:32:17
php
深入理解 SQL 视图、存储过程与事务

本文详细介绍了SQL中的视图、存储过程和事务的概念及应用。视图为用户提供了一种灵活的数据查询方式，存储过程则封装了复杂的SQL逻辑，而事务确保了数据库操作的完整性和一致性。 ... [详细]

蜡笔小新 2024-12-27 17:40:42
php
解决PHP与MySQL连接时出现500错误的方法

本文详细探讨了当使用PHP连接MySQL数据库时遇到500内部服务器错误的多种解决方案，提供了详尽的操作步骤和专业建议。无论是初学者还是有经验的开发者，都能从中受益。 ... [详细]

蜡笔小新 2024-12-27 15:48:52
php
深入解析Netty中的Future机制

本文详细探讨了Netty中Future及其子类的设计与实现，包括其在并发编程中的作用和具体应用场景。我们将介绍Future的继承体系、关键方法的实现细节，并讨论如何通过监听器和回调机制来处理异步任务的结果。 ... [详细]

蜡笔小新 2024-12-26 20:12:47
ip
macOS系统及其关键功能解析

本文详细介绍了macOS系统的核心组件，包括如何管理其安全特性——系统完整性保护（SIP），并探讨了不同版本的更新亮点。对于使用macOS系统的用户来说，了解这些信息有助于更好地管理和优化系统性能。 ... [详细]

蜡笔小新 2024-12-26 18:05:04
php
周期性出现的时间戳字段异常问题

探讨一个老旧 PHP MySQL 系统中，时间戳字段不定期出现异常值的问题及其可能原因。 ... [详细]

蜡笔小新 2024-12-28 11:46:54
ip
Python配置文件读写指南

本文详细介绍如何使用Python进行配置文件的读写操作，涵盖常见的配置文件格式（如INI、JSON、TOML和YAML），并提供具体的代码示例。 ... [详细]

蜡笔小新 2024-12-28 08:39:55
ip
深入理解设计模式与七大原则

本文详细探讨了Java中的24种设计模式及其应用，并介绍了七大面向对象设计原则。通过创建型、结构型和行为型模式的分类，帮助开发者更好地理解和应用这些模式，提升代码质量和可维护性。 ... [详细]

蜡笔小新 2024-12-27 19:10:10
ip
数据管理权威指南：《DAMA-DMBOK2 数据管理知识体系》

本书提供了全面的数据管理职能、术语和最佳实践方法的标准行业解释，构建了数据管理的总体框架，为数据管理的发展奠定了坚实的理论基础。适合各类数据管理专业人士和相关领域的从业人员。 ... [详细]

蜡笔小新 2024-12-27 18:29:55
text
深入解析ExpandableComposite.addExpansionListener()方法及其应用

本文详细介绍了Java中org.eclipse.ui.forms.widgets.ExpandableComposite类的addExpansionListener()方法，并提供了多个实际代码示例，帮助开发者更好地理解和使用该方法。这些示例来源于多个知名开源项目，具有很高的参考价值。 ... [详细]

蜡笔小新 2024-12-27 16:11:49
ip
Linux 网卡绑定的七种工作模式详解

本文深入探讨了Linux系统中网卡绑定（bonding）的七种工作模式。网卡绑定技术通过将多个物理网卡组合成一个逻辑网卡，实现网络冗余、带宽聚合和负载均衡，在生产环境中广泛应用。文章详细介绍了每种模式的特点、适用场景及配置方法。 ... [详细]

蜡笔小新 2024-12-27 10:18:13

手机用户2502918445

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章