热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

数据库高可用实战:化繁为简搭建一套轻量级架构

作者介绍吴虞,SQL专家云团队成员,擅长解决SQLSERVER数据库性能、高可用、负载均衡等问题。说到高可用,看官们会想到很多方案

作者介绍

吴虞,SQL专家云团队成员,擅长解决SQL SERVER数据库性能、高可用、负载均衡等问题。

 

说到高可用,看官们会想到很多方案,也许是自亲身经历过系统从单机变成高可用的痛苦过程,也许有的看官只是在自己的虚机上搭建过测试的玩具。本文以我自己的真实经历给大家讲述,不管怎样,实战和测试玩耍还是很大区别的,可能你觉得搭建一套高可用方案很简单,配置下就OK了,但在真正的复杂系统中一切就没那么轻松了! 

 

本文主要讲述升级并搭建AlwaysOn高可用的过程,以实施的思路为主。文中并没有搭建集群的步骤,搭建步骤请自行学习。(个人认为会搭建可用组并不是关键,而一系列的调研细节才是项目成功的关键)

 

一、背景

 

客户的现有方案是一套使用发布订阅构建的读写分离方案,总体来说系统构建的很不错。也是在SQL2012之前很常见的一套架构。

 

架构图如下:

 \

  \

 

客户的需求:SQL Server 2008 R2升级到SQL Server 2014使用AlwaysOn替换现有发布订阅架构。实现本地高可用、读写分离,异地灾备等,并应用部分2014的新功能,如内存优化表等提升系统性能和并发能力等。

 

二、前期调研

 

1数据收集

 

前期对系统的了解很重要!那么怎样对系统有一个初步直观并且详细的了解呢?用脚本收集?这时就体现出工具的专业和协作价值。工欲善其事,必先利其器!

  \

 

 

\

 

  

\

 

 

三、确定方案

 

通过前期的需求分析,并对客户系统结构有了一个初步的了解后,我们用了将近一周的时间从架构的复杂度,易用性,客户程序改动程度,性能,稳定性等多个角度敲定了最终的方案。

  

架构图如下:

   \

\

\

从原来复杂的架构变成如此清爽的架构,使用AlwaysOn取代复杂的发布订阅,使用AlwaysOn的只读节点实现读写分离,另外使用异地灾备节点取代原有的异地发布数据库,很不错吧~这也是用户最倾向的架构,因为复杂度低,相对稳定易于维护。这里要注意,凡事有利必有弊!要说“但是”了。

 

但是,升级改动的成本大大提升!为什么这么说?我们接着看!

 

四、详细调研

 

这样一个复杂系统前期的详细调研是需要很长时间的,几套系统不仅仅是架构上设计得比较复杂,功能应用、接口等更是复杂。下面是主要的一些梳理过程:

 

1原有系统结构

 

我们首先要对原有系统的设计有透彻的了解,客户在两地分别有一个数据中心,三套系统有大量的业务要使用其他系统的数据,所以这里使用发布订阅准时地把其他系统中的数据发布到系统中的一个数据库,并使用同义词指向订阅来的数据。这种结构降低了使用链接服务器跨实例甚至跨机房访问的性能消耗。并且多份数据订阅到多个只读的节点,从而实现了报表、接口等业务的读写分离。

 

2系统对象整理

 

因为要做升级迁移,所以对象的整理是很重要的工作,业务对象的遗漏可能会带来不可挽回的灾难,甚至有可能会导致整个升级、架构部署的回滚。几套系统中涉及的对象列表过于庞大,比如帐号几十个,几十个作业,上百个同义词,实例级触发器等等……

 

服务器划分:

  • 主库对象

  • 读写分离各个只读库对象

  • 发布到其他业务系统的数据服务器配置对象

  • 其他应用程序对象

 

对象划分:

  • 数据库帐号

  • 链接服务器

  • 实例级触发器

  • 作业

  • 系统参数

  • 维护计划

  • cdc

  • BI相关

  • 同义词

  • 程序集

  • 邮件

  • 操作员

  • 只读库多出来的索引、视图等对象

  • 等等等

 

 

五、测试过程

 

1搭建测试环境

 

所有的升级、高可用项目测试环节都是必不可少的。首先是测方案配合业务的可行性,因为作为第三方公司不能对用户所有的应用关系,系统架构了如指掌,甚至客户方自己的工程师可能也做不到这一点。其次是测试功能在新环境下是否出现异常。还有就是对收集并迁移的系统对象进行一次查缺补漏。这样也可以尽量保证系统上线时发生故障的概率。

 

测试环境无疑是任何升级、架构变更的必要步骤,也只有经过充分的测试才能做到心中有数,进而实现零故障上线。

 

2上线演练

 

上线演练?这是个什么东西?

 

首先数据库的操作一定要确定可实施的时间窗口,保证在固定的时间窗口完成工作很重要。这就是上线演练的最大好处,我们使用准备出的新机器完全模拟上线的全部步骤,并记录每个步骤使用的时间,可能出现的风险,最迟的完成时间等等。其次搭建完成后我们可以用这个环境(就是完成后正式环境的配置)进行压力测试。

 

上线演练是一个很必要的步骤,但这个步骤要视实际的情况而定,比如升级的方式,环境的配置等。在这样的一个项目中我们做了两轮的上线演练。

 

六、实施过程

 

1制定性能基线

 

这样一个大的变动,数据库在各个阶段的性能指标是什么样子的呢?这里我们依然使用Expert for SQL Server工具对每一个阶段实施前后性能进行对比,这样不仅能对实施的影响进行监控,更能清晰地分析出每个实施阶段对性能的影响。

 \

 

\
 

对每个指标也都做相应的对比分析,指标比较多这里不一一介绍了。

 

2性能优化

 

这里的性能优化,我们主要针对语句系统的一些常规参数、慢语句进行第一轮的优化,另外一个重点就是为了应对升级到2014后可能变慢的语句进行调整。具体什么样的语句可能变慢? 这个...

 

  • 系统的重点语句(执行最频繁的)

  • 语句复杂的

  • 大面积测试吧.....哈哈哈

 

这里为什么要在升级前就做这样的优化工作,而不是升级后系统运行时在针对慢的语句进行分析呢?这个道理很简单,如果上线了才发现变慢的功能很多,或变慢的是频繁的功能,那么上线的效果就是"失败"两个字。虽然有的看官知道可以使用提示或降低兼容级别解决这个问题,但是这只是特殊场景下的极端手段,并不是解决的根本。所以建议如果你有升级到2014的需要,那么这样的优化手段一定要提前做好。

 

七、升级到2014

 

升级数据库完全可以写成好几篇博客,甚至写本小书都可以。这里只做简单介绍,和一些要重点注意的问题。

 

1升级方式

 

升级方式有2种:in place 和side by side,这里采用的是side by side。通俗地说就是准备新的服务器,安装对应版本的数据库,然后把数据还原上去。side by side的好处就是升级不会影响原有的环境,即使失败也能修改程序指向回退到原环境。

 

\
 

升级2014最大的一个问题

 

2014的新特性 “参数估计” !这个让人兴奋又苦恼的新功能会导致很多语句在升级到2014后变慢,因为前面的优化阶段已经对这部分重点关注了,所以这部分的问题基本已经消灭。但是,万恶的分区表(200多个分区)依然导致了批处理的性能严重问题。

 

2集群搭建

 

集群搭建可能没有过多的可说支出,正常创建故障转移集群,搭建AlwaysOn等,但这其中的细节还是很多的,比如仲裁的方式?异地节点的虚拟IP设置?节点个数与业务的配合?……等等的问题,这里也就不一一细说了。 

 

3程序修改

 

这个架构的修改也必然导致程序上的变化,这也是前文中提到的为什么客户最倾向的架构,因为复杂度低而使成本大大提升。原始系统中的关联性无法通过发布订阅实现本地化访问,又不能使用性能非常差的链接服务器。那么路只有一条,那就是修改程序访问方式,简单理解为在程序中分别在各自的数据库中查出相应的数据,然后通过程序在内存中操作处理。

 

八、细节问题处理

 

总体的实施步骤可以说就是这样了,但是在这个整体步骤中充斥着无数的细节,每一个细节可能都决定着方案的可行性,升级、架构变更的成败。限于篇幅这里只举几个可能常见的问题说明一下。

 

  • CDC功能与AlwaysOn:官方文档上说CDC与AlwaysOn可以实现转移后CDC不间断,但是经过测试CDC作业在AlwaysOn切换后多次执行失败则不会再一次自动运行,CDC的logreader和发布订阅时一样的,但在没有发布订阅存在的情况下只有CDC作业会出现上述问题。解决办法:配置调控作业(节点切换作业控制)

  • 重建索引操作:由于配置异地节点。日志重建变成问题,测试中重建索引的日志量是单机下日志量的好几倍!这样会导致异地日志队列过长。解决办法:使用手工脚本拆分细化索引重建,根据队列大小和传输速率控制每天的日志量。

  • 2014下语句变慢:具体就不细说了,2014参数估计和200+分区表组合产生的语句变慢问题至今没有答案。目前只是使用一些方法避免了这个问题!(这个问题也请遇到的朋友给些思路,谢谢)

  • 只读副本上有写操作:由于一些报表操作使用中间临时表,这里临时表不是#temp 这种而是真正的物理表作为临时表。解决办法:修改为临时表,或创建单独数据库(不在可用性组中),在使用同义词指向新库实现写操作。

 

遇到的问题真是各种多,这也是为什么说当你的常规技术手段都掌握的时候,踩过的坑就是你的成长了!

 

总结

 

文章只是简单分享了一个较为复杂的08到14的升级并搭建高可用的工作,真正的实战项目和自己搭建的测试系统还是有很大的差别。项目整个工期持续了3个月,所以本文只是简单的说明思路和步骤,另外介绍了几个常见的大坑。项目中的主要步骤,个人认为这也是在数据库高可用方案搭建过程中的必要步骤:

 

  • 系统背景调查

  • 业务调研,生成初版方案

  • 详细调研,对象整理

  • 测试环境搭建

  • 系统测试,确定方案

  • 上线演练,确定时间窗口

  • 压力测试

  • 正式上线

  • 上线后监控

  • 解决问题,制定维护方案

 

此项目可以说是比较严格地遵循了相关管理的标准,在三个月的实施中,我们秉承这“稳定大于效率”的思想,工作细化到每一步,每一步都有详细的说明,最终保证了三套系统的上线运行零故障!


本文来自云栖社区合作伙伴"DBAplus",原文发布时间:2016-09-22



推荐阅读
  • 什么是网关服务器初学linux服务器开发时,我们的服务器是很简单的,只需要一个程序完成与客户端的连接,接收客户端数据,数据处理,向客户端发送数据。但是在处理量很大的情况下,一 ... [详细]
  • 一句话解决高并发的核心原则
    本文介绍了解决高并发的核心原则,即将用户访问请求尽量往前推,避免访问CDN、静态服务器、动态服务器、数据库和存储,从而实现高性能、高并发、高可扩展的网站架构。同时提到了Google的成功案例,以及适用于千万级别PV站和亿级PV网站的架构层次。 ... [详细]
  • 篇首语:本文由编程笔记#小编为大家整理,主要介绍了软件测试知识点之数据库压力测试方法小结相关的知识,希望对你有一定的参考价值。 ... [详细]
  • 云原生应用最佳开发实践之十二原则(12factor)
    目录简介一、基准代码二、依赖三、配置四、后端配置五、构建、发布、运行六、进程七、端口绑定八、并发九、易处理十、开发与线上环境等价十一、日志十二、进程管理当 ... [详细]
  • TiDB | TiDB在5A级物流企业核心系统的应用与实践
    TiDB在5A级物流企业核心系统的应用与实践前言一、业务背景科捷物流概况神州金库简介二、现状与挑战神州金库现有技术体系业务挑战应对方案三、TiDB解决方案测试迁移收益问题四、说在最 ... [详细]
  • 朱晔的互联网架构实践心得S1E7:三十种架构设计模式(上)【下载本文PDF进行阅读】设计模式是前人通过大量的实践总结出来的一些经验总结和最佳实践。在经过多年的软件开发实践之后,回过头 ... [详细]
  • Tomcat/Jetty为何选择扩展线程池而不是使用JDK原生线程池?
    本文探讨了Tomcat和Jetty选择扩展线程池而不是使用JDK原生线程池的原因。通过比较IO密集型任务和CPU密集型任务的特点,解释了为何Tomcat和Jetty需要扩展线程池来提高并发度和任务处理速度。同时,介绍了JDK原生线程池的工作流程。 ... [详细]
  • Oracle优化新常态的五大禁止及其性能隐患
    本文介绍了Oracle优化新常态中的五大禁止措施,包括禁止外键、禁止视图、禁止触发器、禁止存储过程和禁止JOB,并分析了这些禁止措施可能带来的性能隐患。文章还讨论了这些禁止措施在C/S架构和B/S架构中的不同应用情况,并提出了解决方案。 ... [详细]
  • 深入理解Java虚拟机的并发编程与性能优化
    本文主要介绍了Java内存模型与线程的相关概念,探讨了并发编程在服务端应用中的重要性。同时,介绍了Java语言和虚拟机提供的工具,帮助开发人员处理并发方面的问题,提高程序的并发能力和性能优化。文章指出,充分利用计算机处理器的能力和协调线程之间的并发操作是提高服务端程序性能的关键。 ... [详细]
  • 14亿人的大项目,腾讯云数据库拿下!
    全国人 ... [详细]
  • ZooKeeper 学习
    前言相信大家对ZooKeeper应该不算陌生。但是你真的了解ZooKeeper是个什么东西吗?如果别人面试官让你给他讲讲ZooKeeper是个什么东西, ... [详细]
  • 域名解析系统DNS
    文章目录前言一、域名系统概述二、因特网的域名结构三、域名服务器1.根域名服务器2.顶级域名服务器(TLD,top-leveldomain)3.权威(Authoritative)域名 ... [详细]
  • php网站设计实验报告,php网站开发实训报告
    本文目录一览:1、php动态网站设计的关键技术有哪些软件,及搭建步骤需要哪些页面,分别完成 ... [详细]
  • PartI:取经处: http:www.ramkitech.com201210tomcat-clustering ... [详细]
  • Istio是一个用来连接、管理和保护微服务的开放平台。Istio提供一种简单的方式来为已部署的服务建 ... [详细]
author-avatar
qixian0392_648
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有