热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

MySQL内存交换区引起的一场“血案”

MySQL内存交换区引起的一场“血案”MySQLP



MySQL 内存交换区引起的一场“血案”




MySQL Performance murder -- SWAP




一、故事情节:


最近公司上了一个新的项目,关于搜索一块的项目。其程序会调用大量的SQL,包括各种条件的搜索,模糊的匹配,联动的效果,etc。其目的,是提高百度or谷歌的爬虫的量;其效果,确实有了,自从上线了,据SEO相关部门的统计爬虫抓取的量大概翻了5倍。各个都Happy,唯独我Happy不起来,因为MySQL的负载极其不稳定。当晚上线时,就发现Slave的负载有点猛,CTO一声令下,再加一台Slave,点头做事就OK了,呵呵。另加了一台Slave,发现Slave的负载,确实都回归正常了,本以为息事宁人呢,,,谁知,大概隔了3,4个小时吧,新添加的Slave的负载暴增,大概160+,么情况?原来的slave到是显得平静无事。大概过了1个小时,新增加的Slave的负载回归正常,大概也就是零点几的样子;隔几个小时,负载又是直接飙升100+。没得说,身为DBA,就是要Troubleshooting。




二、Troubleshooting的过程:


  1. 因为是间接性抽风,所以认为肯定和前台的访问的频率,及调用的scope相关;就结合前台的日志,发现确实是这样。都是百度的or谷歌的爬虫疯狂的访问新的项目(搜索)时,新增的Slave的负载就会疯一样的增长。可是为何原来的Slave为何没有太大的波动呢?

  2. 考虑到新增的server,因为内存,CPU等硬件的配置和原来数据库的server都不一样(其实是新增的Slave比原来的Slave的内存少了一半),必然配置参数的值也会不同。所以就从MySQl的配置文件查起,如:sort_buffer_size的大小(因为考虑到有许多SQL包含排序),join_buffer_size(用于连接的缓存的大小),max_connections(最大连接数,可是通过show processlist;发现也没有超过设置的值),innodb_buffer_pool_size(确认是否为物理内存的合适比例)等等。实际自己也犯2了,呵呵,身为DBA,这都是基本的配置,按照正常的逻辑判断也不该有多大的问题,只要把这些参数设置在合理的范围内,不会引起负载那么大的波动。那为何呢?考虑到是新装的系统,莫非是系统的参数引起的?

  3. 于是开始查找关于一些TCP/IP,打开文件最大数等等,按照网友的最优调整,只能说希望越大失望越大吧,不起任何作用。这尼玛到底怎么回事呢?要是两台Slave出现相同的情况,也好解决了,可是就这台新增加的Slave有问题,,,没得选,静下心来,恍然大悟,才考虑到系统的CPU,内存,IO的波动。

  4. 通过排查,CPU正常,但是问题出来了,发现free -m查看内存时,发现SWAP既然使用了300MB,怎么会使用这么多,所以一口咬定就死SWAP捣的蛋。通过vmsata,发现si和so的值不断的变化,所以更加的肯定是发生了内存交换。既然找到问题了,那就解决吧。




三、内存交换区:


当操作系统因为没有足够的内存而将一些虚拟内存写到磁盘就会发生内存交换。


内存交换对MySQL性能影响是极其糟糕的。它破坏了缓存在内存的目的,并且相对于使用很小的内存做缓存,使用交换区的性能更差。MySQL和存储引擎有很多算法来区别对待内存中的数据和硬盘上的数据,因为一般都是假设内存数据访问代价更低。


因为内存交换对用户进程不可见,MySQL(或存储引擎)并不知道数据实际上已经移动到磁盘,还会以为在内存中。


结果会导致很差的性能。例如。若存储引擎认为数据依然在内存,可能觉得为"短暂"的内存操作锁定一个全局互斥变量(例如,InnoDB缓冲池Mutex)是OK的。如果这个操作实际上引起了硬盘I/O,直到I/O操作完成前任何操作都会被挂起。这意味着内存交换比直接做硬盘I/O操作还要糟糕。


在GNU/Linux上,可以用vmstat来监控内存交换。最好查看si和so列报告的内存交换I/O活动,这比看swapd列报告的交换区利用率更重要。我们都喜欢si和so列的值为0,并且一定要保证它们低于每秒10块。


可以通过正确地配置MySQL缓冲来解决大部分内存交换问题,但是有时操作系统的虚拟内存系统还是会决定交换MySQL内存。这通常发生在操作系统看到MySQL发出了大量I/O,因此尝试增加文件缓存来保存更多数据时。如果没有足够的内存,有些东西就必须交换出去,有些可能就是MySQL本身。


有些人主张完全禁用交换文件。这样做是很危险的,因为禁用内存交换就相当于给虚拟内存设置了一个不可动摇的限制。如果MySQL需要临时使用很大一块内存,或者有很耗内存的进程运行在同一台server上(如夜间的批量任务),MySQL可能会内存溢出,崩溃,或者被操作系统kill掉。


操作系统通常允许对虚拟内存和I/O进行一些控制。最基本的方法就是修改/proc/sys/vm/swappiness为一个很小的值,如0或1。这等同于告诉内核除非虚拟内存完全满了,否则不要使用交换区。下面是如何检查这个值的例子:


$ cat proc/sys/vm/swappiness

60



这个值显示为60,这是默认的设置(范围是0~100)。对于服务器而言这是个很糟糕的默认值。服务器应该设置为0:


$
echo
0 >
/proc/sys/vm/swappiness



另一个选项是修改存储引擎怎么读取和写入数据。使用innodb_flush_method=O_DIRECT,减轻I/O压力。DIRECT I/O并不缓存,因此操作系统并不能把MySQL视为增加文件缓存的原因。这个参数只对InnoDB有效。你也可以使用大页,不参与换入换出,这对MyISAM和InnoDB都有效。


另一个选择是使用MySQL的memlock配置项,可以把MySQL锁定在内存。这可以避免交换,但是也可能带来危险:如果没有足够的可锁定内存,MySQL在尝试分配更多内存时就会崩溃。




四、解决问题:


第一种方法:修改系统对虚拟内存的控制

$ echo 0 > proc/sys/vm/swappiness

#要想永久生效,将其配置写入/etc/sysctl.conf文件中

$ echo "vm.swappiness=0" >> etc/sysctl.conf

#令其立即生效

$ sysctl -p



第二种方法:修改innodb_flush_method参数


#注意innodb_flush_method是个全局变量,并且不支持动态修改,所以修改配置文件,重启MySQL

$ vi etc/my.cnf

innodb_flush_method=O_DIRECT

#添加其参数的配置,如果线上正在运行的数据库,就要先:

mysql> stop slave;

#然后重启MySQL

$ etc/init.d/mysqld restart



对于修改memlock配置项,不推荐。


新增加的server,运行正常,爬虫照常抓,负载很稳定在4以下。swap的使用也降到了8MB的样子。呵呵,终于可以小Happy下了。

  1. troubleshooting的经验不足吧,自我评定。

  2. swap对于操作系统,对于MySQL的性能影响很大。

  3. 要对swap的监控重视起来。




五、分享虾米米:


可能有的同学对于如何查看那个进程占用swap的大小比较感兴趣,如下方法:


第一步:

$ top

第二步:

按大写的O

第三步:

输入小写字母p

第四步:

回车




显示的结果图如:




希望这场swap的“血案”,让我们共同成长!!!






本文出自 “Focus on the database” 博客,请务必保留此出处 http://lgdvsehome.blog.51cto.com/3360656/1280247









推荐阅读
  • 本文介绍了如何使用php限制数据库插入的条数并显示每次插入数据库之间的数据数目,以及避免重复提交的方法。同时还介绍了如何限制某一个数据库用户的并发连接数,以及设置数据库的连接数和连接超时时间的方法。最后提供了一些关于浏览器在线用户数和数据库连接数量比例的参考值。 ... [详细]
  • 本文介绍了使用PHP实现断点续传乱序合并文件的方法和源码。由于网络原因,文件需要分割成多个部分发送,因此无法按顺序接收。文章中提供了merge2.php的源码,通过使用shuffle函数打乱文件读取顺序,实现了乱序合并文件的功能。同时,还介绍了filesize、glob、unlink、fopen等相关函数的使用。阅读本文可以了解如何使用PHP实现断点续传乱序合并文件的具体步骤。 ... [详细]
  • 图解redis的持久化存储机制RDB和AOF的原理和优缺点
    本文通过图解的方式介绍了redis的持久化存储机制RDB和AOF的原理和优缺点。RDB是将redis内存中的数据保存为快照文件,恢复速度较快但不支持拉链式快照。AOF是将操作日志保存到磁盘,实时存储数据但恢复速度较慢。文章详细分析了两种机制的优缺点,帮助读者更好地理解redis的持久化存储策略。 ... [详细]
  • 计算机存储系统的层次结构及其优势
    本文介绍了计算机存储系统的层次结构,包括高速缓存、主存储器和辅助存储器三个层次。通过分层存储数据可以提高程序的执行效率。计算机存储系统的层次结构将各种不同存储容量、存取速度和价格的存储器有机组合成整体,形成可寻址存储空间比主存储器空间大得多的存储整体。由于辅助存储器容量大、价格低,使得整体存储系统的平均价格降低。同时,高速缓存的存取速度可以和CPU的工作速度相匹配,进一步提高程序执行效率。 ... [详细]
  • 本文介绍了操作系统的定义和功能,包括操作系统的本质、用户界面以及系统调用的分类。同时还介绍了进程和线程的区别,包括进程和线程的定义和作用。 ... [详细]
  • 上图是InnoDB存储引擎的结构。1、缓冲池InnoDB存储引擎是基于磁盘存储的,并将其中的记录按照页的方式进行管理。因此可以看作是基于磁盘的数据库系统。在数据库系统中,由于CPU速度 ... [详细]
  • 基于PgpoolII的PostgreSQL集群安装与配置教程
    本文介绍了基于PgpoolII的PostgreSQL集群的安装与配置教程。Pgpool-II是一个位于PostgreSQL服务器和PostgreSQL数据库客户端之间的中间件,提供了连接池、复制、负载均衡、缓存、看门狗、限制链接等功能,可以用于搭建高可用的PostgreSQL集群。文章详细介绍了通过yum安装Pgpool-II的步骤,并提供了相关的官方参考地址。 ... [详细]
  • 一、Hadoop来历Hadoop的思想来源于Google在做搜索引擎的时候出现一个很大的问题就是这么多网页我如何才能以最快的速度来搜索到,由于这个问题Google发明 ... [详细]
  • 本文详细介绍了Linux中进程控制块PCBtask_struct结构体的结构和作用,包括进程状态、进程号、待处理信号、进程地址空间、调度标志、锁深度、基本时间片、调度策略以及内存管理信息等方面的内容。阅读本文可以更加深入地了解Linux进程管理的原理和机制。 ... [详细]
  • 开发笔记:计网局域网:NAT 是如何工作的?
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了计网-局域网:NAT是如何工作的?相关的知识,希望对你有一定的参考价值。 ... [详细]
  • Java中包装类的设计原因以及操作方法
    本文主要介绍了Java中设计包装类的原因以及操作方法。在Java中,除了对象类型,还有八大基本类型,为了将基本类型转换成对象,Java引入了包装类。文章通过介绍包装类的定义和实现,解答了为什么需要包装类的问题,并提供了简单易用的操作方法。通过本文的学习,读者可以更好地理解和应用Java中的包装类。 ... [详细]
  • 本文介绍了如何使用Express App提供静态文件,同时提到了一些不需要使用的文件,如package.json和/.ssh/known_hosts,并解释了为什么app.get('*')无法捕获所有请求以及为什么app.use(express.static(__dirname))可能会提供不需要的文件。 ... [详细]
  • 本文介绍了Redis中RDB文件和AOF文件的保存和还原机制。RDB文件用于保存和还原Redis服务器所有数据库中的键值对数据,SAVE命令和BGSAVE命令分别用于阻塞服务器和由子进程执行保存操作。同时执行SAVE命令和BGSAVE命令,以及同时执行两个BGSAVE命令都会产生竞争条件。服务器会保存所有用save选项设置的保存条件,当满足任意一个保存条件时,服务器会自动执行BGSAVE命令。此外,还介绍了RDB文件和AOF文件在操作方面的冲突以及同时执行大量磁盘写入操作的不良影响。 ... [详细]
  • Vagrant虚拟化工具的安装和使用教程
    本文介绍了Vagrant虚拟化工具的安装和使用教程。首先介绍了安装virtualBox和Vagrant的步骤。然后详细说明了Vagrant的安装和使用方法,包括如何检查安装是否成功。最后介绍了下载虚拟机镜像的步骤,以及Vagrant镜像网站的相关信息。 ... [详细]
  • 篇首语:本文由编程笔记#小编为大家整理,主要介绍了软件测试知识点之数据库压力测试方法小结相关的知识,希望对你有一定的参考价值。 ... [详细]
author-avatar
拍友2502916683
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有