当前位置: 开发笔记 > 数据库 > 正文

Memcache架构新思考

作者：缺氧 | 来源：互联网 | 2013-04-19 10:16

2011年初MarcKwiatkowski通过Memecache@Facebook介绍了Facebook的Memcache架构，现在重新审视这个架构，仍有很多方面在业界保持先进性。作为weibo内部数据处理量最大，对数据延迟最敏感的部门，基于本厂2年多来对mc的使用心得，我在本文总结对MC架构的一些新思考。

2011年初Marc Kwiatkowski通过Memecache@Facebook介绍了Facebook的Memcache架构，现在重新审视这个架构，仍有很多方面在业界保持先进性。作为weibo内部数据处理量最大，对数据延迟最敏感的部门，基于本厂2年多来对mc的使用心得，我在本文总结对MC架构的一些新思考。

1. Memcache使用中的雷区

通常你可能考虑不到，但又隐藏在某处等着你踩的称之为“雷”。

带宽和连接数

Memcache具有很高吞吐能力，Memecache@Facebook中介绍Memcache支持8万/s读和2万/s写，在weibo内部我们通常认为单个Memcache实例支持7w/s读，2w/s写是安全的。和Facebook一样，为了充分榨取服务器性能，我们会在一台物理机上部署多个Memcache。为了确保Memcache的正常工作，我们通常会通过定期执行MC stats命令来对内存使用量，踢出率，命中率等进行监控。比如微博早期监控中就包括如图所示的这些内容，

这些监控中我们最重视的往往是内存使用量和命中率。但随着前端服务不断增加和cache层不断扩容，单台缓存物理机上的连接数，带宽都成为新的瓶颈。因此必须重视对带宽和连接数的监控。Memecache@Facebook中介绍单台MC服务器可支撑10w连接。

Hot Key

Hot Key通常不常见，但Weibo和Facebook都遇到这类问题，简单的讲就是在大并发下，有大量的请求到同一个在MC中不存在的资源，然后全部read through到后端数据库，把数据库读跨。具体方法请见TimYang的博客：http://timyang.net/programming/memcache-mutex/，同时后面的讨论也很精彩。不过我查阅大量微博代码却没有发现有使用MC mutex，也就是说Hot Key是个不常见的问题，一个不容易踩到的雷。

Memcache Client

不记得是不是在Memecache@Facebook提到过，也和淘宝的同行交流过，共同的的经验是：Memcache优化的重点和难点在客户端。这个展开起来很大，概况讲有2个重点：（1）TCP连接池（2）基于NIO的multiget；可以参考我的另一篇文章：通过NIO实现Memcached multi get （http://maoyidao.iteye.com/blog/1739282）

2. Memcache集群是否支持线性扩容？

扩容问题之一：如果不降低命中率？

扩容Memcache不降低命中率，好像在高速路上给汽车换轮胎。

我们通常从课本上学到的是，前端采用一致性Hash，逻辑节点达2^32个，物理节点扩容也不会导致大量cache命中移动。一致性Hash足以应对大多数场景，但在微博业务中，每秒超过十几万次读，及时下降1%的命中率也会直接读跨数据库，因此我们的要求是扩容不能降低命中率。为达到该目的，我们把水平扩展，变为垂直扩展，即通过多层Cache解决扩容而同时不降低命中率的问题。

另外一个好处是，新加入的cache层无需预热，当线上服务出现意外高峰时，可以立刻投入使用。

扩容问题之二：Memcache集群具备水平扩展性吗？

随着缓存层的增长，数据被分散到更多缓存服务器上，获取相同信息需要发送的网络包的数量也在不断增长。比如，只有一台缓存服务器时，由于操作系统网络层发送缓冲区的设计，get 100个key的数据可以在一个IP packet中传输，结果可以也可以在一个IP packet中获取。但当有100台缓存服务器时，获取100个key的数据就有需要向100台服务器发送100个IP packet（假设100个数据均匀的分布在100台物理机上），相应的内核中断也显著增加。

因此，我不认为Memcache集群在这个概念下具备水平扩展能力。但通常我们通过划分不同数据大小的缓存池控制Memcache集群的大小，而且随着96G或以上大内存服务器的广泛使用。即便在微博这个场景下，12台服务器一组的缓存就已经非常大规模的了。

3. Memcache其实还能更快？

如果你追求极致的Memcache访问速度，可以登录上你的Memcache服务器，检查一下CPU使用情况。我找了一台线上服务，情况如下：

显然CPU7的系统使用率比其他CPU要高。检查一下软中断：

再看看线上服务的版本：

[jichao1@yf179 ~]$ uname -a

Linux yf179 2.6.18-164.el5 #1 SMP Thu Sep 3 03:28:30 EDT 2009 x86_64 x86_64 x86_64 GNU/Linux

在kernel-2.6.18-194.3.1.el 版本以下的Redhat以及CentOS 操作系统，使用Broadcom 5709网卡芯片的服务器存在cpu软中断不均衡，只有1个cpu处理软中断。

解决方法可以是升级内核，不过也有朋友说没用，需要通过VIP绑定2块网卡的方式解决，具体方案见：http://hi.baidu.com/higkoo/item/42ba6c353bc8aed76d15e9c3

通过对比内核支持4个队列的服务器（最多只能利用到4核，无法在硬件驱动层直接配置成更多队列），只分配一个CPU的Memcache服务器在大压力下可能会慢1~2ms。

推荐阅读

centos
如何配置Unturned服务器及其消息设置

本文详细介绍了Unturned服务器的配置方法和消息设置技巧，帮助用户了解并优化服务器管理。同时，提供了关于云服务资源操作记录、远程登录设置以及文件传输的相关补充信息。 ... [详细]

蜡笔小新 2024-12-27 13:47:38
nosql
程序员必备：深入解析分布式文件系统

本文深入探讨了分布式文件系统的核心概念及其在现代数据存储解决方案中的应用，特别是针对大规模数据处理的需求。文章不仅介绍了多种流行的分布式文件系统和NoSQL数据库，还提供了选择合适系统的指导原则。 ... [详细]

蜡笔小新 2024-11-27 09:49:40
sql
新浪笔试题

1:有如下一段程序：packagea.b.c;publicclassTest{privatestaticinti0;publicintgetNext(){return ... [详细]

蜡笔小新 2024-12-27 19:32:17
数据库
解决Hive启动时权限被拒问题

本文详细分析了Hive在启动过程中遇到的权限拒绝错误，并提供了多种解决方案，包括调整文件权限、用户组设置以及环境变量配置等。 ... [详细]

蜡笔小新 2024-12-26 19:14:29
mysql
使用Vultr云服务器和Namesilo域名搭建个人网站

本文详细介绍了如何通过Vultr云服务器和Namesilo域名搭建一个功能齐全的个人网站，包括购买、配置服务器以及绑定域名的具体步骤。文章还提供了详细的命令行操作指南，帮助读者顺利完成建站过程。 ... [详细]

蜡笔小新 2024-12-26 16:36:34
mysql
告别传统文件传输，迎接新一代高效工具Croc

在现代网络环境中，两台计算机之间的文件传输需求日益增长。传统的FTP和SSH方式虽然有效，但其配置复杂、步骤繁琐，难以满足快速且安全的传输需求。本文将介绍一种基于Go语言开发的新一代文件传输工具——Croc，它不仅简化了操作流程，还提供了强大的加密和跨平台支持。 ... [详细]

蜡笔小新 2024-12-26 16:16:06
mysql
jQuery Mobile 安全漏洞可能导致XSS攻击

近期，谷歌公司的一名安全工程师Eduardo Vela在jQuery Mobile框架中发现了一项可能引发跨站脚本攻击（XSS）的安全漏洞。此漏洞使得使用jQuery Mobile的所有网站面临潜在的安全威胁。 ... [详细]

蜡笔小新 2024-12-15 12:43:59
memcached
magent一款开源的Memcached代理服务器软件

magent是一款开源的Memcached代理服务器软件，其项目网址为：　　http:code.google.compmemagent　　一、安装步骤& ... [详细]

蜡笔小新 2024-12-09 16:28:37
pymongo
MongoDB与Redis性能对比及Python测试脚本

近期参与了一个旨在提高在线平台大规模查询响应速度的项目，预计处理的数据量为2-3亿条，数据库并发量约为每秒1500次，未来可能增至3000次。通过对比Redis和MongoDB，最终选择了MongoDB，因其具备优秀的横向扩展性和GridFS支持下的Map/Reduce功能。 ... [详细]

蜡笔小新 2024-12-05 18:35:20
redis
Redis快照持久化详解

本文深入探讨了Redis的快照持久化机制，包括其工作原理、配置方法以及如何手动触发快照。通过这种方式，Redis能够确保在服务器重启后数据的安全性和完整性。 ... [详细]

蜡笔小新 2024-12-02 19:44:23
redis
利用 Python 和 Scapy 实施 DNS 欺骗攻击的技术解析

本文详细介绍了如何使用 Python 编程语言中的 Scapy 库执行 DNS 欺骗攻击，包括必要的软件安装、攻击流程及代码示例。 ... [详细]

蜡笔小新 2024-11-25 15:52:30
database
网络链路质量监控：Smokeping部署与配置

本文详细介绍了如何在Linux系统上安装和配置Smokeping，以实现对网络链路质量的实时监控。通过详细的步骤和必要的依赖包安装，确保用户能够顺利完成部署并优化其网络性能监控。 ... [详细]

蜡笔小新 2024-12-27 19:31:05
redis
一致性哈希算法在数据迁移中的应用解析

在分布式系统中，当多个服务器共同提供服务时，如何高效地将请求路由到正确的服务器是一个关键问题。传统的方法如简单哈希取模在服务器数量变化时会导致大量数据迁移。本文探讨了一致性哈希算法如何有效解决这一问题，确保系统的稳定性和高效性。 ... [详细]

蜡笔小新 2024-12-05 11:21:55
memcached
Python3操作Memcached

安装MemcachedMemcached整理安装PythonMemcachedAPIpython操作啊Memcached使用Python-memcached模块下载安装：https ... [详细]

蜡笔小新 2024-12-04 19:15:58
memcached
Linux环境下Memcached安装指南

本文详细介绍如何在Linux虚拟机上安装Memcached，包括必要的依赖库安装，以及使用Xshell进行文件传输的具体步骤。 ... [详细]

蜡笔小新 2024-12-03 18:28:27

缺氧

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章