作为一个后端,如果你没用过缓存,证明你的业务是真的很小,或者你的数据库是真的厉害。
那么,你真的会用缓存么?
什么时候需要缓存
首先最常见的就是接口的返回值加缓存,避免直接查库,尤其是榜单这种查起来很慢,但是访问很频繁的地方。
其次是元数据缓存,比如一个用户的信息,一条朋友圈的数据,查的时候只用查ID,然后去点查缓存。
最后是异步缓存,比如延时批次写,或者延时批次发包等等。
不会有人用缓存做消息队列吧,不会吧不会吧。
//todo 为什么不能用Redis做消息队列 (后面我放到消息队列的架构篇说吧)
怎么保持数据一致性。
数据一致性的一些思考
常见的大致有四种方案:
第一种,串行化
走队列,慢慢刷盘和更新缓存。
会有ABA的问题,就是比如我关注了一个人,然后取关,再关注,然后刷新页面,就会一下关注一下没关注。放大了之后就是主播的粉丝数忽上忽下。
第二种,Cache Aside Pattern:
- 读的时候,先读缓存,缓存没有的话,就读数据库,然后取出数据后放入缓存,同时返回响应。
- 更新的时候,先更新数据库,然后再删除缓存。
Cache Aside Pattern为什么建议淘汰缓存,而不是更新缓存?
答:如果更新缓存,在并发写时,可能出现数据不一致。
为什么先数据库而不是先缓存
答:两个并发操作,一个是更新操作A,另一个是查询操作B。更新操作A删除缓存后,查询操作B没有命中缓存,先把老数据读出来后放到缓存中,然后更新操作A更新了数据库。于是,在缓存中的数据还是老的数据,导致缓存中的数据是脏的,而且还一直这样脏下去了。
有没有可能读到脏数据?有,A读到老数据,然后B更新,删除缓存,A把老数据放到缓存,就脏了。但是,A只是放到缓存一下,比B写库慢那么多的情况是几乎不可能的。
第三种,中间件。
mysql哪一章我提到过了,就是让业务端无感,直接操作中间件,然后中间件去维护。这种方式也叫
Read/Write Through Pattern
。
Read Through
Read Through 套路就是在查询操作中更新缓存,也就是说,当缓存失效的时候(过期或LRU换出),Cache Aside是由调用方负责把数据加载入缓存,而Read Through则用缓存服务自己来加载,从而对应用方是透明的。
Write Through
Write Through 套路和Read Through相仿,不过是在更新数据时发生。当有数据更新的时候,如果没有命中缓存,直接更新数据库,然后返回。如果命中了缓存,则更新缓存,然后再由Cache自己更新数据库(这是一个同步操作)
第四种,Write Behind
也叫Write Back,就是在更新数据的时候,只更新缓存,不更新数据库;然后异步地批量更新数据库。
这个设计的好处就是让数据的I/O操作非常快(因为直接操作内存 ),因为异步,write backg还可以合并对同一个数据的多次操作,所以性能的提高是相当可观的。
其实,mysql、Linux的文件写入都是这个套路。
缺点是什么?可能丢数据,缓存的易失性是高于数据库(文件)的,宕机就会导致丢失数据。
雪崩、穿透和击穿
- 雪崩
缓存设置的过期时间都一样,在某一刻大面积过期,即缓存失效,流量大面积打到数据库,导致崩溃。(缓存宕机了也是一样)
解决:随机添加过期时间。
- 穿透
就是缓存没有,就查库,然后库里面本来就没有,生成的缓存自然没有,这样就会无限打到库。
比如我遇到的,配置表,根本没这个配置,然后每次需要这个配置的时候就要重新生成缓存,然后代码里面用的又很多,成几何倍数放大。
解决:持久化缓存,不过期,缓存没有就没有,后台改配置的时候再重新生成这个缓存。
- 击穿
主要是热点缓存,在某一刻过期,大量流量并发打到数据库,就像凿开了一个洞。
解决:永不过期。或者用任务后台定时更新缓存,不走接口触发。
结语
- 如果有不对的地方欢迎指正。
- 如果有不理解的地方欢迎指出我来加栗子。
- 如果感觉OK可以点赞让更多人看到它。