oppoJava面试！java开发视频聊天

作者：冷月荐向_878 | 来源：互联网 | 2023-10-10 12:37

前言我想，很多人和我一样在煎熬中度过着2021年，也经历了不少困难，随着国家对疫情的控制，互联网行业又重新迎来了生机。我

前言

我想&＃xff0c;很多人和我一样在煎熬中度过着2021年&＃xff0c;也经历了不少困难&＃xff0c;随着国家对疫情的控制&＃xff0c;互联网行业又重新迎来了生机。

我在2021年拿到了阿里Java研发岗的offer&＃xff0c;也算是正式提桶进大厂的打工人了。于是乎&＃xff0c;我想把我的经历分享给大家&＃xff0c;希望你们在金三银四这个跳槽旺季找到一份更满意的工作&＃xff01;

面试结束后我大概总结了一下&＃xff0c;发现还是准备不够充分&＃xff0c;基本上全靠自己平时的积累才侥幸通过。因此&＃xff0c;我建议大家平时一定要养成学习的习惯&＃xff0c;哪怕只花30min&＃xff0c;日积月累总会有收获&＃xff1b;其次&＃xff0c;提前两个月的时间做好充分的准备&＃xff0c;最好不要临时抱佛脚。

如何保证缓存和数据库一致性

说了这么多缓存的必要性&＃xff0c;那么使用缓存是不是就是一个很简单的事情了呢&＃xff0c;我之前也一直是这么觉得的&＃xff0c;直到遇到了需要缓存与数据库保持强一致的场景&＃xff0c;才知道让数据库数据和缓存数据保持一致性是一门很高深的学问。

从远古的硬件缓存&＃xff0c;操作系统缓存开始&＃xff0c;缓存就是一门独特的学问。这个问题也被业界探讨了非常久&＃xff0c;争论至今。我翻阅了很多资料&＃xff0c;发现其实这是一个权衡的问题。值得好好讲讲。

以下的讨论会引入几方观点&＃xff0c;我会跟着观点来写代码验证所提到的问题。

不更新缓存&＃xff0c;而是删除缓存

大部分观点认为&＃xff0c;做缓存不应该是去更新缓存&＃xff0c;而是应该删除缓存&＃xff0c;然后由下个请求去去缓存&＃xff0c;发现不存在后再读取数据库&＃xff0c;写入缓存。

观点引用&＃xff1a;《分布式之数据库和缓存双写一致性方案解析》孤独烟

原因一&＃xff1a;线程安全角度

同时有请求A和请求B进行更新操作&＃xff0c;那么会出现

&＃xff08;1&＃xff09;线程A更新了数据库

&＃xff08;2&＃xff09;线程B更新了数据库

&＃xff08;3&＃xff09;线程B更新了缓存

&＃xff08;4&＃xff09;线程A更新了缓存

这就出现请求A更新缓存应该比请求B更新缓存早才对&＃xff0c;但是因为网络等原因&＃xff0c;B却比A更早更新了缓存。这就导致了脏数据&＃xff0c;因此不考虑。

原因二&＃xff1a;业务场景角度

有如下两点&＃xff1a;

&＃xff08;1&＃xff09;如果你是一个写数据库场景比较多&＃xff0c;而读数据场景比较少的业务需求&＃xff0c;采用这种方案就会导致&＃xff0c;数据压根还没读到&＃xff0c;缓存就被频繁的更新&＃xff0c;浪费性能。

&＃xff08;2&＃xff09;如果你写入数据库的值&＃xff0c;并不是直接写入缓存的&＃xff0c;而是要经过一系列复杂的计算再写入缓存。那么&＃xff0c;每次写入数据库后&＃xff0c;都再次计算写入缓存的值&＃xff0c;无疑是浪费性能的。显然&＃xff0c;删除缓存更为适合。

其实如果业务非常简单&＃xff0c;只是去数据库拿一个值&＃xff0c;写入缓存&＃xff0c;那么更新缓存也是可以的。但是&＃xff0c;淘汰缓存操作简单&＃xff0c;并且带来的副作用只是增加了一次cache miss&＃xff0c;建议作为通用的处理方式。

先操作缓存&＃xff0c;还是先操作数据库

那么问题就来了&＃xff0c;我们是先删除缓存&＃xff0c;然后再更新数据库&＃xff0c;还是先更新数据库&＃xff0c;再删缓存呢&＃xff1f;

先来看看大佬们怎么说。

《【58沈剑架构系列】缓存架构设计细节二三事》58沈剑&＃xff1a;

对于一个不能保证事务性的操作&＃xff0c;一定涉及“哪个任务先做&＃xff0c;哪个任务后做”的问题&＃xff0c;解决这个问题的方向是&＃xff1a;如果出现不一致&＃xff0c;谁先做对业务的影响较小&＃xff0c;就谁先执行。

假设先淘汰缓存&＃xff0c;再写数据库&＃xff1a;第一步淘汰缓存成功&＃xff0c;第二步写数据库失败&＃xff0c;则只会引发一次Cache miss。

假设先写数据库&＃xff0c;再淘汰缓存&＃xff1a;第一步写数据库操作成功&＃xff0c;第二步淘汰缓存失败&＃xff0c;则会出现DB中是新数据&＃xff0c;Cache中是旧数据&＃xff0c;数据不一致。

沈剑老师说的没有问题&＃xff0c;不过没完全考虑好并发请求时的数据脏读问题&＃xff0c;让我们再来看看孤独烟老师《分布式之数据库和缓存双写一致性方案解析》&＃xff1a;

先删缓存&＃xff0c;再更新数据库

该方案会导致请求数据不一致

同时有一个请求A进行更新操作&＃xff0c;另一个请求B进行查询操作。那么会出现如下情形:

&＃xff08;1&＃xff09;请求A进行写操作&＃xff0c;删除缓存

&＃xff08;2&＃xff09;请求B查询发现缓存不存在

&＃xff08;3&＃xff09;请求B去数据库查询得到旧值

&＃xff08;4&＃xff09;请求B将旧值写入缓存

&＃xff08;5&＃xff09;请求A将新值写入数据库

上述情况就会导致不一致的情形出现。而且&＃xff0c;如果不采用给缓存设置过期时间策略&＃xff0c;该数据永远都是脏数据。

所以先删缓存&＃xff0c;再更新数据库并不是一劳永逸的解决方案&＃xff0c;再看看先更新数据库&＃xff0c;再删缓存这种方案怎么样&＃xff1f;

先更新数据库&＃xff0c;再删缓存这种情况不存在并发问题么&＃xff1f;

不是的。假设这会有两个请求&＃xff0c;一个请求A做查询操作&＃xff0c;一个请求B做更新操作&＃xff0c;那么会有如下情形产生

&＃xff08;1&＃xff09;缓存刚好失效

&＃xff08;2&＃xff09;请求A查询数据库&＃xff0c;得一个旧值

&＃xff08;3&＃xff09;请求B将新值写入数据库

&＃xff08;4&＃xff09;请求B删除缓存

&＃xff08;5&＃xff09;请求A将查到的旧值写入缓存

ok&＃xff0c;如果发生上述情况&＃xff0c;确实是会发生脏数据。

然而&＃xff0c;发生这种情况的概率又有多少呢&＃xff1f;

发生上述情况有一个先天性条件&＃xff0c;就是步骤&＃xff08;3&＃xff09;的写数据库操作比步骤&＃xff08;2&＃xff09;的读数据库操作耗时更短&＃xff0c;才有可能使得步骤&＃xff08;4&＃xff09;先于步骤&＃xff08;5&＃xff09;。可是&＃xff0c;大家想想&＃xff0c;数据库的读操作的速度远快于写操作的&＃xff08;不然做读写分离干嘛&＃xff0c;做读写分离的意义就是因为读操作比较快&＃xff0c;耗资源少&＃xff09;&＃xff0c;因此步骤&＃xff08;3&＃xff09;耗时比步骤&＃xff08;2&＃xff09;更短&＃xff0c;这一情形很难出现。

先更新数据库&＃xff0c;再删缓存依然会有问题&＃xff0c;不过&＃xff0c;问题出现的可能性会因为上面说的原因&＃xff0c;变得比较低&＃xff01;

(补充说明&＃xff1a;我用了“先更新数据库&＃xff0c;再删缓存”且不设过期时间策略&＃xff0c;会不会有问题呢&＃xff1f;由于先缓存和更新数据库不是原子的&＃xff0c;如果更新了数据库&＃xff0c;程序歇逼&＃xff0c;就没删缓存&＃xff0c;由于没有过期策略&＃xff0c;就永远脏数据了。)

所以&＃xff0c;如果你想实现基础的缓存数据库双写一致的逻辑&＃xff0c;那么在大多数情况下&＃xff0c;在不想做过多设计&＃xff0c;增加太大工作量的情况下&＃xff0c;请先更新数据库&＃xff0c;再删缓存!

我非要数据库和缓存数据强一致怎么办

那么&＃xff0c;如果我非要保证绝对一致性怎么办&＃xff0c;先给出结论&＃xff1a;

没有办法做到绝对的一致性&＃xff0c;这是由CAP理论决定的&＃xff0c;缓存系统适用的场景就是非强一致性的场景&＃xff0c;所以它属于CAP中的AP。

所以&＃xff0c;我们得委曲求全&＃xff0c;可以去做到BASE理论中说的最终一致性。

最终一致性强调的是系统中所有的数据副本&＃xff0c;在经过一段时间的同步后&＃xff0c;最终能够达到一个一致的状态。因此&＃xff0c;最终一致性的本质是需要系统保证最终数据能够达到一致&＃xff0c;而不需要实时保证系统数据的强一致性

大佬们给出了到达最终一致性的解决思路&＃xff0c;主要是针对上面两种双写策略&＃xff08;先删缓存&＃xff0c;再更新数据库/先更新数据库&＃xff0c;再删缓存&＃xff09;导致的脏数据问题&＃xff0c;进行相应的处理&＃xff0c;来保证最终一致性。

缓存延时双删

问&＃xff1a;先删除缓存&＃xff0c;再更新数据库中避免脏数据&＃xff1f;

答案&＃xff1a;采用延时双删策略。

上文我们提到&＃xff0c;在先删除缓存&＃xff0c;再更新数据库的情况下&＃xff0c;如果不采用给缓存设置过期时间策略&＃xff0c;该数据永远都是脏数据。

那么延时双删怎么解决这个问题呢&＃xff1f;

&＃xff08;1&＃xff09;先淘汰缓存

&＃xff08;2&＃xff09;再写数据库&＃xff08;这两步和原来一样&＃xff09;

&＃xff08;3&＃xff09;休眠1秒&＃xff0c;再次淘汰缓存

这么做&＃xff0c;可以将1秒内所造成的缓存脏数据&＃xff0c;再次删除。

那么&＃xff0c;这个1秒怎么确定的&＃xff0c;具体该休眠多久呢&＃xff1f;

针对上面的情形&＃xff0c;读者应该自行评估自己的项目的读数据业务逻辑的耗时。然后写数据的休眠时间则在读数据业务逻辑的耗时基础上&＃xff0c;加几百ms即可。这么做的目的&＃xff0c;就是确保读请求结束&＃xff0c;写请求可以删除读请求造成的缓存脏数据。

如果你用了mysql的读写分离架构怎么办&＃xff1f;

ok&＃xff0c;在这种情况下&＃xff0c;造成数据不一致的原因如下&＃xff0c;还是两个请求&＃xff0c;一个请求A进行更新操作&＃xff0c;另一个请求B进行查询操作。

&＃xff08;1&＃xff09;请求A进行写操作&＃xff0c;删除缓存

&＃xff08;2&＃xff09;请求A将数据写入数据库了&＃xff0c;

&＃xff08;3&＃xff09;请求B查询缓存发现&＃xff0c;缓存没有值

&＃xff08;4&＃xff09;请求B去从库查询&＃xff0c;这时&＃xff0c;还没有完成主从同步&＃xff0c;因此查询到的是旧值

&＃xff08;5&＃xff09;请求B将旧值写入缓存

&＃xff08;6&＃xff09;数据库完成主从同步&＃xff0c;从库变为新值

上述情形&＃xff0c;就是数据不一致的原因。还是使用双删延时策略。只是&＃xff0c;睡眠时间修改为在主从同步的延时时间基础上&＃xff0c;加几百ms。

采用这种同步淘汰策略&＃xff0c;吞吐量降低怎么办&＃xff1f;

ok&＃xff0c;那就将第二次删除作为异步的。自己起一个线程&＃xff0c;异步删除。这样&＃xff0c;写的请求就不用沉睡一段时间后了&＃xff0c;再返回。这么做&＃xff0c;加大吞吐量。

所以在先删除缓存&＃xff0c;再更新数据库的情况下&＃xff0c;可以使用延时双删的策略&＃xff0c;来保证脏数据只会存活一段时间&＃xff0c;就会被准确的数据覆盖。

在先更新数据库&＃xff0c;再删缓存的情况下&＃xff0c;缓存出现脏数据的情况虽然可能性极小&＃xff0c;但也会出现。我们依然可以用延时双删策略&＃xff0c;在请求A对缓存写入了脏的旧值之后&＃xff0c;再次删除缓存。来保证去掉脏缓存。

最后

给大家送一个小福利

资料都是免费分享的&＃xff0c;附送高清脑图&＃xff0c;高清知识点讲解教程&＃xff0c;以及一些面试真题及答案解析。送给需要的提升技术、准备面试跳槽、自身职业规划迷茫的朋友们。点我免费领取&＃xff01;&＃xff01;&＃xff01;

31)]

[外链图片转存中…(img-YPx52Nz6-1622785403133)]

推荐阅读

mysql
为何我选择了华为云GaussDB数据库

本文分享了作者选择华为云GaussDB数据库的理由，详细介绍了GaussDB(for MySQL)的技术特性和优势，以及它在金融和互联网行业的应用场景。 ... [详细]

蜡笔小新 2024-12-19 10:59:22
php
备战BAT面试：掌握这些MySQL核心问题

本文深入探讨了MySQL中常见的面试问题，包括事务隔离级别、存储引擎选择、索引结构及优化等关键知识点。通过详细解析，帮助读者在面对BAT等大厂面试时更加从容。 ... [详细]

蜡笔小新 2024-12-20 18:58:01
get
深入剖析JVM垃圾回收机制

本文详细探讨了Java虚拟机（JVM）中的垃圾回收机制，包括其意义、对象判定方法、引用类型、常见垃圾收集算法以及各种垃圾收集器的特点和工作原理。通过理解这些内容，开发人员可以更好地优化内存管理和程序性能。 ... [详细]

蜡笔小新 2024-12-20 17:24:41
php
最强阿里及大厂350道面试大全：框架+数据库+并发+开源+微服务

前言无论是对于刚入行工作还是已经工作几年的java开发者来说，面试求职始终是你需要直面的一件事情。首先梳理自己的知识体系，针对性准备，会有事半功倍的效果。我们往往会把重点放在技术上 ... [详细]

蜡笔小新 2024-12-18 15:33:00
install
SaltStack部署实践（4）JOB管理与Returns模块

目录一、salt-job管理#job存放数据目录#缓存时间设置#Others二、returns模块配置job数据入库#配置returns返回值信息#mysql安全设置#创建模块相关 ... [详细]

蜡笔小新 2024-12-22 18:53:43
triggers
优化DB2数据库性能的关键策略

本文详细介绍了优化DB2数据库性能的多种方法，涵盖统计信息更新、缓冲池调整、日志缓冲区配置、应用程序堆大小设置、排序堆参数调整、代理程序管理、锁机制优化、活动应用程序限制、页清除程序配置、I/O服务器数量设定以及编入组提交数调整等方面。通过这些技术手段，可以显著提升数据库的运行效率和响应速度。 ... [详细]

蜡笔小新 2024-12-22 16:20:33
get
优化Flask应用的并发处理：解决Mysql连接过多问题

本文探讨了在Flask应用中通过优化后端架构来应对高并发请求，特别是针对Mysql 'too many connections' 错误的解决方案。我们将介绍如何利用Redis缓存、Gunicorn多进程和Celery异步任务队列来提升系统的性能和稳定性。 ... [详细]

蜡笔小新 2024-12-21 09:21:49
get
解析云主机流量及其重要性

本文详细阐述了云主机流量的概念，探讨其对网站性能和安全的关键影响，并提供了优化配置的实用建议。 ... [详细]

蜡笔小新 2024-12-20 15:31:40
filter
深入解析Spring Cloud微服务架构与分布式系统实战

本文详细介绍了Spring Cloud在微服务架构和分布式系统中的应用，结合实际案例和最新技术，帮助读者全面掌握微服务的实现与优化。 ... [详细]

蜡笔小新 2024-12-19 16:02:50
filter
分布式架构概览与实践

本文探讨了现代分布式架构的多样性，包括高并发、多活数据中心、容器化、微服务、高可用性和弹性架构等，并介绍了与这些架构相关的重要管理技术，如DevOps、应用监控和自动化运维。文章还深入分析了分布式系统的核心概念、主要用途及类型，同时对比了单体应用与分布式服务化的优缺点。 ... [详细]

蜡笔小新 2024-12-19 15:11:28
php
SQL基础入门与数据库体系概述

本文介绍了数据库体系的基础知识，涵盖关系型数据库（如MySQL）和非关系型数据库（如MongoDB）的基本操作及高级功能。通过三个阶段的学习路径——基础、优化和部署，帮助读者全面掌握数据库的使用和管理。 ... [详细]

蜡笔小新 2024-12-22 19:17:15
split
深入解析Hadoop的核心组件与工作原理

本文详细介绍了Hadoop的三大核心组件：分布式文件系统HDFS、资源管理器YARN和分布式计算框架MapReduce。通过分析这些组件的工作机制，帮助读者更好地理解Hadoop的架构及其在大数据处理中的应用。 ... [详细]

蜡笔小新 2024-12-19 17:17:51
split
深入解析Volatile机制及其优化与应用

本文详细探讨了Java中Volatile关键字的工作原理、优化技巧及其在实际开发中的应用场景，特别是在提高多线程环境下数据可见性和减少锁竞争方面的优势。 ... [详细]

蜡笔小新 2024-12-19 10:41:14
php
Spring Cloud学习指南：深入理解微服务架构

本文介绍了微服务架构的基本概念及其在Spring Cloud中的实现。讨论了微服务架构的主要优势，如简化开发和维护、快速启动、灵活的技术栈选择以及按需扩展的能力。同时，也探讨了微服务架构面临的挑战，包括较高的运维要求、分布式系统的复杂性、接口调整的成本等问题。最后，文章提出了实施微服务时应遵循的设计原则。 ... [详细]

蜡笔小新 2024-12-19 09:25:36
php
大型服务端开发中的常见误区

本文探讨了大型服务端开发过程中常见的几个误区，包括异步任务处理不当、日志同步模式使用、网络操作未设置超时、缓存命中率及响应时间未统计、单一缓存模式、分布式缓存加锁不当以及团队管理上的误区，旨在帮助开发者避免这些常见错误。 ... [详细]

蜡笔小新 2024-12-18 14:19:10

冷月荐向_878

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章