一文搞定“缓存”

作者：UU常璐图_302 | 来源：互联网 | 2020-11-23 20:26

javascript栏目介绍搞定缓存。

Javascript栏目介绍搞定缓存。

1、当client1发起请求时，Cache也就是代理服务器（共享缓存），转发这条请求给源服务器。源服务器返回响应，并在Cache-Control头部中设定可以缓存100秒。接着在Cache中就会开启一个定时器Age，将响应带上Age：0头部返回给client1。

2、过了10秒后，client2发送相同的请求，Cache中的缓存还没有过期，就带上Age：10头部返回缓存中的响应给client2。

3、过了100秒后，client3发送同样的请求，这时Cache中的缓存已经过期了，就像前面说到那样用条件请求头部If-None-Match带上缓存的指纹发给源服务器。当源服务认为此缓存还能用，就返回304状态码给Cache。Cache就重新计时，从缓存中找出响应带上Age：0头部返回给Client3。

缓存机制

HTTP协议中存在相关的缓存机制，API中也可以直接使用这些机制来管理缓存。HTTP的缓存机制在RFC7234中进行了详细的定义，分为：过期模型(Expiration Model)和验证模型(Validation Model)两类

过期模型是指预先决定响应数据的保存期限，当到达期限后就会再次访问服务器端来重新获得所需的数据
验证模型是指会轮询当前保存的缓存数据是否为最新数据，并只在服务器端进行数据更新时，才会重新获得数据。

在HTTP中，缓存处于可用的状态时称为fresh（新鲜）状态，而处于不可用的状态时则称为stale（不新鲜）状态。

过期模型

过期模型可以通过服务器的响应消息里包含何时过期的信息来实现。HTTP1.1中定义了两种实现方法：一个方法是用Cache-Control响应消息首部，另一个方法就是用Expires响应消息首部。

// 1
Expires: Fri, 01 Oct 2020  00:00:00 GMT
// 2
Cache-Control: max-age=3600

Expires首部从HTTP1.0就已经存在了，它是用绝对时间来表示到期，并使用RFC1123中定义的时间格式来描述。Cache-Control则是HTTP1.1中定义的表示从当前时间开始所经过的秒数。

这两个首部该使用哪个，则是由返回的数据的性质决定的。对于一开始就知道在某个特定的日期会更新的数据，比如天气预报这种每天在相同时间进行更新的数据，可以使用Expires首部来指定执行更新操作的时间。对于今后不会使用更新的数据或静态数据等，可以通过指定一个未来非常遥远的日期，使得获取的缓存数据始终保存下去。但根据HTTP1.1的规定，不允许设置超过1年以上的时间，因此未来非常遥远的时间最多也只能是1年后的日期了。

Expires: Fri, 01 Oct 2021  00:00:00 GMT

而对于不是定期更新，但如果更新频率在某种程度上是一定的，或者虽然更新频率不低但不希望频繁访问服务器端，对于这种情况可以使用Cache-Control首部。

如果Expires和Cache-Control首部同时使用时，Cache-Control首部优先判断。

上面Cache-Control示例中使用到了max-age关键字，max-age计算会使用名为Date的首部。该首部用来显示服务器端生成响应信息的时间信息。从该时间开始计算，当经过的时间超过max-age值时，就可以认为缓存已到期。

Date: Expires: Fri, 30 Sep 2020  00:00:00 GMT

Date首部表示服务器端生成响应信息的时间信息。根据HTTP协议的规定，除了几个特殊的情况之外，所有的HTTP消息都要加上Date首部。

Date首部的时间信息必须使用名为HTTP时间的格式来描述。在计算缓存时间时，会用到该首部的时间信息，这时就可以使用Date首部信息来完成时间的同步操作，做到即便客户端擅自修改日期等配置信息。

验证模型

与到期模型只根据所接收的响应信息来决定缓存的保存时间相对，验证模型采用了询问服务器的方式来判断当前时间所保存的缓存是否有效。

验证模型在检查缓存的过程中会不时地去访问网络。在执行验证模型时，需要应用程序服务器支持附带条件地请求。附带条件地请求是指前端向服务器端发送地“如果现在保存地信息有更新，请给我更新后地信息”。在整个处理的过程中，前端会发送同“过去某个时间点所获得的数据”有关的信息，随后只有在服务器端的数据发生更新时，服务器端才会返回更新的数据，不然就只会返回304(Not Modified)状态码来告知前端当前服务器端没有更新的数据。

要进行附带条件的请求，就必须向服务器端传达“前端当前保存的信息的状态”，为此需要用到最后更新日期或实体标签（Entity Tag）作为指标。顾名思义，最后更新日期表示当前数据最后一次更新的日期：而实体标签则是表示某个特定资源版本的标识符，十一串表示指纹印（Finger Print)的字符串。例如响应数据的MD5散列值等，整个字符串会随着消息内容的变化而变化。这些信息会在服务器端生成，并被包含在响应信息的首部发送给前端，前端会将其缓存一同保存下来，用于附带条件的请求。

最后更新日期和实体标签会被分别填充到Last-Modified和ETag响应消息首部返回给前端

Last-Modified: Fri, 01 Oct 2021  00:00:00 GMT
ETag: &＃39;ff568sdf4545687fadf4dsa545e4f5s4f5se45&＃39;

前端使用最后更新日期执行附带条件的请求时，会用到Modified-Since首部。在使用实体标签时，会用到If-None-Match首部

GET /v1/user/1
If-Modified-Since: Fri, 01 Oct 2021  00:00:00 GMT

GET /v1/user/1
If-None-Match: &＃39;ff568sdf4545687fadf4dsa545e4f5s4f5se45&＃39;

服务器端会检查前端发送过来的信息和当前信息，如果没有发生更新则返回304状态码。如果有更新，则会同应答普通请求一样，在返回200状态码的同时将更新内容一并返回给前端，这时也会带上新的最后更新日期和实体标签。当服务器返回304状态码时，响应消息为空，从而节约了传输的数据量。

在HTTP协议中，ETag有强验证与弱验证两个概念。

执行强验证的ETag
ETag: &＃39;ffsd5f46s12wef13we2f13dsd21fsd32f1&＃39;
执行弱验证的ETag
ETag: W/&＃39;ffsd5f46s12wef13we2f13dsd21fsd32f1&＃39;

强验证是指服务器端同客户端的数据不能有一个字节的差别，必须完全一样；而弱验证是指即使数据不完全一样，只要从资源意义的角度来看没有发生变化，就可以视为相同的数据。例如广告信息，虽然每次访问时这些广告的内容都会有所改变，但它们依然是相同的资源，这种情况下便可以使用弱验证。

启发式过期

HTTP1.1里提到了当服务器端没有给出明确的过期时间时，客户端可以决定大约需要将缓存数据保存多久。这时客户端就要根据服务器端的更新频率、具体状况等信息，自行决定缓存的过期时间，这个方法称为启发式过期。

例如前端通过观察Last-Modified，如果发现最后一次更新是在1年前，那就意味着再将缓存数据保存一段时间也不会有什么问题；如果发现到目前为止访问的结果是1天只有1次更新，那就意味着将缓存保存半天的时间或许可行。像这样，前端能通过独立判断来减少访问次数。

虽然API是否允许使用启发式过期的方法取决于API的特性，但由于服务端对缓存的更新和控制理解最为深刻，因此服务器端通过Cache-Control、Expires等准确无误地向前端返回“将缓存数据保存多久”的信息，对于交互双方而言都是比较理想的做法。但如果不返回，服务器端就需要通过Last-Modified等首部信息来告知前端

使用`Vary`指定缓存单位

在实施缓存时可能还需要同时指定Vary首部。在实施缓存时，Vary用于指定除URI外使用哪个请求首部项目来确定唯一的数据。使用Vary是因为即使URI相同，获取的数据有时也会因请求首部内容的不同而发生变化。只有vary头部指定的头部必须与请求中的头部相匹配才能使用缓存。

vary的定义：

"*"：意味着一定匹配失败
1个或多个field-name：指定的头部必须与请求中的头部相匹配才能使用缓存

1、当Client1携带Accept-Encoding：*头部的GET请求发送给server。server返回的是gzip编码的响应，以及vary：Content-Encoding头部，表示着编码方式一样的时候才能使用缓存。

2、当Client2携带Accept-Encoding：br头部的GET请求发送给server，这时请求的是br编码。所以Cache不能使用缓存，因为不匹配vary的中的值，只能转发请求给源服务器server。

3、当Client3携带Accept-Encoding：br头部的GET请求发送给server，这时Cache有br编码的缓存，能匹配vary头部的值，所以能使用缓存返回。

一般而言，Vary首部用于HTTP经由代理服务器进行交互的场景，特别是在代理服务器拥有缓存功能时。但是有时服务端无法得知前端的访问是否经由代理服务器，这种情况下就需要用到服务器驱动的内容协商机制，Vary首部也就成了必选项。

Cache-Control

Cache-Control头部取值范围非常复杂。

Cache-Control的定义是：

必选的token值
可选的“=”，加上带引号的值或者1个或多个十进制的数字也就是指定的秒数

Cache-Control既可以在请求中使用，也可以在响应是使用。而且相同的值在请求和响应中的含义是不一样的。

Cache-Control值有三种用法：

1、直接使用token
2、token值+ &＃39;=&＃39; + 十进制数字
3、token值+ &＃39;=&＃39; + 相应的头部 / 直接使用token值

在请求中的应用

在请求中Cache-Control的取值、用法及其含义：@后面表示第几种用法

max-age@2：告诉服务器，客户端不会接收Age超出max-age秒的缓存
max-stale@2：告诉服务器，即使缓存不再新鲜，但过期秒数没有超过max-stale时，客户端仍打算使用。若max-stale后没有值，则表示无论过期多久，客户端都可使用。
min-fresh@2：告诉服务器，Age至少经过min-fresh秒后缓存才可使用
no-cache@1：告诉服务器，不能直接使用已有缓存作为响应返回，除非带着缓存条件到上游服务器得到304状态码才可使用现有缓存。
no-store@1：告诉各代理服务器，不要对该请求的响应缓存
no-transform@1：告诉代理服务器不要修改消息包体的内容
only-if-cached@1：告诉服务器仅能返回缓存的响应，否则若没有缓存则返回504错误码

在响应中的应用

在响应中Cache-Control的取值及其含义：

max-age@2：告诉客户端缓存Age超出max-age秒后则缓存过期
s-maxage@2：与max-age类似，但仅针对共享缓存，且优先级高于max-age和expires
must-revaildate@1：告诉客户端一旦缓存过期，必须向服务器验证后才可使用
proxy-revalidate@1：与must-revaildate类似，但它仅对代理服务器的共享缓存有效
no-cache@3： 1、告诉客户端不能直接使用缓存的响应，使用前必须在源服务器验证得到304返回码。2、如果no-cache后指定头部，则若客户端的后续请求及响应中不含有这些头部则可直接使用缓存
no-store@1：告诉所有下游服务器但不能对响应进行缓存
no-transform：告诉代理服务器不能修改消息包体的内容
public@1：表示无论私有缓存或者共享缓存，皆可将该响应缓存
private@3： 1、表示该响应不能被代理服务器作用共享缓存使用。2、若priate后指定头部，则告诉代理服务器不能缓存指定的头部，可以缓存其他头部

相关免费学习推荐：Javascript（视频）

以上就是一文搞定“缓存”的详细内容，更多请关注第一PHP社区其它相关文章！

推荐阅读

php
搭建个人博客：WordPress安装详解

计划建立个人博客来分享生活与工作的见解和经验，选择WordPress是因为它专为博客设计，功能强大且易于使用。 ... [详细]

蜡笔小新 2024-11-22 11:13:36
join
PHP与MySQL实现高效分页查询

本文探讨了如何在PHP与MySQL环境中实现高效的分页查询，包括基本的分页实现、性能优化技巧以及高级的分页策略。 ... [详细]

蜡笔小新 2024-11-22 05:45:48
数组
H5技术实现经典游戏《贪吃蛇》

本文将分享一个使用HTML5技术实现的经典小游戏——《贪吃蛇》。通过H5技术，我们将探讨如何构建这款游戏的两种主要玩法：积分闯关和无尽模式。 ... [详细]

蜡笔小新 2024-11-21 20:16:59
post
Oracle VM VirtualBox 使用指南：创建静态网页及高级功能

本文详细介绍了如何在Oracle VM VirtualBox中实现主机与虚拟机之间的数据交换，包括安装Guest Additions增强功能，以及如何利用这些功能进行文件传输、屏幕调整等操作。 ... [详细]

蜡笔小新 2024-11-21 18:13:22
utf-8
SIP基础概览

本文介绍了SIP（Session Initiation Protocol，会话发起协议）的基本概念、功能、消息格式及其实现机制。SIP是一种在IP网络上用于建立、管理和终止多媒体通信会话的应用层协议。 ... [详细]

蜡笔小新 2024-11-21 17:42:08
utf-8
我的读书清单（持续更新）

我的读书清单（持续更新）201705311.《一千零一夜》2006（四五年级）2.《中华上下五千年》2008（初一）3.《鲁滨孙漂流记》2008（初二）4.《钢铁是怎样炼成的》20 ... [详细]

蜡笔小新 2024-11-21 13:01:23
utf-8
解决PHP项目在服务器无法抓取远程网页内容的问题

本文探讨了在使用PHP进行后端开发时，遇到的一个常见问题：即在本地环境中能够正常通过CURL获取远程网页内容，但在服务器上却无法实现。我们将分析可能的原因并提供解决方案。 ... [详细]

蜡笔小新 2024-11-21 10:31:32
main
Web动态服务器Python基本实现

Web动态服务器Python基本实现 ... [详细]

蜡笔小新 2024-11-21 08:01:30
main
从CodeIgniter中提取图像处理组件

本指南旨在帮助开发者在未使用CodeIgniter框架的情况下，如何独立使用其强大的图像处理功能，包括图像尺寸调整、创建缩略图、裁剪、旋转及添加水印等。 ... [详细]

蜡笔小新 2024-11-20 19:57:35
config
为何Compose与Swarm之后仍有Kubernetes的诞生？

探讨在已有Compose和Swarm的情况下，Kubernetes是如何以其独特的设计理念和技术优势脱颖而出，成为容器编排领域的领航者。 ... [详细]

蜡笔小新 2024-11-22 09:26:11
config
After Effects 十大实用可复制表达式

本文介绍了After Effects中十个最常用的可复制表达式，这些表达式能够帮助用户快速实现各种动态效果，提升工作效率。 ... [详细]

蜡笔小新 2024-11-21 21:12:58
config
人生需不断前行，适时放下过去，重塑自我（图）

生活中的每个人都有可能陷入停滞不前的困境，适时地改变生活方式，如通过骑行等运动，不仅能够改善身体健康，还能在心理上带来新的启示与成长。 ... [详细]

蜡笔小新 2024-11-21 21:05:41
config
精选煲机软件推荐：提升耳机音质的秘密武器

本文介绍了几款市面上流行的煲机软件，包括它们的特点、使用方法以及如何通过这些工具有效提升耳机和音箱的音质。 ... [详细]

蜡笔小新 2024-11-21 20:40:13
require
精选10款Python框架助力并行与分布式机器学习

随着神经网络模型的不断深化和复杂化，训练这些模型变得愈发具有挑战性，不仅需要处理大量的权重，还必须克服内存限制等问题。本文将介绍10款优秀的Python框架，帮助开发者高效地实现分布式和并行化的深度学习模型训练。 ... [详细]

蜡笔小新 2024-11-20 19:44:05
require
腾讯云服务器续费指南：轻松完成资源续订

本文详细介绍了腾讯云服务器的续费方法，包括单台资源续费、批量资源续费以及自动续费设置，帮助用户高效管理云资源。 ... [详细]

蜡笔小新 2024-11-20 18:44:36