dubbogo中的TPSLimit设计与实现滑动窗口、固定窗口有什么区别？

作者：小树苗 | 来源：互联网 | 2023-09-24 10:56

前言ApacheDubbo是由阿里开源的一个RPC框架，除了基本的RPC功能以外，还提供了一整套的服务治理相关功能。目前它已经是Apache基金会下的

前言

Apache Dubbo是由阿里开源的一个RPC框架&＃xff0c;除了基本的RPC功能以外&＃xff0c;还提供了一整套的服务治理相关功能。目前它已经是Apache基金会下的顶级项目。

而dubbogo则是dubbo的go语言实现。

最近在dubbogo的todo list上发现&＃xff0c;它还没有实现TPS Limit的模块&＃xff0c;于是就抽空实现了这个部分。

TPS limit实际上就是限流&＃xff0c;比如说限制一分钟内某个接口只能访问200次&＃xff0c;超过这个次数&＃xff0c;则会被拒绝服务。在Dubbo的Java版本上&＃xff0c;只有一个实现&＃xff0c;就是DefaultTPSLimiter。

DefaultTPSLimiter是在服务级别上进行限流。虽然dubbo的官方文档里面声称可以在method级别上进行限流&＃xff0c;但是我看了一下它的源码&＃xff0c;实际上这个是做不到的。当然&＃xff0c;如果自己通过实现Filter接口来实现method级别的限流&＃xff0c;那么自然是可以的——这样暴露了dubboJava版本实现的另外一个问题&＃xff0c;就是dubbo的TpsLimitFilter实现&＃xff0c;是不允许接入自己TpsLimiter的实现的。这从它的源码也可以看出来&＃xff1a;

它直接写死了TpsLimiter的实现。

这个实现的目前只是合并到了develop上&＃xff0c;等下次发布正式版本的时候才会发布出来。

Github: https://github.com/apache/dubbo-go/pull/237

设计思路

于是我大概参考了一下dubbo已有的实现&＃xff0c;做了一点改进。

dubbo里面的核心抽象是TpsLimiter接口。TpsLimitFilter只是简单调用了一下这个接口的方法而已&＃xff1a;

这个抽象是很棒的。但是还欠缺了一些抽象。

实际上&＃xff0c;一个TPS Limit就要解决三个问题&＃xff1a;

对什么东西进行limit。比如说&＃xff0c;对服务进行限流&＃xff0c;或者对某个方法进行限流&＃xff0c;或者对IP进行限流&＃xff0c;或者对用户进行限流&＃xff1b;
如何判断已经over limitation。这是从算法层面上考虑&＃xff0c;即用什么算法来判断某个调用进来的时候&＃xff0c;已经超过配置的上限了&＃xff1b;
被拒绝之后该如何处理。如果一个请求被断定为已经over limititation了&＃xff0c;那么该怎么处理&＃xff1b;

所以在TpsLimiter接口的基础上&＃xff0c;我再加了两个抽象&＃xff1a;

TpsLimiter

TpsLimitStrategy

RejectedExecutionHandler

TpsLimiter对应到Java的TpsLimiter&＃xff0c;两者是差不多。在我的设想里面&＃xff0c;它既是顶级入口&＃xff0c;还需要承担解决第一个问题的职责。

而TpsLimitStrategy则是第二个问题的抽象的接口定义。它代表的是纯粹的算法。该接口完全没有参数&＃xff0c;实际上&＃xff0c;所有的实现需要维护自身的状态——对于大部分实现而言&＃xff0c;它大概只需要获取一下系统时间戳&＃xff0c;所以不需要参数。

最后一个接口RejectedExecutionHandler代表的是拒绝策略。在TpsLimitFilter里面&＃xff0c;如果它调用TpsLimiter的实现&＃xff0c;发现该请求被拒绝&＃xff0c;那么就会使用该接口的实现来获取一个返回值&＃xff0c;返回给客户端。

实现

其实实现没太多好谈的。不过有一些微妙的地方&＃xff0c;我虽然在代码里面注释了&＃xff0c;但是我觉得在这里再多说一点也是可以的。

首先提及的就是拒绝策略RejectedExecutionHandler&＃xff0c;我就是提供了一种实现&＃xff0c;就是随便log了一下&＃xff0c;什么都没做。因为这个东西是强业务相关的&＃xff0c;我也不能提供更加多的通用的实现。

方法与服务双重支持的TpsLimiter

TpsLimiter我只有一个实现&＃xff0c;那就是MethodServiceTpsLimiterImpl。它就是根据配置&＃xff0c;如果方法级别配置了参数&＃xff0c;那么会在方法级别上进行限流。否则&＃xff0c;如果在服务级别&＃xff08;ServiceKey&＃xff09;上有配置&＃xff0c;那么会在服务级别进行限流。

举个最复杂的例子&＃xff1a;服务A限制100&＃xff0c;有四个方法&＃xff0c;方法M1配置限制40&＃xff0c;方法M2和方法M3无配置&＃xff0c;方法M4配置限制-1&＃xff1a;那么方法M1会单独限流40&＃xff1b;M2和M3合并统计&＃xff0c;被限制在100&＃xff1b;方法M4则会被忽略。

用户可以配置具体的算法。比如说使用我接下来说的&＃xff0c;我已经实现的三种实现。

FixedWindow和ThreadSafeFixedWindow

FixedWindow直接对应到Java的DefaultTpsLimiter。它采用的是fixed-window算法&＃xff1a;比如说配置了一分钟内只能调用100次。假如从00:00开始计时&＃xff0c;那么00:00-01:00内&＃xff0c;只能调用100次。只有到达01:00&＃xff0c;才会开启新的窗口01:00-02:00。如图&＃xff1a;

Fixed-Window图示

Fixed-Window实现

这里有一个很有意思的地方。就是这个实现&＃xff0c;是一个几乎线程安全但是其实并不是线程安全的实现。

在所有的实现里面&＃xff0c;它是最为简单&＃xff0c;而且性能最高的。我在衡量了一番之后&＃xff0c;还是没把它做成线程安全的。事实上&＃xff0c;Java版本的也不是线程安全的。

它只会在多个线程通过第67行的检测之后&＃xff0c;才会出现并发问题&＃xff0c;这个时候就不是线程安全了。但是在最后的return语句中&＃xff0c;那一整个是线程安全的。它因为不断计数往上加&＃xff0c;所以多个线程同时跑到这里&＃xff0c;其实不会有什么问题。

现在我要揭露一个最为奇诡的特性了&＃xff1a;并发越高&＃xff0c;那么这个raise condition就越严重&＃xff0c;也就是说越不安全。

但是从实际使用角度而言&＃xff0c;有极端TPS的还是比较少的。对于那些TPS只有几百每秒的&＃xff0c;是没什么问题的。

为了保持和dubbo一致的特性&＃xff0c;我把它作为默认的实现。

此外&＃xff0c;我还为它搞了一个线程安全版本&＃xff0c;也就是ThreadSafeFixedWindowTpsLimitStrategyImpl&＃xff0c;只是简单的用sync封装了一下&＃xff0c;可以看做是一个Decorator模式的应用。

如果强求线程安全&＃xff0c;可以考虑使用这个。

SlidingWindow

这是我比较喜欢的实现。它跟网络协议里面的滑动窗口算法在理念上是比较接近的。

Sliding-Window

具体来说&＃xff0c;假如我设置的同样是一分钟1000次&＃xff0c;它统计的永远是从当前时间点往前回溯一分钟内&＃xff0c;已经被调用了多少次。如果这一分钟内&＃xff0c;调用次数没超过1000&＃xff0c;请求会被处理&＃xff0c;如果已经超过&＃xff0c;那么就会拒绝。

我再来描述一下&＃xff0c;SldingWindow和FixedWindow两种算法的区别。这两者很多人会搞混。假如当前的时间戳是00:00&＃xff0c;两个算法同时收到了第一个请求&＃xff0c;开启第一个时间窗口。

那么FixedWindow就是00:00-01:00是第一个窗口&＃xff0c;接下来依次是01:00-02:00, 02:00-03:00, ...。当然假如说01:00之后的三十秒内都没有请求&＃xff0c;在01:31又来了一个请求&＃xff0c;那么时间窗口就是01:31-02:31。

而SildingWindow则没有这种概念。假如在01:30收到一个请求&＃xff0c;那么SlidingWindow统计的则是00:30-01:30内有没有达到1000次。它永远计算的都是接收到请求的那一刻往前回溯一分钟的请求数量。

如果还是觉得有困难&＃xff0c;那么简单来说就是FixedWindow往后看一分钟&＃xff0c;SlidingWindow回溯一分钟。

这个说法并不严谨&＃xff0c;只是为了方便理解。

在真正写这个实现的时候&＃xff0c;我稍微改了一点点&＃xff1a;

我用了一个队列来保存每次访问的时间戳。一般的写法&＃xff0c;都是请求进来&＃xff0c;先把已经不在窗口时间内的时间戳删掉&＃xff0c;然后统计剩下的数量&＃xff0c;也就是后面的slow path的那一堆逻辑。

但是我改了的一点是&＃xff0c;我进来直接统计队列里面的数量——也就是请求数量&＃xff0c;如果都小于上限&＃xff0c;那么我可以直接返回true。即quick path。

这种改进的核心就是&＃xff1a;我只有在检测到当前队列里面有超过上限数量的请求数量时候&＃xff0c;才会尝试删除已经不在窗口内的时间戳。

这其实就是&＃xff0c;是每个请求过来&＃xff0c;我都清理一下队列呢&＃xff1f;还是只有队列元素超出数量了&＃xff0c;我才清理呢&＃xff1f;我选择的是后者。

我认为这是一种改进……当然从本质上来说&＃xff0c;整体开销是没有减少的——因为golang语言里面List的实现&＃xff0c;一次多删除几个&＃xff0c;和每次删除一个&＃xff0c;多删几次&＃xff0c;并没有多大的区别。

算法总结

无论是FixedWindow算法还是SlidingWindow算法都有一个固有的缺陷&＃xff0c;就是这个时间窗口难控制。

我们设想一下&＃xff0c;假如说我们把时间窗口设置为一分钟&＃xff0c;允许1000次调用。然而&＃xff0c;在前十秒的时候就调用了1000次。在后面的五十秒&＃xff0c;服务器虽然将所有的请求都处理完了&＃xff0c;然是因为窗口还没到新窗口&＃xff0c;所以这个时间段过来的请求&＃xff0c;全部会被拒绝。

解决的方案就是调小时间窗口&＃xff0c;比如调整到一秒。但是时间窗口的缩小&＃xff0c;会导致FixedWindow算法的raise condition情况加剧。SlidingWindow也会受影响&＃xff0c;但是影响要小很多。

那些没有实现的

基于特定业务对象的限流

举例来说&＃xff0c;某些特殊业务用的针对用户ID进行限流和针对IP进行限流&＃xff0c;我就没有在dubbogo里面实现。有需要的可以通过实现TpsLimiter接口来完成。

全局TPS limit

这篇文章之前讨论的都是单机限流。如果全局限流&＃xff0c;比如说针对某个客户&＃xff0c;它购买的服务是每分钟调用100次&＃xff0c;那么就需要全局限流——虽然这种case都不会用Filter方案&＃xff0c;而是另外做一个API接入控制。

比如说&＃xff0c;很常用的使用Redis进行限流的。针对某个客户&＃xff0c;一分钟只能访问100次&＃xff0c;那我就用客户ID做key&＃xff0c;value设置成List&＃xff0c;每次调用过来&＃xff0c;随便塞一个值进去&＃xff0c;设置过期时间一分钟。那么每次统计只需要统计当前key的存活的值的数量就可以了。

这种我也没实现&＃xff0c;因为好像没什么需求。国内讨论TPS limit都是讨论单机TPS limit比较多。

这个同样可以通过实现TpsLimiter接口来实现。

Leaky Bucket算法

这个本来可以是TpsLimitStrategy的一种实现的。后来我觉得&＃xff0c;它其实并没有特别大的优势——虽然号称可以做到均匀&＃xff0c;但是其实并做不到真正的均匀。通过调整SlidingWindow的窗口大小&＃xff0c;是可以接近它宣称的均匀消费的效果的。比如说调整到一秒&＃xff0c;那其实就已经很均匀了。而这并不会带来多少额外的开销。

作者&＃xff1a;flycash
链接&＃xff1a;https://www.jianshu.com/p/5e4d490f163c
来源&＃xff1a;简书
著作权归作者所有。商业转载请联系作者获得授权&＃xff0c;非商业转载请注明出处。

推荐阅读

ip
Tomcat/Jetty为何选择扩展线程池而不是使用JDK原生线程池？

本文探讨了Tomcat和Jetty选择扩展线程池而不是使用JDK原生线程池的原因。通过比较IO密集型任务和CPU密集型任务的特点，解释了为何Tomcat和Jetty需要扩展线程池来提高并发度和任务处理速度。同时，介绍了JDK原生线程池的工作流程。 ... [详细]

蜡笔小新 2023-12-13 16:18:09
uri
SpringBoot uri统一权限管理的实现方法及步骤详解

本文详细介绍了SpringBoot中实现uri统一权限管理的方法，包括表结构定义、自动统计URI并自动删除脏数据、程序启动加载等步骤。通过该方法可以提高系统的安全性，实现对系统任意接口的权限拦截验证。 ... [详细]

蜡笔小新 2023-12-14 16:11:30
cmd
如何查询zone下的表的信息

本文介绍了如何通过TcaplusDB知识库查询zone下的表的信息。包括请求地址、GET请求参数说明、返回参数说明等内容。通过curl方法发起请求，并提供了请求示例。 ... [详细]

蜡笔小新 2023-12-12 08:26:32
cmd
JS兼容总结及解决方法

本文总结了在编写JS代码时，不同浏览器间的兼容性差异，并提供了相应的解决方法。其中包括阻止默认事件的代码示例和猎取兄弟节点的函数。这些方法可以帮助开发者在不同浏览器上实现一致的功能。 ... [详细]

蜡笔小新 2023-12-09 17:31:06
数组
ejava,刘聪dejava

本文目录一览：1、什么是Java？2、java ... [详细]

蜡笔小新 2023-12-09 09:28:18
int
Java容器中的compareto方法排序原理解析

本文从源码解析Java容器中的compareto方法的排序原理，讲解了在使用数组存储数据时的限制以及存储效率的问题。同时提到了Redis的五大数据结构和list、set等知识点，回忆了作者大学时代的Java学习经历。文章以作者做的思维导图作为目录，展示了整个讲解过程。 ... [详细]

蜡笔小新 2023-12-14 13:53:31
int
t-io 2.0.0发布-法网天眼第一版的回顾和更新说明

本文回顾了t-io 1.x版本的工程结构和性能数据，并介绍了t-io在码云上的成绩和用户反馈。同时，还提到了@openSeLi同学发布的t-io 30W长连接并发压力测试报告。最后，详细介绍了t-io 2.0.0版本的更新内容，包括更简洁的使用方式和内置的httpsession功能。 ... [详细]

蜡笔小新 2023-12-14 10:17:48
int
eclipse学习（第三章：ssh中的Hibernate）——11.Hibernate的缓存（2级缓存，get和load）

本文介绍了eclipse学习中的第三章内容，主要讲解了ssh中的Hibernate的缓存，包括2级缓存和get方法、load方法的区别。文章还涉及了项目实践和相关知识点的讲解。 ... [详细]

蜡笔小新 2023-12-14 00:31:35
int
关于cuowu类的错误提示和使用AdjustmentListener的问题

本文讨论了一个关于cuowu类的问题，作者在使用cuowu类时遇到了错误提示和使用AdjustmentListener的问题。文章提供了16个解决方案，并给出了两个可能导致错误的原因。 ... [详细]

蜡笔小新 2023-12-13 22:09:56
int
解决Mac上无法使用localhost连接mysql的问题

本文介绍了在Mac上搭建php环境后无法使用localhost连接mysql的问题，并通过将localhost替换为127.0.0.1或本机IP解决了该问题。文章解释了localhost和127.0.0.1的区别，指出了使用socket方式连接导致连接失败的原因。此外，还提供了相关链接供读者深入了解。 ... [详细]

蜡笔小新 2023-12-13 17:48:58
uri
开发笔记：解决播放框架内容安全策略设置不起作用的问题

本文介绍了作者在开发过程中遇到的问题，即播放框架内容安全策略设置不起作用的错误。作者通过使用编译时依赖注入的方式解决了这个问题，并分享了解决方案。文章详细描述了问题的出现情况、错误输出内容以及解决方案的具体步骤。如果你也遇到了类似的问题，本文可能对你有一定的参考价值。 ... [详细]

蜡笔小新 2023-12-13 16:03:19
int
Java高并发程序设计学习-线程安全的概念与synchronized

本文介绍了Java高并发程序设计中线程安全的概念与synchronized关键字的使用。通过一个计数器的例子，演示了多线程同时对变量进行累加操作时可能出现的问题。最终值会小于预期的原因是因为两个线程同时对变量进行写入时，其中一个线程的结果会覆盖另一个线程的结果。为了解决这个问题，可以使用synchronized关键字来保证线程安全。 ... [详细]

蜡笔小新 2023-12-13 15:43:03
hash
单页面应用 VS 多页面应用的区别和适用场景

本文主要介绍了单页面应用（SPA）和多页面应用（MPA）的区别和适用场景。单页面应用只有一个主页面，所有内容都包含在主页面中，页面切换快但需要做相关的调优；多页面应用有多个独立的页面，每个页面都要加载相关资源，页面切换慢但适用于对SEO要求较高的应用。文章还提到了两者在资源加载、过渡动画、路由模式和数据传递方面的差异。 ... [详细]

蜡笔小新 2023-12-10 19:31:50
hash
pack布局管理器的使用方法及注意事项

本文介绍了pack布局管理器在Perl/Tk中的使用方法及注意事项。通过调用pack()方法，可以控制部件在显示窗口中的位置和大小。同时，本文还提到了在使用pack布局管理器时，应注意将部件分组以便在水平和垂直方向上进行堆放。此外，还介绍了使用Frame部件或Toplevel部件来组织部件在窗口内的方法。最后，本文强调了在使用pack布局管理器时，应避免在中间切换到grid布局管理器，以免造成混乱。 ... [详细]

蜡笔小新 2023-12-10 16:03:24
hash
解决mysql 5.1启动问题的方法

本文介绍了解决mysql 5.1启动问题的方法，通过修改my.ini文件中的相关配置，包括innodb_data_home_dir和skip-innodb等，可以解决启动问题。同时还介绍了如何调整内存池来存储metadata信息。 ... [详细]

蜡笔小新 2023-12-09 21:14:55

小树苗

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章