热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

闲鱼如何保障交易链路质量

背景闲鱼作为一款垂直交易社区APP,拥有复杂多样的业务场景:涉及c2c、回收寄卖、租房租赁、见面交易、验货担保等,复杂多变的交易模式。比

背景

闲鱼作为一款垂直交易社区APP,拥有复杂多样的业务场景:涉及c2c、回收寄卖、租房租赁、见面交易、验货担保等,复杂多变的交易模式。比如验货流程:

  • 涉及39个状态机节点
  • 横跨10+应用系统
  • 涉及6个业务部门的合作
  • 涉及接口几十个

需要保证每个接口、每个场景切实可行,稍微有一点点问题,就会涉及到人民币的味道,实际工作中,我们遇到各种各样的问题,比较棘手的问题如下:

问题

业务先赢的快速迭代模式下,全靠人工主力进行测试验证,测完新功能,还得回归老功能,一个小需求也须要好几个人日,版本PTM也要回归好几遍,ROI并不乐观,以下2个问题比较突出:

  1. 交易业务强依赖中台,沟通成本高,跨团队协作难,迭代效率低,测试环境下如何自洽?
  2. 复杂多样交易模式下,如何支撑需求稳步迭代上线以及日常回归验证?

测试策略-自动化

闲鱼质量基建正在快马加鞭进行中,针对闲鱼多样的交易模式,全靠人力是不可行的,累不说,改动、风险漏评估也时有发生。对此,我们根据接口->链路的策略,探索对比了几个不同的方案,在保证每个接口OK的基础上,保障全链路。

接口层

对于每一个大型应用程序来说,接口数量会不断增加,代码变更频率越来越大、系统不定期重构,这个接口的质量怎么来保障?传统编写脚本来进行的方式,投入的人力、时间成本过大,在实际的测试过程中我们探索了一些接口测试的新想法。目前业界公认的有效方式是基于引流回放的自动化测试,实现方案业内众说纷纭各有其词,但万变不离其中,引用下面这段总结,简单明了

一种是黑盒测试思路,它在线上接口请求时采集线上流量(主要是请求参数和结果),然后使用和线上环境相同的环境(数据库共用等)下用采集到的流量重新触发请求,然后断言被请求的返回值是不是和录制时的一致。这种方法比较适合对Get类型的接口进行测试,而对于写操作的请求容易造成数据污染,再加上所采集流量的数据状态(数据时效性)、环境依赖性(各种中间件、接口内部请求的RPC调用)等因素,所以这种测试方式具有一些局限性,不能满足实际测试场景中复杂的需求。

另一种思路相对白盒,主要是通过智能化的Mock手段,流量采集时采集代码运行过程中所依赖的外部中间件或者RPC调用的返回结果,当流量回放时,能够Mock本机程序对外的依赖中有可能产生变化的内容,使测试更关注本地接口的代码逻辑。

阿里集团内部,基于流量回放的思想,主要实现了2种不同的流量录制回放方案,一种是基于doom的天启/暴雪,一种是基于JVM-Sandbox的凤凰,两种实现都借力于JVM AOP。

  • 天启/暴雪
  • 天启/暴雪,其底层采用的是doom进行流量录制,其原理如下

    doom原理图
    主要流程是:

  1. 通过Java agent挂在JVM中的client以ASM的AOP方式采集主调用(采集或回放时的入口方法)的入参、返回值、子调用(应用执行过程中的一次方法调用,采集机器会采集该方法的入参和返回值用于回放时执行到该方法进行mock)的入参和返回值,然后将采集到的数据上传至server (离线模式);
  2. 回放时,client收到接口回放请求后,会执行该接口的本地逻辑,对于子调用则用采集的入参和结果进行mock;
  3. 将采集的流量和回放的结果数据进行对比。

doom方式,业务应用系统需要引入Jar包,修改启动类,修改JVM挂载agent,有部分的业务侵入性。

- 凤凰凤凰,也是采用JVM AOP实现的流量录制方案,理念和doom差不多,凤凰整体架构底层基于JVM-Sandbox(阿里开源的一款 JVM 平台非侵入式运行期 AOP 解决方案,通过字节码增强实现方法级别的AOP功能)输出模块原子能力。录制时,记录了发生调用的方法,入参、返回值和调用发生的顺序,以链式数据结构存储,回放时进行接口逻辑执行和子调用mock。
![凤凰录制回放.png](https://gw.alicdn.com/imgextra/i2/O1CN01m49rqS1rsh7EMIakW_!!6000000005687-2-tps-442-331.png)
凤凰录制回放
凤凰无需代码侵入修改,不需要修改应用启动参数,相对来说,对业务代码影响小,但是有应用结构要求。考虑成本和风险,以及我们的应用结构,闲鱼采用基于Sandbox的凤凰流量录制回放进行保障,变更上线流程卡点。
研发过程中,也会遇到各种各样的流量回放问题,比如用例过期,需要人工清楚重新录制。我们现在是采用定时任务自动清除重新录制的方式解决。
下面是我们的一个场景例子:
![image.png](https://gw.alicdn.com/imgextra/i3/O1CN01bR7Yqe1qfaA29uZCx_!!6000000005523-2-tps-1318-418.png)


链路层

在基于流量录制、回放比对的接口测试过程中,我们发现这种机制对于单应用的质量保障比较实用,但是对于跨应用的链路验证、核心写操作、外调用,以及系统重构类、方案改造等大需求就有些不足,链路级的解决解决方案接踵而至。

  • Thub + 微服务

测试环境下,对于全链路上下游的强依赖,措施之一是开发测试服务化能力,建立自洽能力,测试环境下解藕对于外界诸如交易中台、菜鸟裹裹的依赖,测试环境能进行全链路闭环。
落地首要任务是梳理业务全链路节点:

- 主干链路上的每一个MTOP接口,以及接口的上下游依赖- 内部应用、中台应用、外部商家的依赖- 数据流以及TDDL梳理

业务梳理完整,进行测试服务化接口开发。下面是我们截取的一部分链路case:

同时,诸如测试环境由于依赖方测试环境不稳定block测试的情况,我们提供测试服务化接口进行封装,暴露成下单、验货等服务化能力内置于闲鱼质量平台,用于开发、测试在研发过程中使用。

  • 天算平台

天算平台,利用影子库,全链路压测的模式,线上业务数据和测试数据隔离,测试库copy线上库一部分数据。主要实现的方式是将线上的场景进行固化仿真,全链路执行,并且在执行的过程中进行所有数据变更的比对,用户可以选择任何代码版本的基线和变更版本进行对比。
大致流程

天算能力基本能满足闲鱼的交易链路,闲鱼建立了主链路相关影子库,影子链路正在调试中,用于交易服务端的全链路巡检。 同时,影子链路有诸如业务变更导致影子数据过期的问题,这个方案则主要是用于业务比较稳定的业务,新业务或者不断迭代更新的业务并未all in这个方案。

总结

综上,目前闲鱼交易,接口层用基于jvm-sandbox的流量录制方案, 日常巡检利用影子链路,研发过程自测、链路自动化用业务编排服务化能力。

doomjvm-sandboxThub+微服务影子链路
Release是(github已开源)
代码侵入
应用要求
稳定性一般一般一般一般
全链路测试

展望

在基建完善的基础上,我们将继续探索flutter以及服务端的全端智能化方向的测试解决方案,希望让更多技术小二从重复劳动中释放出来,从治、防、控,三层质量网,保障闲鱼交易,让用户在闲鱼放心的卖卖卖、买买买。期待和大家一起交流业内的不同测试方案!同时感谢doom、sandbox、凤凰、天启、暴雪、全链路压测、Thub等团队提供的能力支持!

原文链接

本文为阿里云原创内容,未经允许不得转载。


推荐阅读
  • 本文推荐了六款高效的Java Web应用开发工具,并详细介绍了它们的实用功能。其中,分布式敏捷开发系统架构“zheng”项目,基于Spring、Spring MVC和MyBatis技术栈,提供了完整的分布式敏捷开发解决方案,支持快速构建高性能的企业级应用。此外,该工具还集成了多种中间件和服务,进一步提升了开发效率和系统的可维护性。 ... [详细]
  • 在JavaWeb项目架构中,NFS(网络文件系统)的实现与优化是关键环节。NFS允许不同主机系统通过局域网共享文件和目录,提高资源利用率和数据访问效率。本文详细探讨了NFS在JavaWeb项目中的应用,包括配置、性能优化及常见问题的解决方案,旨在为开发者提供实用的技术参考。 ... [详细]
  • 2019年后蚂蚁集团与拼多多面试经验详述与深度剖析
    2019年后蚂蚁集团与拼多多面试经验详述与深度剖析 ... [详细]
  • 修复一个 Bug 竟耗时两天?真的有那么复杂吗?
    修复一个 Bug 竟然耗费了两天时间?这背后究竟隐藏着怎样的复杂性?本文将深入探讨这个看似简单的 Bug 为何会如此棘手,从代码层面剖析问题根源,并分享解决过程中遇到的技术挑战和心得。 ... [详细]
  • 本研究聚焦于利用Java、PHP和Python开发的汽车销售管理系统,旨在为计算机科学专业学生的毕业设计提供参考。项目采用BS架构,结合多种编程语言的优势,实现高效的数据管理和用户交互。该系统不仅涵盖了汽车销售的核心功能,还通过集成先进的技术栈,提升了系统的稳定性和扩展性。 ... [详细]
  • Presto:高效即席查询引擎的深度解析与应用
    本文深入解析了Presto这一高效的即席查询引擎,详细探讨了其架构设计及其优缺点。Presto通过内存到内存的数据处理方式,显著提升了查询性能,相比传统的MapReduce查询,不仅减少了数据传输的延迟,还提高了查询的准确性和效率。然而,Presto在大规模数据处理和容错机制方面仍存在一定的局限性。本文还介绍了Presto在实际应用中的多种场景,展示了其在大数据分析领域的强大潜力。 ... [详细]
  • Spring框架的核心组件与架构解析 ... [详细]
  • 本文深入解析了Spring Cloud路由网关Zuul的核心功能及其典型应用场景。通过对方志朋老师教材的学习和实践,详细探讨了Zuul在微服务架构中的重要作用,包括请求路由、过滤器链管理以及服务动态扩展等关键特性。同时,结合实际案例,展示了Zuul在高并发和复杂业务场景下的应用优势,为读者提供了全面的技术参考。 ... [详细]
  • 如果程序使用Go语言编写并涉及单向或双向TLS认证,可能会遭受CPU拒绝服务攻击(DoS)。本文深入分析了CVE-2018-16875漏洞,探讨其成因、影响及防范措施,为开发者提供全面的安全指导。 ... [详细]
  • 近年来,BPM(业务流程管理)系统在国内市场逐渐普及,多家厂商在这一领域崭露头角。本文将对当前主要的BPM厂商进行概述,并分析其各自的优势。目前,市场上较为成熟的BPM产品主要分为两类:一类是综合型厂商,如IBM和SAP,这些企业在整体解决方案方面具有明显优势;另一类则是专注于BPM领域的专业厂商,它们在特定行业或应用场景中表现出色。通过对比分析,本文旨在为企业选择合适的BPM系统提供参考。 ... [详细]
  • 如何利用Apache与Nginx高效实现动静态内容分离
    如何利用Apache与Nginx高效实现动静态内容分离 ... [详细]
  • 如何正确配置与使用日志组件:Log4j、SLF4J及Logback的连接与整合方法
    在当前的软件开发实践中,无论是开源项目还是日常工作中,日志框架都是不可或缺的工具之一。本文详细探讨了如何正确配置与使用Log4j、SLF4J及Logback这三个流行的日志组件,并深入解析了它们之间的连接与整合方法,旨在帮助开发者高效地管理和优化日志记录流程。 ... [详细]
  • 阿里巴巴Java后端开发面试:TCP、Netty、HashMap、并发锁与红黑树深度解析 ... [详细]
  • 在 CentOS 6.5 系统上部署 VNC 服务器的详细步骤与配置指南
    在 CentOS 6.5 系统上部署 VNC 服务器时,首先需要确认 VNC 服务是否已安装。通常情况下,VNC 服务默认未安装。可以通过运行特定的查询命令来检查其安装状态。如果查询结果为空,则表明 VNC 服务尚未安装,需进行手动安装。此外,建议在安装前确保系统的软件包管理器已更新至最新版本,以避免兼容性问题。 ... [详细]
  • 本文总结了JavaScript的核心知识点和实用技巧,涵盖了变量声明、DOM操作、事件处理等重要方面。例如,通过`event.srcElement`获取触发事件的元素,并使用`alert`显示其HTML结构;利用`innerText`和`innerHTML`属性分别设置和获取文本内容及HTML内容。此外,还介绍了如何在表单中动态生成和操作``元素,以便更好地处理用户输入。这些技巧对于提升前端开发效率和代码质量具有重要意义。 ... [详细]
author-avatar
手机用户2502937805
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有