微服务应用性能分析实战15数据磐石：APM收集端的存储模型

作者：mobiledu2502927877 | 来源：互联网 | 2023-10-14 15:45

分布式监控的重要设计就是数据存储模型，而SkyWalking的分布式追踪数据模型就是一个经典代表，这也是它会在APM领域脱颖而出的原因。所以今天我就以

分布式监控的重要设计就是数据存储模型&＃xff0c;而 SkyWalking 的分布式追踪数据模型就是一个经典代表&＃xff0c;这也是它会在 APM 领域脱颖而出的原因。

所以今天我就以 SkyWalking 为例&＃xff0c;结合明细模型中的分布式追踪模型、指标明细中的稳定性模型、采样数据模型中的数据慢查采样模型&＃xff0c;通过对这三个典型模型的横向对比学习&＃xff0c;纵向了解收集端计算存储模型的详细过程。

四大存储模型

SkyWalking 的数据存储也是通过微内核和插件形式实现的&＃xff1a;数据存储模型是在收集端经过各个插件计算而出&＃xff0c;所有插件存放在 oap-server/server-receiver-plugin。

目前收集端的插件主要会构建以下四个存储模型。

为了优化传输效率和存储能力&＃xff0c;SkyWalking 会使用注册发现模式去构建注册模型&＃xff0c;但注册模型天生会在异步收集场景和客户端内存空间上存在劣势。所以 8.x 版本 SkyWalking 去掉了注册模型&＃xff0c;取而代之的是通过 Base64 编码计算注册的唯一值。

虽然这在网络传输上带来了性能损失&＃xff0c;但内存优化和异步场景带来的体验上却有了极大提升。显然在当今的内部集群都是万兆网卡的硬件资源下&＃xff0c;这样的利是大于弊的&＃xff0c;所以注册存储模型我就略讲了。

存储模型中数据量最大的就是明细模型&＃xff0c;在存储优化上&＃xff0c;收集端会在构建数据索引时&＃xff0c;忽略部分不需要索引的数据&＃xff0c;以优化存储性能。
对于指标数据&＃xff0c;多数的指标数据都是通过脚本语言构建出来了&＃xff0c;SkyWalking 通过 OAL 脚本进行指标明细构建。
采样模型通过自定义排序&＃xff0c;在一定的时间窗口内采样数据&＃xff0c;计算 TOP 指标来完成采样数据的记录&＃xff0c;典型的场景是对 DB 执行延迟进行采样&＃xff0c;监控出对数据库造成慢查的 SQL。

所以接下来&＃xff0c;我会以分布式链路追踪的明细数据、稳定性的指标数据、数据库采样的采样模型为重点逐一进行讲解。

分布式追踪的明细数据

SkyWalking 有多种明细数据&＃xff08;Record&＃xff09;模型&＃xff0c;如报警明细数据模型&＃xff0c;通过定义报警规则的配置来完成报警&＃xff1b;又如 JaegerSpan 或 ZipkinSpan 明细模型&＃xff0c;通过收集其他 APM 数据来完成全局的 Span 数据追踪。

但在明细模型数据中&＃xff0c;最通用的就是分布式链路追踪&＃xff08;SegmentRecord&＃xff09;的明细追踪模型&＃xff0c;它是计算其他各个存储模型的基础数据&＃xff0c;其重要属性有以下五点。

1.原始数据流&＃xff08;data_binary&＃xff09;

任务线程监控数据&＃xff0c;通过 Base 64 对数据对象进行编码&＃xff0c;并存储到 Elasticsearch 索引中。由于原始数据流字段中包含所有以任务线程为监控维度的数据&＃xff0c;所以该字段的容量明显高于其他字段好几个维度&＃xff08;而其他字段是从任务线程监控数据中&＃xff0c;根据指定属性取出&＃xff09;&＃xff0c;从而原始数据流的数据也就被设计为不需要查询的资源&＃xff08;对应存储中就是不需要索引&＃xff09;。

在 Elasticsearch 的索引中&＃xff0c;索引的名称为 {cluster}segment{time_bucket}&＃xff0c;可以看出索引的名称包括了三个部分。

cluster 为 SkyWalking 收集端的集群标识。我们真实的线上应用集群非常复杂&＃xff0c;在网络或跨机房等情况下&＃xff0c;能难尽搭建一套 SkyWalking 集群就面面俱到&＃xff0c;因此真实场景是往往需要多个集群才能适配应用服务集群的复杂架构。但如果需要跨网段定位问题时&＃xff0c;我们就可以通过 Elasticsearch 的跨集群查询配置&＃xff0c;通过 SkyWalking 收集端的集群标识&＃xff0c;打破隔离带来的束缚。
segment 标识了此索引为分布式追踪数据的存储模型。
time_bucket 为以时间切分存储模型的标识。因为 APM 数据是海量级别的&＃xff0c;通过一定的时间窗口规则&＃xff0c;比如以“天”来划分表&＃xff0c;这样存储模型就有了时序。通过时序查询&＃xff0c;可以实现海量数据的快速插入和检索&＃xff1b;通过时序删除指定的索引&＃xff0c;可以避免索引碎片带来的性能问题。

2.时间

分布式追踪数据中&＃xff0c;一共有 3 个时间相关的属性&＃xff1a;开始时间&＃xff08;start_time&＃xff09;、结束时间&＃xff08;end_time&＃xff09;、延迟。时间使用 LongTime 类型记录&＃xff0c;避免了时区和空间占用的问题。

在同步模式&＃xff0c;开始时间是任务线程被监控的起始&＃xff0c;结束时间是退出任务线程监控时间的时刻&＃xff0c;延迟为两个时间的差值。
但在异步模式下&＃xff0c;分布式监控数据会由多个任务线程的监控数据组成。在发生异步时&＃xff0c;当前任务线程的开始&＃xff0c;监控时间会传递到接下来的任务线程&＃xff1b;而当前任务线程的监控数据&＃xff0c;为了防止内存泄漏会被回收掉&＃xff0c;并且不会发送到收集端。
所以开始时间和结束时间会在异步模式相互关联的任务线程中被持续覆盖&＃xff0c;直到真正的发送监控数据任务线程完成数据汇总后&＃xff0c;才发送给收集端。

3.端点&＃xff08;endpoint&＃xff09;

在存储模型中&＃xff0c;端点信息包括以下两个属性。

入口服务的端点名称

规则的实现逻辑是&＃xff1a;第一个 Span 的操作名称就是入口服务的端点名称。那为什么会用这一规则呢&＃xff1f;

在我看来&＃xff0c;APM 的分布式链路追踪的记录粒度&＃xff0c;是记录对端调用的 Span 粒度&＃xff0c;也就是支持记录调用过程中内部 Span 粒度。所以记录入口服务的端点名称是最合理的。

端点 ID

在 8.x 版本前&＃xff0c;SkyWalking 通过注册模式记录&＃xff0c;并生成入口服务的端点名称对应的端点 ID。但我们发现 APM 注册的端点名称是海量级的&＃xff0c;并在未归类的 RESTful API 场景下更为突出。

这不仅会给收集端存储注册模型带来性能压力&＃xff0c;更会由于需要缓存端点注册信息&＃xff0c;给客户端也带来较大的空间压力。这个问题是 APM 注册发现模式的通病&＃xff0c;它不仅在端点模型中存在&＃xff0c;更在网络地址模型、服务实例模型中存在。

所以在 8.x 后的版本中 SkyWalking 摒弃了注册发现模型&＃xff0c;全部通过 Base 64 编码对端点名称进行压缩&＃xff1a;在服务端&＃xff0c;为各个组件提供归类端点名称支持&＃xff1b;在客户端&＃xff0c;取消缓存端点的空间。

关于具体的实现设计&＃xff0c;你可以查看“在探针侧配置支持操作名称分组的规则”&＃xff0c;去了解 SkyWalking 是如何实现端点名称归类的。

4.监控数据标识

存储模型有两个关于监控标识的属性。

SegmentID&＃xff1a;监控数据模型的唯一 ID&＃xff0c;在任务线程的第一个监控点&＃xff0c;使用雪花算法实现。
TraceID&＃xff1a;全局分布式追踪 ID&＃xff0c;消息队列、分布式事务等批处理框架存在多个 TraceID。

这两个重要属性在前文中已有很多介绍&＃xff0c;这里就不过多赘述。

5.标记数据

为描述当前追踪数据的特征&＃xff0c;SkyWalking 的追踪存储模型提供了很多标记属性&＃xff0c;按照粗、细进行分类。

细分类&＃xff1a;我们想更精细地描述一个 Span 时&＃xff0c;可以通过数组类型 Tags 的字段&＃xff0c;来存储个性化的标记数据&＃xff0c;从而实现精细描述。如在数据组件中&＃xff0c;tags 会存储 db.type 和 db.instance&＃xff0c;来分别标识数据库类型和数据库实例标识。这只是数据库组件的 Tags 细分类。
粗分类&＃xff1a;每个分布式链路存储数据都有 statement 和 is_error 字段&＃xff0c;前者 statement 用于标记当前组件的执行语句&＃xff0c;后者标记当前组件执行正常与否。

稳定性指标数据

指标存储&＃xff08;Metric&＃xff09;模型的计算是通过 OAL 脚本聚合分析得出&＃xff0c;如稳定性指标语句&＃xff1a;

service_instance_sla &＃61; from(ServiceInstance.*).percent(status &＃61;&＃61; true)。

这个语句的释义&＃xff1a;服务的稳定性&＃xff0c;通过服务实例状态的健康百分比程度进行计算&＃xff0c;从而得到衡量和表达。

from 代表数据的挖掘来源&＃xff0c;ServiceInstance.* 代表挖掘数据为服务实例的全部数据&＃xff1b;
使用百分比运算&＃xff08;percent&＃xff09;规则&＃xff0c;根据服务实例健康度&＃xff08;也就是 status 属性&＃xff09;&＃xff0c;为 true 计算全部服务实例的稳定程度。

百分比指标数据模型&＃xff08;PercentMetrics&＃xff09;的重要属性有如下四点。

总量&＃xff08;total&＃xff09;&＃xff1a;计算时间窗口中流式数据的总量。
匹配量&＃xff08;match&＃xff09;&＃xff1a;计算时间窗口中流式数据匹配到的数据总量。
百分比&＃xff08;percentage&＃xff09;&＃xff1a;根据匹配量和总量&＃xff0c;计算出当前时间窗口的百分比。
时间窗口&＃xff08;timeBucket&＃xff09;&＃xff1a;当前计算的时间窗口。

数据库延迟采样数据

采样模型&＃xff08;TopN&＃xff09;通过一定的时间窗口&＃xff0c;对具有一定规则的数据进行采样收集&＃xff1b;并根据分布式追踪明细数据中的延迟字段窗口数据进行排序&＃xff1a;耗时长的进行保存&＃xff0c;耗时短的进行淘汰&＃xff1b;最后经过一定的时间积累&＃xff0c;计算出采样数据。

值得考虑的是&＃xff0c;由于数据收集的客户端是分布式集群&＃xff0c;所以明细数据会打到不同的收集节点上&＃xff0c;所以收集节点的采样窗口会存在分布式带来的数据误差。也就是&＃xff0c;悲观数据都打到一个节点上的这种情况&＃xff0c;造成其他收集节点的采样数据不具备采样的数据意义。采样模型针对 DB 组件进行监控&＃xff0c;用于发现慢查并进行优化。

主要的属性有以下四点。

延迟&＃xff08;latency&＃xff09;&＃xff1a;用于存储采样数据的延迟属性&＃xff0c;根据实现的排序算法&＃xff0c;在一定的时间窗口内得到延迟较高的采样数据。
访问 DB 的执行语句&＃xff08;statement&＃xff09;&＃xff1a;用户描述采样数据的访问数据库的语句信息&＃xff0c;比如关系型数据库的 SQL 语句、访问内存数据库的操作命令。
链路 ID 属性&＃xff1a;用于描述采样数据的分布式链路 ID&＃xff0c;通过链路 ID 可以快速关联出分布式追踪的明细属性&＃xff0c;从而进行分布式链路的慢查询诊断。
应用服务 ID&＃xff08;serviceId&＃xff09;&＃xff1a;用于存储采样数据的应用服务 ID&＃xff0c;来进行对指标的采样&＃xff0c;一旦采样到异常数据时&＃xff0c;便可观测出采样对服务的影响。

小结与思考

今天&＃xff0c;我带你回顾了 APM 的存储模型设计。以 SkyWalking 为例&＃xff0c;收集端有三个重要的存储模型&＃xff1a;明细数据、指标数据、采样数据。通过各个存储模型的典型示例&＃xff0c;我们展开讲解了各个存储模型的每个字段的细节实现。

那么你在生产环境中&＃xff0c;分析过那些数据存储模型的案例呢&＃xff1f;欢迎在评论区写下你的思考&＃xff0c;期待与你讨论。

精选评论

推荐阅读

char
备战BAT面试：掌握这些MySQL核心问题

本文深入探讨了MySQL中常见的面试问题，包括事务隔离级别、存储引擎选择、索引结构及优化等关键知识点。通过详细解析，帮助读者在面对BAT等大厂面试时更加从容。 ... [详细]

蜡笔小新 2024-12-20 18:58:01
go
FinOps 与 Serverless 的结合：破解云成本难题

本文探讨了如何通过 FinOps 实践优化 Serverless 应用的成本管理，提出了首个 Serverless 函数总成本估计模型，并分享了多种有效的成本优化策略。 ... [详细]

蜡笔小新 2024-12-24 12:44:26
config
深入解析Spring Cloud微服务架构与分布式系统实战

本文详细介绍了Spring Cloud在微服务架构和分布式系统中的应用，结合实际案例和最新技术，帮助读者全面掌握微服务的实现与优化。 ... [详细]

蜡笔小新 2024-12-19 16:02:50
char
最强阿里及大厂350道面试大全：框架+数据库+并发+开源+微服务

前言无论是对于刚入行工作还是已经工作几年的java开发者来说，面试求职始终是你需要直面的一件事情。首先梳理自己的知识体系，针对性准备，会有事半功倍的效果。我们往往会把重点放在技术上 ... [详细]

蜡笔小新 2024-12-18 15:33:00
object
深入解析Redis内存对象模型

本文详细介绍了Redis内存对象模型的关键知识点，包括内存统计、内存分配、数据存储细节及优化策略。通过实际案例和专业分析，帮助读者全面理解Redis内存管理机制。 ... [详细]

蜡笔小新 2024-12-23 14:50:23
copy
Python面试题精粹

本文档汇总了Python编程的基础与高级面试题目，涵盖语言特性、数据结构、算法以及Web开发等多个方面，旨在帮助开发者全面掌握Python核心知识。 ... [详细]

蜡笔小新 2024-12-19 20:26:25
js
Web与游戏开发的主要差异

本文探讨了Web开发与游戏开发之间的主要区别，旨在帮助开发者更好地理解两种开发领域的特性和需求。文章基于作者的实际经验和网络资料整理而成。 ... [详细]

蜡笔小新 2024-12-18 08:26:30
java
精通Spring Cloud：从入门到实践的全面指南

Spring Cloud因其强大的功能和灵活性，被誉为开发分布式系统的‘一站式’解决方案。它不仅简化了分布式系统中的常见模式实现，还被广泛应用于企业级生产环境中。本书内容详实，覆盖了从微服务基础到Spring Cloud的高级应用，适合各层次的开发者。 ... [详细]

蜡笔小新 2024-12-16 16:21:23
main
新浪笔试题

1:有如下一段程序：packagea.b.c;publicclassTest{privatestaticinti0;publicintgetNext(){return ... [详细]

蜡笔小新 2024-12-27 19:32:17
buffer
深入探讨CPU虚拟化与KVM内存管理

本文详细介绍了现代服务器架构中的CPU虚拟化技术，包括SMP、NUMA和MPP三种多处理器结构，并深入探讨了KVM的内存虚拟化机制。通过对比不同架构的特点和应用场景，帮助读者理解如何选择最适合的架构以优化性能。 ... [详细]

蜡笔小新 2024-12-25 19:15:51
buffer
对MariaDB未来发展的思考与担忧

本文探讨了MariaDB在当前数据库市场中的地位和挑战，分析其可能面临的困境，并提出了对未来发展的几点看法。 ... [详细]

蜡笔小新 2024-12-25 18:20:32
buffer
科研单位信息系统中的DevOps实践与优化

本文探讨了某科研单位通过引入云原生平台实现DevOps开发和运维一体化，显著提升了项目交付效率和产品质量。详细介绍了如何在实际项目中应用DevOps理念，解决了传统开发模式下的诸多痛点。 ... [详细]

蜡笔小新 2024-12-24 11:46:45
buffer
分布式架构概览与实践

本文探讨了现代分布式架构的多样性，包括高并发、多活数据中心、容器化、微服务、高可用性和弹性架构等，并介绍了与这些架构相关的重要管理技术，如DevOps、应用监控和自动化运维。文章还深入分析了分布式系统的核心概念、主要用途及类型，同时对比了单体应用与分布式服务化的优缺点。 ... [详细]

蜡笔小新 2024-12-19 15:11:28
java
Spring Cloud学习指南：深入理解微服务架构

本文介绍了微服务架构的基本概念及其在Spring Cloud中的实现。讨论了微服务架构的主要优势，如简化开发和维护、快速启动、灵活的技术栈选择以及按需扩展的能力。同时，也探讨了微服务架构面临的挑战，包括较高的运维要求、分布式系统的复杂性、接口调整的成本等问题。最后，文章提出了实施微服务时应遵循的设计原则。 ... [详细]

蜡笔小新 2024-12-19 09:25:36
go
Go 通过 Map/Filter/ForEach 等流式 API 高效处理数据

go,通过,map,filter,foreach,等,流,式,ap ... [详细]

蜡笔小新 2024-12-14 12:54:15

mobiledu2502927877

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章