最近几篇多维时间序列异常诊断论文综述

作者：温尧乔761975 | 来源：互联网 | 2023-09-17 15:36

近几年大数据和人工智能技术逐渐成熟，运维领域多年来面临的困境有望得到突破。AIOps就是在这样一个环境下自然孕育而生。IT运维数据天生就有数据量大，维

近几年大数据和人工智能技术逐渐成熟&＃xff0c;运维领域多年来面临的困境有望得到突破。AIOps就是在这样一个环境下自然孕育而生。

IT运维数据天生就有数据量大&＃xff0c;维度多&＃xff0c;时序等特征&＃xff0c;结合人工智能算法&＃xff0c;通过训练&＃xff0c;就可以让机器自动发现系统异常&＃xff0c;快速找到关联的根因&＃xff0c;甚至可以根据历史数据提前做出预测。

近些年关于AIOps的研究越来越热门&＃xff0c;其中&＃xff0c;多维时间序列的异常检测和故障诊断是其中非常重要的一个课题方向。本次和大家分享的&＃xff0c;是最近整理的几个基于深度学习进行多维时间序列数据中异常检测/故障诊断的研究工作。

AAAI 2019

A deep neural network for unsupervised anomaly detection and diagnosis in multivariate time series data

论文地址&＃xff1a;https://ojs.aaai.org//index.php/AAAI/article/view/3942

论文源码&＃xff1a;-

论文摘要&＃xff1a;该论文提出Multi-Scale Convolutional Recurrent Encoder-Decoder (MSCRED)&＃xff0c;用于多变量时序数据的异常检测。MSCRED首先构建多尺度的signature matrices&＃xff0c;用于描述不同时间步对应的&＃61;系统状态&＃xff0c;然后&＃xff0c;在给定的signature matrices上&＃xff0c;利用卷积编码器去编码变量之间的相关特性&＃xff0c;同时利用基于attention的卷积LSTM&＃xff08;ConvLSTM&＃xff09;去捕获时间依赖特性。最后利用解码器重构特征以及利用residual signature matrices去检测和诊断异常。

Method

Problem Statement

给定n维时序数据 &＃xff0c;假设数据不存在异常&＃xff0c;我们希望达到两个目的&＃xff1a;

Anomaly detection&＃xff1a;检测T时刻之后某一时刻的异常事件
Anomaly diagnosis&＃xff1a;识别最有可能导致异常的时间序列&＃xff0c;并且量化异常程度。

Characterizing Status with Signature Matrices

有研究表明不同时间序列对之间的相关性对于描述系统状态至关重要。给定 t-w 时刻到 t 时刻的时序段&＃xff0c;文中基于该时序段内两个序列的成对内积构建了一个 n x n 的 signature matrix。假设当前的两个序列为和。计算两个序列的相关性&＃xff1a;

其中分母是缩放因子。特征矩阵不仅可以捕获两个时间序列之间的形状相似性和值尺度相关性&＃xff0c;而且对输入噪声具有鲁棒性&＃xff0c;因为某些时间序列的不稳定对特征矩阵的影响很小。通过选择不同的w值&＃xff0c;可以获得不同尺度下的特征。文中选取了三个时间尺度&＃xff1a;10&＃xff0c;30&＃xff0c;60。也就是每一个时间步&＃xff0c;都有3个特征矩阵。每一个特征矩阵的大小与时序数据的维度一致。所以对于维度较少的时序数据来说&＃xff0c;可能会存在问题。

Convolutional Encoder

采用全卷机编码器对Signature Matrices的空间模式进行进一步的编码。经过4层卷积核&＃xff0c;将原始Signature Matrices 编码成不同大小的特征图&＃xff0c;总共4层&＃xff0c;后续会在这4层特征图上分别进行ConvLSTM操作。整个过程如图&＃xff08;a&＃xff09;所示。

Attention based ConvLSTM

由于在每一层特征图上都进行ConvLSTM&＃xff0c;如果时间步比较长&＃xff0c;则LSTM的性能将会下降&＃xff0c;因此采用attention机制&＃xff0c;对先前的每一个时间步的隐含特征分配权重。文中选择的时间步为5&＃xff0c;也就是以当前时间步为基准&＃xff0c;考虑之前的5个时间步。对于当前时间步对应的隐含状态&＃xff0c;计算先前时间步对其的影响&＃xff1a;

计算方法是基本的attention计算方法。整个过程如图&＃xff08;b&＃xff09;所示。

Convolutional Decoder

最后利用卷积解码器&＃xff0c;再反向重构&＃xff0c;重构的时候&＃xff0c;需要加入ConvLSTM提取的特征&＃xff0c;最后得到重构的Signature Matrices。整个过程如图&＃xff08;c&＃xff09;所示。整个过程的损失函数定义为重构误差。后续在原始Signature Matrices和重构Signature Matrices的差异矩阵上&＃xff0c;进行异常检测和诊断。

KDD 2020

USAD: UnSupervised Anomaly Detection on Multivariate Time Series

论文地址&＃xff1a;https://dl.acm.org/doi/10.1145/3394486.3403392

论文源码&＃xff1a;https://github.com/manigalati/usad

论文摘要&＃xff1a;该论文提出一种面向多元时序数据的无监督的异常检测方法UnSupervised Anomaly Detection USAD&＃xff0c;该方法基于自编码器&＃xff0c;同时利用了对抗训练的策略&＃xff0c;并在五个公共数据集上进行了实验。USAD 背后的思想是在编码器-解码器架构上进行对抗性训练使其能够学习如何放大异常的输入的重建误差&＃xff0c;同时相比与传统的GAN-based方法&＃xff0c;更加稳定。

Method

Problem formulation

给定多元时序数据 &＃xff0c;其中。然后定义在 t 时刻且长度为 K 的时间窗口为。通过这种方式&＃xff0c;我们可以将原始序列 T 分割为多个窗口的集合 &＃xff0c;当存在一个新的时间窗口 &＃xff0c;需要通过窗口的异常得分来对新的未知窗口进行分类&＃xff0c;也就是0和1。

Unsupervised Anomaly Detection

采用自编码器是一种常用的方法&＃xff0c;基于自编码器的异常检测使用重构误差作为异常分数&＃xff0c;因为通常训练数据中只有正常的数据&＃xff0c;因此出现异常数据时&＃xff0c;往往具有较高的重构误差。但是&＃xff0c;如果异常比较接近正常数据&＃xff0c;则重构误差很小&＃xff0c;因此无法有效检测到异常。发生这种情况是因为自编码器尽可能地重建输入数据。

为了克服这个问题&＃xff0c;理想的自编码器应该能够识别异常输入数据中是否包含正常数据。

一种可能的方案是利用生成对抗网络Generative Adversarial Networks。与基于自编码器的异常检测类似&＃xff0c;基于 GAN 的异常检测使用正常数据进行训练。训练后&＃xff0c;鉴别器用作异常检测器。如果输入数据与学习数据分布不同&＃xff0c;则鉴别器将其视为来自生成器并将其分类为假数据&＃xff0c;即异常。

USAD的基本框架为自编码器&＃xff0c;同时具有两个不同阶段对抗训练策略。USAD包含三个部分&＃xff0c;一个编码器网络 E 以及两个解码器网络 D1 和 D2 。如下图所示

两个解码器共用一个编码器&＃xff0c;具体表示为&＃xff1a;

训练的时候采用两阶段的训练方式。首先&＃xff0c;给定正常输入&＃xff0c;训练两个自编码器以实现重构。其次&＃xff0c;这两个自编码器以对抗方式进行训练&＃xff0c;其中 AE1 将试图欺骗 AE2&＃xff0c;而 AE2 的任务是判断数据是否是真实的&＃xff08;也就是来自输入窗口&＃xff09;或者假的&＃xff08;也就是来自AE1的重构&＃xff09;。

Phase 1: Autoencoder training

在第一阶段&＃xff0c;目标是训练每个 AE 来重现输入。即给定 W &＃xff0c;两个编码器的输出分别为AE1(W)和AE2(W)&＃xff0c;所以目标函数为&＃xff1a;

Phase 2: Adversarial training

首先将来自 AE1 的数据再次由 E 压缩到 Z&＃xff0c;然后由 AE2 重建&＃xff0c;得到的输出AE2(AE1(W))&＃xff0c;这个过程如图中Training阶段中的绿色箭头所示。在对抗训练的策略下&＃xff0c;AE1 期望最小化 W 和 AE2(AE1(W)) 之间的差异&＃xff0c;而AE2 的目标是最大化这种差异。所以目标函数为

这里大概可以这么理解&＃xff0c;AE2的目的是为了识别AE1(W)是AE1重构之后的时间窗口&＃xff0c;而不是真实的时间窗口W。因此AE2需要最大化AE2(AE1(W)) 与真实W之间的差异&＃xff0c;而AE1为了欺骗AE2&＃xff0c;则需要最小化AE2(AE1(W)) 与真实W之间的差异。例如如果AE2(AE1(W))与W非常相似&＃xff0c;那么可以认为AE1(W)来自与W&＃xff0c;因为只有来自与W的数据才能获得较小的重构误差&＃xff0c;也就是将AE1(W)判定为真实的W&＃xff0c;这其实是错误的&＃xff0c;因为AE1(W)是重构的数据。

Two-phase training

在这样的结构中&＃xff0c;每个自编码器都双重用途&＃xff0c;融合Phase1和Phase2&＃xff0c;最终的目标函数为

其中n表示训练epoch。两阶段的训练过程如下所示。

Inference or Detection Phase

异常得分(anomaly score)被定义为

其中。这两个参数决定了模型对异常的敏感度&＃xff0c;在实际使用时可以根据场景进行调节。在文中的实验中&＃xff0c;通过增加 a &＃xff0c;FP&＃xff08;False Positives&＃xff09;的数量降低&＃xff0c;TP&＃xff08;True Positives&＃xff09;的数量上升。也就是说增加 a 可以增加模型的precision&＃xff0c;但同时F1 score也降低&＃xff0c;也就是说明recall会降低&＃xff0c;也就是模型变得更加保守。

换句话说&＃xff0c;当 a 增加&＃xff0c;模型逐渐退化为单一的自编码器&＃xff0c;也就是仅仅能识别出比较明显的异常&＃xff0c;识别的准确率上升&＃xff0c;也就是TP会增加&＃xff0c;FP会降低&＃xff0c;但同时导致的后果是找出的异常数量下降&＃xff0c;也就是Recall的值会下将。而增加 b 的值&＃xff0c;会使模型变得更加冒险&＃xff0c;因此能找到更多的异常&＃xff0c;但同时准确率会降低。与文中的实验结果规律相似。而AE2可以视为一个扰动器&＃xff0c;为AE1提供了一定的干扰效果。

KDD 2021

Practical Approach to Asynchronous Multivariate Time Series Anomaly Detection and Localization

论文地址&＃xff1a;https://dl.acm.org/doi/10.1145/3447548.3467174

论文源码&＃xff1a;https://github.com/eBay/RANSynCoders

论文摘要&＃xff1a;考虑从现实世界观察到大量时间序列表现出异步和重复变化特点&＃xff0c;提出了一种从多元时序数据集中推断异常的实用方法。总的来讲&＃xff0c;该解决方案首先利在预训练自动编码器的潜在表示(latent representation)上进行频谱分析从而提取信号中的主要频率&＃xff0c;然后将其用于后续网络&＃xff0c;该网络学习信号中的相移并生成原始多元变量的同步表示。然后将同步的多元变量的随机子集输入到一组自动编码器中&＃xff0c;以最小化分位数重构损失为目标进行学习&＃xff0c;然后用于基于投票规则来推断和定位异常。该文提出的是一种无监督的方法&＃xff0c;因为监督学习方法面临着无法获得真实标签的问题。相比之下&＃xff0c;通过仿真模拟来获得标签无法代表现实世界异常的真实多样性。而异常通常具有模式不一致、稀缺或未标记的特点&＃xff0c;因此采用无监督的深度学习方法是合理且实用的。该文所提出方法有两个理论贡献&＃xff0c;第一个是无监督方法假设序列的频谱关系是线性相关的&＃xff0c;但忽略了隐藏在多元时间序列的固有的非线性特性&＃xff1b;第二个是在实际应用中&＃xff0c;时间序列的维度经常被异步地观测&＃xff0c;这阻碍了模型权重的学习。

Method

Latent spectral density estimation

训练一个隐含空间大小为1的自编码器&＃xff0c;目标是最小化50th分位数&＃xff0c;定义为。然后在单变量潜在表示上利用快速傅立叶变换 (FFT) 进行频谱分析来辨识大小为 S 的频率向量 W 。 W 向量包含理论上在序列特征中占主导地位并普遍存在的频率&＃xff0c;其中 S 是足以近似多元时间序列 Y 的正弦分量的数量&＃xff0c;这里可以定义为。

这部分实际上先将多变量时序数据 Y 编码到单变量的隐含状态 Z &＃xff0c;然后在 Z 上进行快速傅里叶变换&＃xff0c;最终得到 Z 的频率成分组成 &＃xff0c;其中包含了 S 个频率成分。

Asynchronous multivariate signal model

基于 T 个时间步和 I 个特征对异步多元时序数据进行建模&＃xff0c;建模方式如下

其中 S 表示频率成分&＃xff0c; 以及表示特征的索引&＃xff0c; 表示频率成分的索引&＃xff0c; 表示角频率&＃xff0c; 表示幅度&＃xff0c;相位以及特征的偏置&＃xff0c; 表示噪声。

w 的初始化是基于自编码器学习到的近似最优值。为了学习 &＃xff0c;首先将模型中的中的角度部分线性化展开为 &＃xff0c;其中。线性化后的形式变得类似于用单位偏置和正弦激活函数训练神经元。这样就可以通过反向传播训练参数。而噪声项是通过从拟合的正弦分量中减去原始信号来计算的。

文中给出了一个例子&＃xff0c; 显示了使用具有两个频率分量进行建模的特征例子如下图所示&＃xff0c;也就是。这里将某一个特征序列表示为一个拟合的正弦成分以及噪声。

最后还需要将误差表示为时间的函数&＃xff0c;文中根据第 i 个特征的第 t 个观测&＃xff0c;将噪声表示为

其中 w0 是来自谱密度估计的最高功率的角频率&＃xff0c;也就是 W 的 w0 。而原始异步时间序列的表示为

其中。

Synchronized representation

基于上面提到的公式&＃xff0c;文中将异步的特征采样时间 ,以及异步的相位差和对齐到了参考时间戳 &＃xff0c;如下所示

其中是基于特征的相位移动&＃xff0c;它将异步特征上的每一个观测移动至参考时序帧&＃xff0c;该操作是特征级别的&＃xff0c;也就是说同一个特征的所有观测值具有相同的移动量&＃xff0c; 和分别是原始序列和投影噪声的同步表示。文中仍然给了一个例子来说明&＃xff0c;该例子显示了 eBay 从 4 个不同时区的用户活动中收集的 4 个异步特征的示例及其同步表示。

Embedded representation learning

将上述参数估计和多元序列同步表征过程嵌入到整个网络学习过程中&＃xff0c;如下图所示。

上述的网络需要两个输入&＃xff1a;一个是多元时序数据 Y &＃xff0c;还有一个是特征对应的时间戳矩阵 T 。最终获得的同步表征将作为后续RANCoders的输入。

RANCoders: Bootstrapped autoencoders for feature-bounds construction

提出了一种利用自动编码器进行异常检测的替代方法。该方法显著利用了同步多元序列增强空间共线性&＃xff0c;并且在异步时序数据上表现非常好。

首先&＃xff0c;作者认为输入的较小子集应该包含足够的信息&＃xff0c;从而以足够的质量重建整个序列。因此&＃xff0c;文中利用具有一组 N 个弱深度编码器&＃xff08;weak deep encoders&＃xff09;作为特征bagging模型。这样的机制可以在异常推理时采用少数服从多数的机制。也就是具有N个编码器&＃xff0c;可以同时编码输入。

其次&＃xff0c;作者认为对于异常检测这个任务来讲&＃xff0c;重建输入信号的阈值边界更有效&＃xff0c;而不是尝试重建输入&＃xff0c;然后进行不可靠的阈值选择过程用于异常推断。

基于以上原则&＃xff0c;训练了两组深度解码器&＃xff0c;分别为以及 &＃xff0c;从每个编码器中重建多元时序数据的边界&＃xff0c;通过最小化分位数重建损失来进行训练

上面这个公式是针对下界的损失函数&＃xff0c;其中&＃xff0c; 是重构的边界&＃xff0c;LB是下界&＃xff0c; n 表示自编码器的索引。针对上界的损失函数与下界损失函数相同&＃xff0c;将LB换为UB即可。

Anomaly inference and localization

采用以上方法的两个突出优势是可以实际推断异常并进一步解释多元数据集中异常的潜在来源。但是文中重点讨论了第一个属性&＃xff0c;因为潜在来源在数据集中没有基准。

对于异常推断&＃xff0c;通过将 RANCoders 输入与解码的边界进行比较&＃xff0c;这个过程可以表达为

对于每一个时间步&＃xff0c;输出结果均为2维数组&＃xff0c;大小为 &＃xff0c;因为在上一个小节中&＃xff0c;采用了 N 个弱深度编码器&＃xff0c;每个编码器都会有一个结果。然后采用投票的策略&＃xff0c;即输出中的 1 多于 0 时&＃xff0c;观察结果被标记为异常。

以上就是这篇论文的主要内容&＃xff0c;总体来说模型部分还是比较好理解的&＃xff0c;主要的特点就是将异步时序数据的同步化表征融入到整个模型框架中。

推荐阅读

instance
视觉Transformer综述

本文综述了视觉Transformer在计算机视觉领域的应用，从原始Transformer出发，详细介绍了其在图像分类、目标检测和图像分割等任务中的最新进展。文章不仅涵盖了基础的Transformer架构，还深入探讨了各类增强版Transformer模型的设计思路和技术细节。 ... [详细]

蜡笔小新 2024-11-22 19:53:16
byte
SSE图像算法优化系列三：超高速导向滤波实现过程纪要（欢迎挑战）

自从何凯明提出导向滤波后，因为其算法的简单性和有效性，该算法得到了广泛的应用，以至于新版的matlab都将其作为标准自带的函数之一了&#x ... [详细]

蜡笔小新 2024-11-23 10:46:33
uri
兆芯X86 CPU架构的演进与现状（国产CPU系列）

本文详细介绍了兆芯X86 CPU架构的发展历程，从公司成立背景到关键技术授权，再到具体芯片架构的演进，全面解析了兆芯在国产CPU领域的贡献与挑战。 ... [详细]

蜡笔小新 2024-11-14 15:04:34
instance
Java 15 发布，带来多项重要更新！

2020年9月15日，Oracle正式发布了最新的JDK 15版本。本次更新带来了许多新特性，包括隐藏类、EdDSA签名算法、模式匹配、记录类、封闭类和文本块等。 ... [详细]

蜡笔小新 2024-11-14 12:11:09
instance
2022年4月15日算法练习题

2022年4月15日的算法练习题，包括最长公共子序列和线段树的应用。 ... [详细]

蜡笔小新 2024-11-25 19:10:45
byte
深入解析mt_allocator内存分配器（二）：多线程与单线程场景下的实现

本文详细介绍了mt_allocator内存分配器在多线程和单线程环境下的实现机制。该分配器以2的幂次方字节为单位分配内存，支持灵活的配置和高效的性能。文章分为内存池特性描述、内存池实现、单线程内存池实现、内存池策略类实现及多线程内存池实现等部分，深入探讨了内存池的初始化、内存分配与回收的具体实现。 ... [详细]

蜡笔小新 2024-11-25 17:44:11
bit
41款高效LISP工具助力数据处理全流程

本文由公众号【数智物语】(ID: decision_engine)发布，关注获取更多干货。文章探讨了从数据收集到清洗、建模及可视化的全过程，介绍了41款实用工具，旨在帮助数据科学家和分析师提升工作效率。 ... [详细]

蜡笔小新 2024-11-24 00:11:50
export
Vue CLI 3 项目中使用 Pre-render SPA Plugin 进行预渲染

页面预渲染适用于主要包含静态内容的页面。对于依赖大量API调用的动态页面，建议采用SSR（服务器端渲染），如Nuxt等框架。更多优化策略可参见：https://github.com/HaoChuan9421/vue-cli3-optimization ... [详细]

蜡笔小新 2024-11-23 22:19:17
export
本周三大青年学术分享会即将开启

由雷锋网旗下的AI研习社主办，旨在促进AI领域的知识共享和技术交流。通过邀请来自学术界和工业界的专家进行在线分享，活动致力于搭建一个连接理论与实践的平台。 ... [详细]

蜡笔小新 2024-11-21 17:13:10
get
java类名的作用_java下Class.forName的作用是什么，为什么要使用它?

湖上湖返回与带有给定字符串名的类或接口相关联的Class对象。调用此方法等效于：Class.forName(className,true,currentLoader) ... [详细]

蜡笔小新 2024-11-20 12:55:32
get
微软等企业捐赠首批AI有声读物，助力视障人士

12月2日，微软联合鹿音苑文化传播公司及150多名志愿者，共同捐赠了首批由人工智能生成的有声内容，旨在为视障人士提供更多文化资源。 ... [详细]

蜡笔小新 2024-11-17 19:13:27
get
英特尔推出第三代至强可扩展处理器及傲腾持久内存，AI性能显著提升

英特尔在数据创新峰会上发布了第三代至强可扩展处理器和第二代傲腾持久内存，全面增强AI能力和系统性能。 ... [详细]

蜡笔小新 2024-11-17 13:07:14
perl
MySQL: 如何利用Mysqlcheck进行表的检查、修复与优化

Mysqlcheck作为MySQL提供的一个实用工具，主要用于数据库表的维护工作，包括检查、分析、修复及优化等操作。本文将详细介绍如何使用Mysqlcheck工具，并提供一些实践建议。 ... [详细]

蜡笔小新 2024-11-25 18:41:02
perl
Linux中PCI设备的I/O地址与内存映射

探讨Linux系统中PCI设备的I/O地址与内存映射的区别及其实现方式。 ... [详细]

蜡笔小新 2024-11-25 18:30:37
get
webpack js兼容性处理

index.js全部js兼容性处理。js内引入babelpolyfill全部js兼容性处理。babelpolyfillimportbabelpolyfill;constadd ... [详细]

蜡笔小新 2024-11-25 16:44:57

温尧乔761975

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章