关键技术_AIOps关键技术：日志模板提取

作者：流行时尚吾诺饰品手_317 | 来源：互联网 | 2023-06-06 15:25

篇首语：本文由编程笔记#小编为大家整理，主要介绍了AIOps关键技术：日志模板提取相关的知识，希望对你有一定的参考价值。作者｜孟伟彬编辑｜Vicky

篇首语：本文由编程笔记#小编为大家整理，主要介绍了AIOps关键技术：日志模板提取相关的知识，希望对你有一定的参考价值。

AIOps关键技术：日志模板提取

作者｜孟伟彬

编辑｜Vicky

日志是AIOps需要处理常见数据，是程序运行过程中由代码打印出的一些程序完成的任务和系统的状态。从属于非结构化文本的日志数据中提炼特征挑战性大，不能简单采用NLP（自然语言处理）方法，需要首先结合运维领域知识从日志中提炼日志模板（事件）。本文介绍清华NetMan实验室发表在IWQoS 2017的研究成果：FT-Tree——一种新型的日志模板提取技术，用于准确地和增量式地学习交换机日志模板。该系统被用于NetMan实验室发表在SIGMETRICS 2018 上数据中心。

简介

在数据中心中，对于交换机故障的诊断和预测来说，交换机系统日志是一个丰富的信息源。但是，只有通过对系统日志合理地处理之后，这些信息才能被有效的提取出来。

一种通用的系统日志预处理的方法是从历史系统日志消息中提取模板，然后，将系统日志消息映射到模板上。但是，当前提出的模板提取方法或者在学习“正确” 模板集合时准确性较低，或者不支持增量式学习。当模板提取放法不支持增量式学习时，如果一种新的模板加入，所有的历史系统日志消息都要被重新处理一遍以重新构建整个模板集合。这对于大型的数据中心网络来说，将消耗太多的计算资源。因此，我们提出了FT-Tree，它能够比现有方法更加准确地提取消息模板，并从本质上支持增量式学习。

挑战

从交换机日志中提取消息模板会面临如下挑战：

1、非结构化:交换机系统日志消息通常是非结构化的文本。

2、数据量大:数据中心中每天会产生数以千万计的系统日志信息。

3、类型多样：交换机日志会随着设备厂商和设备型号的变化而变化。

设计思想

系统日志处理的目的是不依赖于任何专家知识，自动地从系统日志中提取模板——系统日志消息中详细信息字段的子类型。FT-tree 是一种扩展的前缀树结构，用以表示交换机系统日志消息模板。FT-tree 的基本思想是，系统日志消息中详细信息字段的子类型通常是频繁出现的单词的最长组合。因此，提取模板等价于从系统日志消息中识别出频繁出现单词的最长组合。下面通过一个具体的实例来介绍FT-tree的构建过程。

FT-tree构建过程

令DM = (M₁, M₂, ..., M_n) 为系统日志消息的集合，每个M_i 是一条系统日志消息。I = （a₁, a₂, ..., a_m）是系统日志消息集合中出现的不同单词的集合。一个单词组合(即单词的集合) A 的支持度(即单词出现的频率) 等于DM 中包含A 的系统⽇志消息的数量。如果A 频繁地出现（即具有较大的支持度），那么A 就是一个模板。例如下表的第二列展示了日志消息的集合DM = (M₁, M₂, ..., M₈)，其中每条日志都是属于”SIF”类型。

AIOps关键技术：日志模板提取

我们首先扫描一次DM, 并且以每个单词出现频率（每个”:”之后的数字）的降序得到一个列表L。例如，L = <(“changed”:8),(“state”:8), (“to”:8), (“Interface”:4), (“Vlan-interface”:4), (“down”:4), (“up”:4), (“ae3”:2),(“ae1”:2), (“vlan22”:2), (“vlan20”:2)>。

然后，创建树的根节点，这一根节点是由消息类型标记的，如下图中第一步所示，在本文中树的根节点是“SIF”。之后，FT-tree第二次扫描DM。通过处理M₁，得到树的第一条路径如下<“changed”, “state”, “to”, “Interface”, “down”, “ae3”>，这些单词是根据L中单词的顺序排序的。当处理M2 时，因为它排完序的单词列表<“changed”, “state”, “to”, “Vlan-interface”, “down”, “vlan22”> 与已存在的路径/分支<“changed”, “state”, “to”, “Interface”, “down”, “ae3”> 共享一个共同前缀<“changed”, “state”, “to”>，所以，FT-tree 需要创建一个新的分支<“Vlan-interface”,“down”，“vlan22”> 作为节点“to”的子树。同理，剩余的6 条系统日志消息的处理方式也是一样的。最后，得到的FT-tree 如下图最右边的树所示。

AIOps关键技术：日志模板提取

最后，修剪FT-tree，直到它满足以下节点的度的约束。直观地来看，每个消息类型应该只有少量的子类型。并且，对于每个子类型，应该有许多不同的系统日志消息与之匹配。因此，如果FT-tree的一个节点有太多的子节点，那么它的所有子节点就从FT-tree 中删除。这样，该子节点就变成叶节点。

增量式模板学习

对于一个给定的系统日志消息的消息类型，由于操作系统或固件升级，可能会出现新的子类型消息。此时，需要生成新的消息模板，以匹配这些新的子类型的系统日志消息，这是通过向FT-tree 中插入新的节点来完成的。如下图所示，假设交换机生成了新的系统日志消息M_new =“Interface ae1 changed state to RETURN”。并且，在此之前，FT-tree 是上图中最右边的树，且所有子节点（“ae3”, “ae1”, “vlan22” 等）已经都被剪枝。然后，新的系统日志消息M_new 生成后，需要将分支（“RETURN”→“ae1”）插入到FT-tree 中。

AIOps关键技术：日志模板提取

实验验证

我们使用了从真实收集的交换机系统日志和交换机故障记录，比较了FT-tree与特征树、STE和LogSimilarity三种现有方法在模板学习和交换机故障预测方面的性能，从而对FT-tree进行评价和验证。

评价模板学习的准确性

我们随机地收集了500条日志消息。然后基于每条系统日志消息代表的事件，由运维人员人工地对系统日志消息分类。然后分别运行FT-tree、特征树方法、STE 和LogSimilarity，以学习上述日志消息的模板，然后使用了RandIndex方法（一种流行的用于评估两种数据聚类算法之间相似性的方法）来定量比较四种算法的准确性。从下图中我们可以看出，FT-tree 和特征树方法的平均Rand index 接近于1.0 ，且在所有四种消息类型中均表现得很好，然而，FT-tree 可以构造树并增量式地学习系统日志消息模板，但是特征树方法却不能，所以FT-Tree更适合于系统日志模板的提取。

AIOps关键技术：日志模板提取

评价故障预测的准确性

下图展示了FT-tree, 特征树，STE和LogSimilarity四中算法的故障预测结果的PR曲线，从PR 曲线可以看出，在预测故障时，应用FT-tree 和特征树方法以学习系统日志消息模板，比应用STE 和LogSimilarity 能够取得更高的准确性。

应用案例

1、数据中心中的交换机每天产生大量的日志，运维工程师只关心某几类日志，比如端口Up/Down，并且希望过滤掉其他的常态日志，然后由工程师标记其关心的日志模板。当新产生的日志到来后，如果能与已标记的模板，则显示在日志查询系统中，这样可以极大的减少运维工程师查询日志的工作量。类似的功能已在某公司的日志白名单系统中线上使用。

2、许多基于日志的异常检测工作都是分为四个步骤，分别是日志收集、日志预处理、特征提取以及异常检测。本文中提到的日支模板提取就是用在第二步日志预处理中。换句话说，如果设备产生的日志数据实时地转换成日志模板编号，那日志文本处理的问题就转换成了时间序列处理。

结论

本文介绍了一种新型的模板提取技术——FT-tree，用于准确地和增量式地学习模板。我们使用真实的2 年的交换机故障案例和系统日志来评价和对于FT-tree和现有方法的性能，评价实验结果清楚地证明了FT-tree 的优点：高准确性，低计算成本和可增量式学习。

论文题目：Syslog Processing for Switch Failure Diagnosis and Prediction in Datacenter Networks

论文链接：请点击文末右下角“阅读原文”

长按二维码

关注我们

推荐阅读

int
【机器学习】生成式对抗网络模型综述

生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型，可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]

蜡笔小新 2023-12-14 17:51:18
io
Java工具类库Hutool介绍及功能概述

本文介绍了Java工具类库Hutool，该工具包封装了对文件、流、加密解密、转码、正则、线程、XML等JDK方法的封装，并提供了各种Util工具类。同时，还介绍了Hutool的组件，包括动态代理、布隆过滤、缓存、定时任务等功能。该工具包可以简化Java代码，提高开发效率。 ... [详细]

蜡笔小新 2023-12-14 14:29:36
function
浏览器中的异常检测算法及其在深度学习中的应用

本文介绍了在浏览器中进行异常检测的算法，包括统计学方法和机器学习方法，并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测，可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率，而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]

蜡笔小新 2023-12-12 16:22:39
header
欢乐的票圈重构之旅——RecyclerView的头尾布局增加

项目重构的Git地址：https:github.comrazerdpFriendCircletreemain-dev项目同步更新的文集：http:www.jianshu.comno ... [详细]

蜡笔小新 2023-12-11 19:09:56
int
Java面经整理及相关概念解析

本文整理了Java面试中常见的问题及相关概念的解析，包括HashMap中为什么重写equals还要重写hashcode、map的分类和常见情况、final关键字的用法、Synchronized和lock的区别、volatile的介绍、Syncronized锁的作用、构造函数和构造函数重载的概念、方法覆盖和方法重载的区别、反射获取和设置对象私有字段的值的方法、通过反射创建对象的方式以及内部类的详解。 ... [详细]

蜡笔小新 2023-12-10 22:17:08
default
HashMap的扩容知识详解

本文详细介绍了HashMap的扩容知识，包括扩容的概述、扩容条件以及1.7版本中的扩容方法。通过学习本文，读者可以全面了解HashMap的扩容机制，提升对HashMap的理解和应用能力。 ... [详细]

蜡笔小新 2023-12-09 17:20:36
int
开发笔记:源码分析ConcurrentHashMap与HashTable（JDK1.8）

本文由编程笔记#小编为大家整理，主要介绍了源码分析--ConcurrentHashMap与HashTable（JDK1.8）相关的知识，希望对你有一定的参考价值。　　Concu ... [详细]

蜡笔小新 2023-10-17 21:45:25
int
Python15行代码实现免费发送手机短信，推送消息「建议收藏」

Python15行代码实现免费发 ... [详细]

蜡笔小新 2023-10-17 20:46:15
input
查找给定字符串的所有不同回文子字符串

查找给定字符串的所有不同回文子字符串原文:https://www ... [详细]

蜡笔小新 2023-10-17 19:11:18
input
Opencv Python版学习笔记（八）字符识别-分类器（SVM，KNearest，RTrees，Boost，MLP）

Opencv提供了几种分类器，例程里通过字符识别来进行说明的1、支持向量机（SVM）：给定训练样本，支持向量机建立一个超平面作为决策平面，使得正例和反例之间的隔离边缘被最大化。函数原型：训练原型cv ... [详细]

蜡笔小新 2023-10-17 17:02:44
input
NLP如何进阶？你应该先掌握四大基本任务！

“语言理解是人工智能领域皇冠上的明珠。”——比尔盖茨自然语言处理是一门综合性的学问，它远远不止机器学习算法。相比图像或语音，文本的变化更加复杂ÿ ... [详细]

蜡笔小新 2023-10-16 05:43:05
io
百度AI Studio人流密度常规赛火热进行中，快来报名！

早晨七点半。北京初秋的凉风叫醒了住在望京西的你，睁开眼睛，一想到又要为人类的信息化事业贡献满满的正能量，你不禁哼唱起那句“早晨起来 ... [详细]

蜡笔小新 2023-10-12 18:57:29
io
武汉市正式发布促进元宇宙创新发展实施方案

武汉市正式发布促进元宇宙创新发展实施方案 ... [详细]

蜡笔小新 2023-10-12 18:25:31
io
深度学习_机器学习 vs 深度学习到底有啥区别，为什么更多人选择机器学习

本文由编程笔记#小编为大家整理，主要介绍了机器学习vs深度学习到底有啥区别，为什么更多人选择机器学习相关的知识，希望对你有一定的参考价值。 ... [详细]

蜡笔小新 2023-10-12 14:41:47
int
文件服务器配置访问权限配置,文件服务器配置访问权限配置

文件服务器配置访问权限配置内容精选换一换用户需要使用图形化界面管理HDFS中文件时，可以通过Hue完成任务。Hue界面主要用于文件、表等数据的查看与分析， ... [详细]

蜡笔小新 2023-10-12 14:18:47

流行时尚吾诺饰品手_317

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章