热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

网络监控_云原生(业务)网络监控的建设思路与实现

本文由编程笔记#小编为大家整理,主要介绍了云原生(业务)网络监控的建设思路与实现相关的知识,希望对你有一定的参考价值。 受新冠疫情的影响,国内企业上云步伐被加速,云网络的服务水平成为企业上云的基石。国
本文由编程笔记#小编为大家整理,主要介绍了云原生(业务)网络监控的建设思路与实现相关的知识,希望对你有一定的参考价值。


受新冠疫情的影响,国内企业上云步伐被加速,云网络的服务水平成为企业上云的基石。国内外多家第三方机构的调查报告显示,企业上云的重要原则之一是在尽可能不修改应用的前提下,保证业务体验的一致性。得益于良好的可移植性、轻量、敏捷等优点,以容器、微服务为代表的云原生技术在企业上云过程中扮演着越来越重要的角色。

如上图所示,企业IT基础设施云化过程中引入的容器显著地加剧了云数据中心网络的复杂性,并进一步放大了虚拟网络的“黑盒”效应,给企业的监控、运维与安全合规带来了更大的挑战。企业需要建立面向云的网络监控架构,使之具备物理网络、池内网络流量统一分发,资源、网络、应用一体化监控管理能力,以便全面掌握网络资源使用状态,提高云网整体保障能力。

- 0-



复杂系统的可观测性问题

解决云网监控的难题,首先在于破解网络流量的“黑盒”——亦即,网络流量数据的可视化。传统的物理服务器的状态通常可以通过几个监控指标进行描述,但是随着云(虚拟化)系统越来越复杂以及业务安全稳定运行的要求越来越高,需要监控的对象正渐渐从“基础设施”转到“应用”本身。下图描述了对一个复杂系统的感知程度和能够收集到的信息之间的关系,而在云原生的行业大趋势下,通过技术手段描述系统更全面的状态、解决复杂系统的可观测性正在成为业界共识。

云原生(业务)网络监控的建设思路与实现

云计算正在颠覆传统的IT服务模式,网络作为云计算基础设施背后的重要角色,也在不断进化。云原生技术尤其是微服务的引入成为了业务和网络深度融合的催化剂,对云网络的全面观测成为业务端强劲的驱动力或者说需求。在网络方面,传统的监控工具通常是为了监控设备而设计的,其基于静态配置文件的方法并不适用于微服务或容器。在容器环境中,容器以令人难以置信的速度被创建和销毁,要解决云原生(业务)网络的观测性问题必须从更深入的数据着手。从当前较为成熟的NPM和APM市场来看,日志、Metrics和Tracing是解决云网络可观测性的三类重要数据源。

云原生(业务)网络监控的建设思路与实现




- 0-



网络的时序特性及其指标

大多数现代监控系统为诸多不同的目的提供了大量的指标,用户很容易淹没其中,难以聚焦到与应用相关的核心数据上。鉴于网络具备独特的时序特性,我们应该更关注Metrics的数据,对于Tracing和日志数据,我们通常关注Service/Ingress前后L4流关联、L7服务请求关联以及相关日志信息。我们重点关注Metrics四个方面的指标量:



  • 第一个方面是时延,它刻画的是当前的业务系统的访问是否顺畅、耗费的时间是否在增加,是检测性能下降问题的一个重要标志。例如说我们从四层网络的角度看,有三次握手的时延、协议栈响应的时延;从应用的角度看,有HTTP响应的时延、DNS响应的时延。


  • 第二个方面是流量,更多的是刻画系统的吞吐。例如一个应用系统的BPS是多少、PPS是多少?新建连接数、新建连接速率是多少?HTTP的请求数是多少等?流量可以等同于吞吐量或者是速率这样的指标。


  • 第三个方面是错误,错误可能发生在网络层,比如TCP的建连失败、TCP的重置、TCP的重传、TCP的零窗口,还可能会发生在应用层,比如HTTP的400、500等错误或者是DNS解析失败。错误信息是一个非常好的指标,通常能说明更深层次的问题。我们不仅要检测显性错误,还要检测隐性错误,例如不当的网络配置信息。


  • 第四个方面是负载——通常来自于系统信息,一般来讲是对计算和存储资源的描绘,在虚拟网络情情况下也可以描述虚拟交换机的负载。网络层面的负载主要体现在并发连接数、当前正在活跃的用户数等指标。测量负载的关键是选择制约系统性能的指标,从Kubernetes节点获取系统指标与其他系统基本相同。


云原生(业务)网络监控的建设思路与实现

我们对网络的指标监控通常要考虑以上四个方面,这四个方面(外部可观测数据以及系统自身数据)能够覆盖一个分布式系统所有的角落,最终实现分布式系统的可观测。



- 0-


DeepFlow
®
云原生监控系统

如前文所述,企业上云的重要原则之一是在尽可能不修改应用的前提下,保证业务体验的一致性。同理,对于已经上云的业务进行监控,也要确保其符合“云原生”的特性。云杉网络自研的DeepFlow®正是这样一款云网络流量采集、分发、可视化与监控诊断产品,帮助企业在混合云环境中统一采集并分发任意工作负载之间的网络流量,实现对云原生业务关键路径的全面性能监控,并提供虚拟网络端到端的全路径诊断,解决企业分布式业务上云后遇到的监控、运维、安全等难题。

云原生(业务)网络监控的建设思路与实现

众所周知,云的特性是弹性、敏捷。不同于传统烟囱式的监控系统,DeepFlow®在部署方式、随云扩展、多云平台对接、分布式架构几个方面率先做到了弹性和敏捷。



支持多云平台统一的抽象采集层

为了提升DeepFlow®的适用性,云杉网络做了大量的工作适配主流的资源平台和云平台,并不是简单调用API,而是要与知识图谱等对接和关联起来的。目前,DeepFlow支持与20多个市场主流平台做资源信息的同步,通过抽象统一的采集层、构建了较为完备的网络知识图谱的体系。

部署方式无依赖、一键式云原生部署

DeepFlow®采集器软件针对不同的资源池提供不同形态的版本,以发挥最优的网络流量捕获能力。采集器以进程形态独立运行并支持一键部署,共有包括VMware ESXi采集器、KVM采集器、KVM-DPDK采集器、HyperV采集器、Workload-V/Workload-P采集器、容器OnVM采集器、容器OnHost采集器、专属服务器采集器等多个类型;对于裸金属设备资源池,获取其池内网络流量可通过Leaf交换机、接入交换机的端口镜像,汇总至TAP设备后交由专属服务器类型采集器实现对数据包处理操作,也可以选择将采集器安装在每一台需要采集的裸金属设备系统上。

云原生(业务)网络监控的建设思路与实现




开放架构、监控能力可随云扩展

DeepFlow®控制器按角色分为主控制器、备控制器、从控制器,用户可根据实际部署要求进行灵活选择。单一控制器可管理2000个采集器,足以覆盖一个可用区涉及的采集规模。主、备控制器与从控制器协同工作,控制器集群规模最大支持50台,整体可管理10万台采集器规模,可满足大型企业私有IT、公有云、容器等对云数据中心资源池建设持续演进的网络流量监控分析要求。此外,采集器不再是简单地获取网络流量管道,是具备对本地采集的网络流量进行处理的计算单元,众多采集器以及控制器构建成一个与云网规模一致的分布式流量处理系统。

云原生(业务)网络监控的建设思路与实现


DeepFlow®平台提供开放的数据供给服务。处理后的包头,网络元数据、遥测统计数据通过网络平面汇总至数据节点的高性能时序数据库中,用户可通过API、消息队列为其他数据消费平台调用,数据节点与控制器一样支持水平扩展。用户可在每个区域、可用区都可以配置高性能时序数据库。数据供给服务同时将采集与后端各类分析工具解耦,避免流量采集器局限在仅为单一工具服务的竖井中。



- 0-


总结

企业在上云过程中,云网融合会逐步加深、业务或者说应用对网络的依赖将会越来越大。企业在建设统一的监控体系时,需要秉持开放和解耦的原则,重点聚焦云端业务的核心数据,避免重复建设和系统绑定。







关于DeepFlow®




DeepFlow®是北京云杉世纪网络科技有限公司(以下简称云杉网络)推出的一款虚拟网络流量采集、可视化与分析产品。DeepFlow®软件基于x86集群和通用网络设备,支持集群部署,支持容器(Kubernetes)、OpenStack、vSphere虚拟化环境和AWS、阿里云、腾讯云等公有云环境,帮助企业在混合云环境中统一采集并分发任意工作负载之间的网络流量,实现对云端业务关键链路的全面性能监控,并提供业务网络端到端的全路径诊断。凭借领先一代的技术优势和完整的产品解决方案,DeepFlow®已在50多家世界500强企业落地部署,不断为客户提供云网络治理的最佳实践。



           















RECOMMEND







推荐阅读















 阅读原文   访问云杉网络官方网站!


推荐阅读
  • 流处理中的计数挑战与解决方案
    本文探讨了在流处理中进行计数的各种技术和挑战,并基于作者在2016年圣何塞举行的Hadoop World大会上的演讲进行了深入分析。文章不仅介绍了传统批处理和Lambda架构的局限性,还详细探讨了流处理架构的优势及其在现代大数据应用中的重要作用。 ... [详细]
  • Docker安全策略与管理
    本文探讨了Docker的安全挑战、核心安全特性及其管理策略,旨在帮助读者深入理解Docker安全机制,并提供实用的安全管理建议。 ... [详细]
  • 知识图谱与图神经网络在金融科技中的应用探讨
    本文详细介绍了融慧金科AI Lab负责人张凯博士在2020爱分析·中国人工智能高峰论坛上的演讲,探讨了知识图谱与图神经网络模型如何在金融科技领域发挥重要作用。 ... [详细]
  • 我的读书清单(持续更新)201705311.《一千零一夜》2006(四五年级)2.《中华上下五千年》2008(初一)3.《鲁滨孙漂流记》2008(初二)4.《钢铁是怎样炼成的》20 ... [详细]
  • 2017年软件开发领域的七大变革
    随着技术的不断进步,2017年对软件开发人员而言将充满挑战与机遇。本文探讨了开发人员需要适应的七个关键变化,包括人工智能、聊天机器人、容器技术、应用程序版本控制、云测试环境、大众开发者崛起以及系统管理的云迁移。 ... [详细]
  • 深入探讨:Actor模型如何解决并发与分布式计算难题
    在现代软件开发中,高并发和分布式系统的设计面临着诸多挑战。本文基于Akka最新文档,详细探讨了Actor模型如何有效地解决这些挑战,并提供了对并发和分布式计算的新视角。 ... [详细]
  • 为何Compose与Swarm之后仍有Kubernetes的诞生?
    探讨在已有Compose和Swarm的情况下,Kubernetes是如何以其独特的设计理念和技术优势脱颖而出,成为容器编排领域的领航者。 ... [详细]
  • 软件测试行业深度解析:迈向高薪的必经之路
    本文深入探讨了软件测试行业的发展现状及未来趋势,旨在帮助有志于在该领域取得高薪的技术人员明确职业方向和发展路径。 ... [详细]
  • 入门指南:使用FastRPC技术连接Qualcomm Hexagon DSP
    本文旨在为初学者提供关于如何使用FastRPC技术连接Qualcomm Hexagon DSP的基础知识。FastRPC技术允许开发者在本地客户端实现远程调用,从而简化Hexagon DSP的开发和调试过程。 ... [详细]
  • 从理想主义者的内心深处萌发的技术信仰,推动了云原生技术在全球范围内的快速发展。本文将带你深入了解阿里巴巴在开源领域的贡献与成就。 ... [详细]
  • 深入理解云计算与大数据技术
    本文详细探讨了云计算与大数据技术的关键知识点,包括大数据处理平台、社会网络大数据、城市大数据、工业大数据、教育大数据、数据开放与共享的应用,以及搜索引擎与Web挖掘、推荐技术的研究及应用。文章还涵盖了云计算的基础概念、特点和服务类型分类。 ... [详细]
  • 本文详细介绍如何在华为鲲鹏平台上构建和使用适配ARM架构的Redis Docker镜像,解决常见错误并提供优化建议。 ... [详细]
  • 如何在U8系统中连接服务器并获取数据
    本文介绍了如何在U8系统中通过不同的方法连接服务器并获取数据,包括使用MySQL客户端连接实例的方法,如非SSL连接和SSL连接,并提供了详细的步骤和注意事项。 ... [详细]
  • 深入解析:存储技术的演变与发展
    本文探讨了从单机文件系统到分布式文件系统的存储技术发展过程,详细解释了各种存储模型及其特点。 ... [详细]
  • JUC并发编程——线程的基本方法使用
    目录一、线程名称设置和获取二、线程的sleep()三、线程的interrupt四、join()五、yield()六、wait(),notify(),notifyAll( ... [详细]
author-avatar
氣質正妹_384
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有