热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

数据库技术:面对大促DevOps怎么做?这里有一份京东11.11DevOps备战指南

今年11.11,从0点到23点59分,京东11.11全球热爱季累计下单金额突破2715亿元,创造了新的记录。随着GMV和买家数不断创新高,要应对几何级增长的大促需要跨多个团

面对大促DevOps怎么做?这里有一份京东11.11 DevOps备战指南

今年11.11,从0点到23点59分,%ignore_a_1%11.11全球热爱季累计下单金额突破2715亿元,创造了新的记录。随着GMV和买家数不断创新高,要应对几何级增长的大促需要跨多个团队协同,云资源使用也越来越多,从几百到几千、上万,每个都核对一遍基本不现实,京东智联云DevOps作为京东智联云的核心技术产品,能实现研发、测试、运维高效协同,提升务交付效率和稳定性,并能通过服务与资源管理持续交付智能监控三大应用场景,快速发现问题-定位问题-解决问题。

面对大促DevOps怎么做?这里有一份京东11.11 DevOps备战指南

▲京东智联云DevOps在2019年跻身IDC MarketScape中国DevOps云市场"Major Players"位置▲

 

面对大促DevOps怎么做?这里有一份京东11.11 DevOps备战指南

监控是研发、运维人员的眼睛,对服务进行多维度立体的观测,才能确保故障出现的时候第一时刻发现。京东智联云监控为用户提供如下建议:

面对大促DevOps怎么做?这里有一份京东11.11 DevOps备战指南

京东智联云监控提供从浏览器->边缘节点(CDN)-> 负载均衡 –> 服务器全链路的监控覆盖, 通过定义监控标准,为用户添加监控,帮助用户覆盖监控提供方法、工具上的支持。

 

面对大促DevOps怎么做?这里有一份京东11.11 DevOps备战指南

监控标准分为四层,我们从下往上看:

重点系统在日常工作中往往已经在安全方面进行了重点关注,在大促备战期间主要关注:

  • 首先是基础监控,这一层主要解决机器、网络层面的问题,包括我们常见的CPU、内存,机器死机等问题;

  • 然后是存活性监控,解决程序部署到机器上后,是否存活的问题,比如进程退出,端口发送一个ping过去,没有返回pong;

  • 再上一层,则是性能监控,重点关注Google提出的四大黄金指标pv、平响、错误码和容量等,解决分布式程序的定界问题(比如通过访问MySQL的时间飙升知道是下游MySQL的问题);

  • 最上层是业务监控,模拟用户进行访问,解决服务在用户侧的表现是什么。

有了标准,设计的监控系统就能按照标准来落地,可以给出一些数据化的运营指标,推动监控的完善。

 

基于对业务配置的指标采集、告警规则的分析,帮助用户分层级地发现监控配置当中的疏漏,提醒用户在各个层级配置监控,提升监控覆盖度。 

面对大促DevOps怎么做?这里有一份京东11.11 DevOps备战指南

面对大促DevOps怎么做?这里有一份京东11.11 DevOps备战指南

所谓上工治未病。除去配置覆盖完整的报警,及时排查服务的潜在风险,避免大促流量洪峰时期出现服务质量的问题,日常巡检必不可少,京东智联云智能监控提供內建基础资源巡检大盘,帮助用户快速发现资源不足问题。

面对大促DevOps怎么做?这里有一份京东11.11 DevOps备战指南

同时,京东智联云自研时序数据存储支持OpenTSDB/Prometheus协议,便于集成Grafana组件,方便用户自行定制大屏。除去时序数据指标,京东智联云还提供基于日志的实时指标提取方案,可以对接报警、展示。

面对大促DevOps怎么做?这里有一份京东11.11 DevOps备战指南

如果我有一小时拯救地球,我会用59分钟界定问题,然后用1分钟解决它 。

——爱因斯坦

当故障发生,定位问题的边界,快速寻找根因是缩短整个故障处理MTTR的重中之重。京东智联云智能监控从“宏观”定界到“微观”定位角度,通过联合事件、日志、应用异常多维度数据,帮助用户缩短定位问题时间。

面对大促DevOps怎么做?这里有一份京东11.11 DevOps备战指南

故障往往由“流量下降”、“页面打不开了”等黑盒类检测发现,但问题的具体所在并不能通过此类告警发现。而故障发生往往与变更有关,帮助业务人员快速了解到故障时段,究竟出现过哪些模块的调整,来推断问题的边界就有很大的帮助。

 

智能监控集成关联应用的各类变更操作,消除业务人员的信息屏障,为业务人员提供“上帝视角”,可以从宏观层面了解到当前各个子系统都在发生些什么,能够更好帮助用户找到具体的故障原因以及故障故障模块。

面对大促DevOps怎么做?这里有一份京东11.11 DevOps备战指南

面对大促DevOps怎么做?这里有一份京东11.11 DevOps备战指南

在确认问题边界之后,接下来就是对具体故障原因的分析了,京东智联云日志服务提供对服务日志订阅、检索、分析等多方面功能。承载 PB 级日志业务,提供低成本、高性能的完整解决方案。通过现场日志查看、以及日志分析任务等功能,从“白盒”的角度观测业务当前正在出现的异常。

面对大促DevOps怎么做?这里有一份京东11.11 DevOps备战指南

▲业务架构▲


面对大促DevOps怎么做?这里有一份京东11.11 DevOps备战指南

微观层面,京东智联云监控团队推出自主研发的无侵入式的故障诊断平台JEX, 实时捕获异常,可以在线开启火焰图,捕获CPU/内存热点,行级别定位代码问题,大幅缩短研发人员排查故障时间。通过集成JEX, 研发人员可以在第一时间获取业务Exception的具体情形,JEX可以保留异常事件发生的环境信息,方便研发复现以及定位代码问题所在。

面对大促DevOps怎么做?这里有一份京东11.11 DevOps备战指南

凡事预则立不预则废

故障发生第一时刻应该执行止损操作,避免对线上业务造成持续的影响。京东智联云DevOps平台通过不断的压测、破坏性演练,保障了在历次大促期间平稳运行。通过对故障处理实践的不断总结凝练,京东智联云DevOps推出预案平台,作为研发、运维同学的“手脚”,为业务方提供快速止损的能力。我们将预案分类为流量处理扩缩容降级数据恢复主备切换等几大维度,指导用户自流量入口到后端存储建立完善的预案体系。同时提供可自动执行以及可手工执行的预案,针对不同团队不同运维场景的故障止损操作。

 

预案平台提供webhook、对接DevOps平台控制系统两种方式分别应对不同场景的故障自愈。

面对大促DevOps怎么做?这里有一份京东11.11 DevOps备战指南

京东智联云智能监控支持对告警配置添加webhook的形式来打通故障的发现处理环节。用户可以定制自己的webhook API, 实现数据分析、故障处理、自行的消息通知等不同场景的扩展。

面对大促DevOps怎么做?这里有一份京东11.11 DevOps备战指南

智能监控预案平台通过直接对接DevOps控制系统,调用用户自行编写的脚本、在指定的服务器上进行止损操作,以此达到降低用户编写预案的成本。

 

面对大促DevOps怎么做?这里有一份京东11.11 DevOps备战指南

与市面通用型产品不同的是,京东智联云DevOps能力起源于自身的业务实践,针对京东集团的复杂业务场景打造并经受住多次618、11.11电商大促的严峻考验,保证了高效高质的交付和对变化的灵活应对。

 

京东智联云DevOps平台与京东智联云的公有云平台深度集成,对用户运行在京东智联云上的系统提供统一的运维入口,提升服务交付效率和稳定性,实现高效的自动化研发运维。它不仅能将运维管理与企业组织结构相匹配,设置基于角色的权限管理,满足企业层次化运维管理;还能从保障用户业务稳定性的角度,自动为宕机服务器上运行的容器(云主机)重新迁移并生成新的实例、保障业务不掉线、高可靠运行,并自动监控服务健康状态、动态调整集群、实时调度相关预案、实现故障自愈。

面对大促DevOps怎么做?这里有一份京东11.11 DevOps备战指南

面对大促DevOps怎么做?这里有一份京东11.11 DevOps备战指南

面对大促DevOps怎么做?这里有一份京东11.11 DevOps备战指南

面对大促DevOps怎么做?这里有一份京东11.11 DevOps备战指南

面对大促DevOps怎么做?这里有一份京东11.11 DevOps备战指南

面对大促DevOps怎么做?这里有一份京东11.11 DevOps备战指南

数据库技术:面对大促DevOps怎么做?这里有一份京东11.11 DevOps备战指南地址:https://blog.csdn.net/jdcdev_/article/details/109665166

需要了解更多数据库技术:面对大促DevOps怎么做?这里有一份京东11.11 DevOps备战指南,都可以关注数据库技术分享栏目—编程笔记


推荐阅读
  • 流处理中的计数挑战与解决方案
    本文探讨了在流处理中进行计数的各种技术和挑战,并基于作者在2016年圣何塞举行的Hadoop World大会上的演讲进行了深入分析。文章不仅介绍了传统批处理和Lambda架构的局限性,还详细探讨了流处理架构的优势及其在现代大数据应用中的重要作用。 ... [详细]
  • Uniswap 与 MoonPay 合作,引入法币交易功能。本文探讨这一合作对用户进入加密货币领域的安全性及便利性的影响。 ... [详细]
  • 近期尝试从www.hub.sciverse.com网站通过编程手段获取数据时遇到问题,起初尝试使用WebBrowser控件进行数据抓取,但发现使用GET方法翻页时,返回的HTML代码始终相同。进一步探究后了解到,该网站的数据是通过Ajax异步加载的,可通过HTTP查看详细的JSON响应。 ... [详细]
  • 入门指南:使用FastRPC技术连接Qualcomm Hexagon DSP
    本文旨在为初学者提供关于如何使用FastRPC技术连接Qualcomm Hexagon DSP的基础知识。FastRPC技术允许开发者在本地客户端实现远程调用,从而简化Hexagon DSP的开发和调试过程。 ... [详细]
  • 从理想主义者的内心深处萌发的技术信仰,推动了云原生技术在全球范围内的快速发展。本文将带你深入了解阿里巴巴在开源领域的贡献与成就。 ... [详细]
  • 本文探讨了在一个物理隔离的环境中构建数据交换平台所面临的挑战,包括但不限于数据加密、传输监控及确保文件交换的安全性和可靠性。同时,作者结合自身项目经验,分享了项目规划、实施过程中的关键决策及其背后的思考。 ... [详细]
  • 深入解析WebP图片格式及其应用
    随着互联网技术的发展,无论是PC端还是移动端,图片数据流量占据了很大比重。尤其在高分辨率屏幕普及的背景下,如何在保证图片质量的同时减少文件大小,成为了亟待解决的问题。本文将详细介绍Google推出的WebP图片格式,探讨其在实际项目中的应用及优化策略。 ... [详细]
  • 新浪微博热搜暂停更新;即刻APP回归;Android 11 Beta版发布 | 科技新闻速递
    为您带来最新的科技资讯,涵盖社交媒体动态、软件更新及行业重大事件。CSDN携手您共同关注科技前沿。 ... [详细]
  • 本文将深入探讨 Unreal Engine 4 (UE4) 中的距离场技术,包括其原理、实现细节以及在渲染中的应用。距离场技术在现代游戏引擎中用于提高光照和阴影的效果,尤其是在处理复杂几何形状时。文章将结合具体代码示例,帮助读者更好地理解和应用这一技术。 ... [详细]
  • Flutter 核心技术与混合开发模式深入解析
    本文深入探讨了 Flutter 的核心技术,特别是其混合开发模式,包括统一管理模式和三端分离模式,以及混合栈原理。通过对比不同模式的优缺点,帮助开发者选择最适合项目的混合开发策略。 ... [详细]
  • 在拉斯维加斯举行的Interop 2011大会上,Bitcurrent的Alistair Croll发表了一场主题为“如何以云计算的视角进行思考”的演讲。该演讲深入探讨了传统IT思维与云计算思维之间的差异,并提出了在云计算环境下应具备的新思维方式。Croll强调了灵活性、可扩展性和成本效益等关键要素,以及如何通过这些要素来优化企业IT架构和运营。 ... [详细]
  • 如何有效防御网络攻击,确保软件系统安全稳定运行?
    如何有效防御网络攻击,确保软件系统安全稳定运行? ... [详细]
  • java电商,java电商项目面试题
    本文目录一览:1、为什么很多商家选择Java商城系统? ... [详细]
  • “测试人生”第一篇文章,献给2019年的移动测试开发大会MTSC。这一次,非常荣幸能够来到北京国际会议中心参会,一睹国内质量保障工作的现状 ... [详细]
  • 关于ScrumXPDevOps的学习
    最近听了ECUG大会上孙敬云老师的分享感觉受益匪浅,毕竟大学课本上只讲到瀑布模型就没有下文了,工作以后一直贯彻的都是Scrum路线,一直也没有时间好好的去学习整理这部分的知识,直到 ... [详细]
author-avatar
ooleysciacca
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有