热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

今年的“双11”无惊无险,每日优鲜的运维团队是怎么做到的?

今年,美国知名项目管理研究杂志PMNetwork将“天猫双11”与互联网、阿波罗登月、人类基因组计划等并列,共称为世界上TOP50最有影响力的项目。“双

今年,美国知名项目管理研究杂志PM Network将“天猫双11”与互联网、阿波罗登月、人类基因组计划等并列,共称为世界上TOP50最有影响力的项目。“双11”不仅改变了人们购物的方式,而且打通了商业与娱乐。

因为可以带来数倍于平常的流量和销售额,所以每年的“双11”到来时,各路零售商们都会“如临大敌”,严阵以待。在极限高并发访问的情况下,在线交易系统、支付系统等能否经受得住考验呢?

每日优鲜运维总监周锋在分享经验

最初几年,因为对“剁手党们”在“双11”期间的购买程度估计不足,曾经出现过个别商家的系统不堪重负而宕机的情况。近几年 “双11”期间这种系统宕机的新闻越来越少,因为各商家在“双11”到来前已经做好了充足的准备。被誉为“最懂吃货心的电商”——每日优鲜,在今年的“双11”到来前差不多两个月就开始了各项准备工作,所以真正在“双11”期间,其业务系统没有出现任何问题,安然度过。在UCloud于11月23日举行的UClub新零售技术沙龙上,每日优鲜运维总监周锋用8个字概括了他今年的“双11”体验:无惊无险,风平浪静。

01

外松内紧,不打无准备之仗

真的是无惊无险,风平浪静吗?其实,正是因为每日优鲜公司高层的充分重视,运维、研发、业务等各个部门协调一致,以及云服务商UCloud的支持,每日优鲜在面对“双11”这场大考时才会气定神闲。

或许,用“外松内紧”四个字来形容每日优鲜备战“双11”会更恰当。俗话说,兵马未动,粮草先行,为了从容应对“双11”,资源准备必须先行。最近两年,每日优鲜都是按照周六日交易峰值的4倍为“双11”设定余量。为了消除不同区域在不同时间段的交易峰值,运维团队还要时刻准备着,根据实时交易情况削峰填谷。

从9月20到10月31日,每日优鲜针对“双11”期间可能出现的各种情况和需求,从业务运营、架构运营、系统运营等多个维度进行了全面梳理,并针对可能会出现瓶颈的地方进行了详细了解,准备预案,尤其是进行了一系列高强度、全方位的压力测试。据周锋介绍,从9月20日起,每隔三天就会进行一次大的压测,而且每天都会有小压测,包括全链路的压测、写压测,以及故障演练、第三方服务出现问题后的应对等。因为做好了全面的准备工作,所以今年“双11”到来时,每日优鲜上上下下心里非常有底。

“双11”活动期间,每日优鲜特意在北京总部大楼的11层设立了作战室,从总指挥到研发团队的架构师、所有运维人员,以及运营、技术和产品的对接人,从早上8点就全部到岗,一份分工明细的保障时间表,不仅包括所有一线参战人员和备战人员,而且按照每个小时分批次排定工作内容,在办公室的、在路上的、在各个分支构的人员,都遵照既定的节奏,有条不紊地处理自己手中的工作

因为每日优鲜的IT系统100%托管在公有云平台上,所以每日优鲜的“双11”之战,也有云服务商UCloud紧密配合与协作。除了充足资源的准备,UCloud协助将每日优鲜云资源打散,避免业务过于集中承载而出现问题;同时将一些历史的监控数据、风险分析和评估数据给到每日优鲜作为参考,双方共同研判在“双11”期间可能会出现哪些意外状况和风险,提前进行优化、迁移、加固等工作,以降低风险。此外UCloud还派专人提供驻场服务,确保在问题发生时能够第一时间响应和解决。

 “在今年之前,每次‘双11’来临时,我们都会比较紧张,整个过程中会消耗大量人力物力资源,感觉身心比较疲惫。”周锋坦言,“但是今年有很大不同,‘双11’技术保障再次升级,公司内部各业务部门之间充分沟通和配合,提前做好准备,为所有工作设定优先级,并确定每项工作的深度,归纳出方法论。正因为如此,今年的‘双11’保障工作才会游刃有余。”

02

背后的技术准备

每年的“5·17”“6·18”“双11”“双12”,再加上商家的店庆,还有各种各样的节假日,现在的大促似乎变成了常态。这些促销日对“剁手党”来说是一场场的狂欢,而对于商家的IT运维团队来说则是一场又一场不能有丝毫松懈的战斗,会耗费大量精力和体力。

在大促前的准备阶段,IT运维团队要根据业务部门提出的要求,比如要做多少波秒杀、发多少张券等,研究如何分配现有资源,是否需要扩容并且扩多少,最大流量洪峰可能出现在何时,如何针对复杂架构实现统一监控,以及如何快速定位问题并顺利解决。

商家平时的销售和一般的促销活动,用户访问量通常是线性的或可以预测的。而像“双11”这样的大促,通常流量是很难提前预估的。另外,为了达到预定的业绩目标,业务部门可能会在某一关键时间点上临时抛出一个新的营销手段,比如在晚上11点发出一波红包,这时可有会引发瞬间流量激增。这些临时出现的情况,随意性大,很可能导致技术瓶颈出现,所以作为IT运维人员,必须和业务部门保持密沟通,确保在几分钟内解决问题。

“瓶颈总是存在的,这就需要不同的部门之间相互磨合,及时沟通,才能在瓶颈出现前,消峰填谷,及时化解。”周锋表示。

在“双11”之前,UCloud对每日优鲜的运营活动计划有了充分了解,提前优化IT架构的承载能力,这是应对瞬时高并发流量的前提条件。从9月20日开始,每日优鲜的运维部门召集运营部门一起梳理促销活动指标,预估发券、流量等数据。每日优鲜的运维团队负责把这些“业务语言”翻译成“技术语言”,如哪些代码、模块、服务、系统需要特别关注或者优化,然后再由云服务商UCloud将其翻译成“云端资源语言”,比如需要扩容多少云主机、多大带宽、负载均衡,以及交付节奏等,从而保证在“双11”期间,一切交易尽在掌握。

每日优鲜2019“双11”战报

每日优鲜发布的今年“双11”的战报显示:销售额为去年同期的2.7倍,最快的一笔订单配送到用户仅用时5分51秒,刷新了纪录,而运维部门的零故障完美地支撑了业务的“巅峰时刻”。

03

当“双11”成了“新常态”

无论是从知名度、影响力,还是带来的流量、销售额来看,其他的促销活动还不可能与“双11”相提并论。所以,每年的“双11”,每日优鲜都会提前做好一切准备措施,但紧张的运维工作也会让周锋和他的团队一度“忙到跳脚”。

从长远来看,各种促销会变成“新常态”,而每日优鲜通过像“双11”这样的大促,可以不断积累经验,并形成一套涵盖技术、流程和管理的方法论,使之标准化、自动化,并可在每个促销活动时复制,尽量采用标准化、自动化的流程、配置,减少人为参与的环节,这样不仅可以提高效率,而且减轻了运维等团队的工作负担。这对周锋和他的团队来说又是一个新课题。

长按二维码识别关注云报

云报

小编微信:Taogebj

联系邮箱:15327768@qq.com


推荐阅读
  • 2019年后蚂蚁集团与拼多多面试经验详述与深度剖析
    2019年后蚂蚁集团与拼多多面试经验详述与深度剖析 ... [详细]
  • Python 数据可视化实战指南
    本文详细介绍如何使用 Python 进行数据可视化,涵盖从环境搭建到具体实例的全过程。 ... [详细]
  • 2021年Java开发实战:当前时间戳转换方法详解与实用网址推荐
    在当前的就业市场中,金九银十过后,金三银四也即将到来。本文将分享一些实用的面试技巧和题目,特别是针对正在寻找新工作机会的Java开发者。作者在准备字节跳动的面试过程中积累了丰富的经验,并成功获得了Offer。文中详细介绍了如何将当前时间戳进行转换的方法,并推荐了一些实用的在线资源,帮助读者更好地应对技术面试。 ... [详细]
  • 本文深入解析了Spring Cloud路由网关Zuul的核心功能及其典型应用场景。通过对方志朋老师教材的学习和实践,详细探讨了Zuul在微服务架构中的重要作用,包括请求路由、过滤器链管理以及服务动态扩展等关键特性。同时,结合实际案例,展示了Zuul在高并发和复杂业务场景下的应用优势,为读者提供了全面的技术参考。 ... [详细]
  • 近年来,BPM(业务流程管理)系统在国内市场逐渐普及,多家厂商在这一领域崭露头角。本文将对当前主要的BPM厂商进行概述,并分析其各自的优势。目前,市场上较为成熟的BPM产品主要分为两类:一类是综合型厂商,如IBM和SAP,这些企业在整体解决方案方面具有明显优势;另一类则是专注于BPM领域的专业厂商,它们在特定行业或应用场景中表现出色。通过对比分析,本文旨在为企业选择合适的BPM系统提供参考。 ... [详细]
  • 篇首语:本文由编程笔记#小编为大家整理,主要介绍了软件测试知识点之数据库压力测试方法小结相关的知识,希望对你有一定的参考价值。 ... [详细]
  • 自动驾驶中的9种传感器融合算法
    来源丨AI修炼之路在自动驾驶汽车中,传感器融合是融合来自多个传感器数据的过程。该步骤在机器人技术中是强制性的,因为它提供了更高的可靠性、冗余性以及最终的 ... [详细]
  • Java作为全球最流行的编程语言之一,应用广泛。本文将详细介绍Java开发的相关岗位及其具体职责,帮助读者更好地了解这一领域的职业发展路径。 ... [详细]
  • 本文详细介绍了Java代码分层的基本概念和常见分层模式,特别是MVC模式。同时探讨了不同项目需求下的分层策略,帮助读者更好地理解和应用Java分层思想。 ... [详细]
  • 秒建一个后台管理系统?用这5个开源免费的Java项目就够了
    秒建一个后台管理系统?用这5个开源免费的Java项目就够了 ... [详细]
  • 在拉斯维加斯举行的Interop 2011大会上,Bitcurrent的Alistair Croll发表了一场主题为“如何以云计算的视角进行思考”的演讲。该演讲深入探讨了传统IT思维与云计算思维之间的差异,并提出了在云计算环境下应具备的新思维方式。Croll强调了灵活性、可扩展性和成本效益等关键要素,以及如何通过这些要素来优化企业IT架构和运营。 ... [详细]
  • 解读中台架构:微服务与分布式技术的区别及应用
    中心化与去中心化是长期讨论的话题。中心化架构的优势在于部署和维护相对简单,尤其在服务负载较为稳定的情况下,能够提供高效稳定的性能。然而,随着业务规模的扩大和技术需求的多样化,中心化架构的局限性逐渐显现,如扩展性和故障恢复能力较差。相比之下,微服务和分布式技术通过解耦系统组件,提高了系统的灵活性和可扩展性,更适合处理复杂多变的业务场景。本文将深入探讨中台架构中微服务与分布式技术的区别及其应用场景,帮助读者更好地理解和选择适合自身业务的技术方案。 ... [详细]
  • 从无到有,构建个人专属的操作系统解决方案
    操作系统(OS)被誉为程序员的三大浪漫之一,常被比喻为计算机的灵魂、大脑、内核和基石,其重要性不言而喻。本文将详细介绍如何从零开始构建个人专属的操作系统解决方案,涵盖从需求分析到系统设计、开发与测试的全过程,帮助读者深入理解操作系统的本质与实现方法。 ... [详细]
  • 建立项目接口文档_【学习】接口测试工具对比
    如今,接口测试工具这个市场,种类非常多,非常繁杂。国外接口测试工具巨头:postman、jmeter和loadrunner等 ... [详细]
  • t-io 2.0.0发布-法网天眼第一版的回顾和更新说明
    本文回顾了t-io 1.x版本的工程结构和性能数据,并介绍了t-io在码云上的成绩和用户反馈。同时,还提到了@openSeLi同学发布的t-io 30W长连接并发压力测试报告。最后,详细介绍了t-io 2.0.0版本的更新内容,包括更简洁的使用方式和内置的httpsession功能。 ... [详细]
author-avatar
等一场-花开花落
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有