作者: 梁尔舒
转载自:浅谈性能优化与稳定性保障实践
序言
良好的用户体验是业务持续增长的基础,而稳定性又是服务的基石。试想如果用户在商城购物时发现展位白屏,用户在搜索框搜索时,3秒后才返回结果,首先用户侧必然造成极差的用户体验,进而流失客户同时带来直接的企业损失。从产研侧,服务不稳定别说去“追求卓越“了,很可能会影响员工的绩效。在我们场景下,随着业务的迅猛发展:业务量的飞升、团队的快速扩张,对系统的稳定性和性能不断的提出新的挑战,记得团队内有段时间,几乎每次上线都存在大大小小的问题,稳定性问题是对团队专业能力的挑战,于此我们推动了稳定性保障及性能优化建设的项目,并在季度内采取了一系列的稳定性措施,并最终取得了卓有成效的成果,为将来在业务和技术层面探索更多的可能性铺平了道路。本篇文章就稳定性问题,浅薄的谈一谈我们的实践。
手段
采用自上而下的思路,先带着大家讨论手段,结合业务痛点,举出实例,解释原因。
总结
稳定性是一个先有意识再有能力的事。很多时候缺少的是对系统黑天鹅的认知,总是倾向性的过分依赖系统,系统越复杂(实际上越脆弱),更让人觉得可依赖,而诞生的黑天鹅往往也更大。所以我们在实践中,不仅要做好亡羊补牢的事情,更要未雨绸缪,重视并及时处理星星之火,增强系统的“反脆弱性“。最后我想以这句话作为结尾,与大家共勉!
“平稳二字极可玩,盖天下之事,惟平则稳。行险亦有得的,终是不稳,故君子居易。”——曾国藩