热门标签 | HotTags
当前位置:  开发笔记 > 运维 > 正文

阿里云弹性计算技术专家樊毅伟:云上成本优化实践

摘要:2022年8月16日,高效能,才经济|云上自动化运维CloudOps系列沙龙_第三弹正式开启,阿里云弹性计算技术专家樊毅伟,为我们带来了题为“云上成本优化实践”的主题分享,以

摘要:2022 年 8 月 16 日,高效能,才经济 | 云上自动化运维 CloudOps 系列沙龙_第三弹正式开启,阿里云弹性计算技术专家樊毅伟,为我们带来了题为“云上成本优化实践”的主题分享,以下是他的演讲内容整理,本篇内容主要分为五个部分:

1.   云上成本控制的必要性

2.   付费方式与资源规格选型

3.   提升资源利用率

4.   成本管理

5.   用户问答

 

 


01 云上成本控制的必要性

 

 

如上图所示,Flexera 2022 年云状态报告数据显示,受访企业认为他们云开支里有 32%是浪费的,高于去年的 30%。

 

根据中国信息通信研究院的云 MSP 服务发展调查报告显示,成本优化成为企业云管理的首要需求。云上成本控制是很多企业面临的难题、痛点。

 

 

云上和云下的成本管理体系有很大的差别。在云下,企业对 IT 资产是一次性采购,一次性支付金额。在云上,企业的 IT 资产变成按需索取,按量付费。

 

目前,企业在云上的成本控制面临很大的挑战。首先,云上成本管理需要多部门协作。比如财务/采购、技术/运维、产品/业务等团队进行协作。各部门在协作过程中,形成实时的决策体系。因为云资源的计费方式多种多样,所以企业需要深度理解云资源计费

 

其次,企业需要及时的成本报告、监控体系

 

最后,企业需要完成多云场景适配。面对多云场景,各个云有不同的计费方式,企业需要针对性地进行适配,控制自己的成本。

 

 

企业的云上成本控制的方法,主要分为四个模块。第一,选择合适的付费方式;第二,选择合适的资源规格;第三,提升资源利用率;第四,成本分析与监控。

 


02 付费方式与资源规格选型

 

 

以阿里云的 ECS 为例,ECS 主要有三种产品形态,分别是按量付费、包年包月、抢占式实例

 

这三种产品形态对应了不同的产品功能,本质是经济性、灵活性和确定性三者的平衡

 

按量付费的灵活性非常高,可以随时创建、释放、升配、降配,没有任何限制。但它的缺点是比较贵,经济性较差。

 

包年包月是预付机制,它的经济性较好,价格便宜。但它的灵活性较差,资源跟财务绑定。抢占式实例的经济性非常好,价格非常便宜,但确定性较差。

 

 

抢占式实例有两个特点。

 

第一,比按量付费的价格更便宜,最低可以达到一折。

第二,确定性较差。它在稳定运行一小时后,随时可能被系统释放。使用抢占式实例,适合无状态的任务型场景,可以大幅降低成本。

 

 

接下来,介绍一下预留实例券。包年包月的资源跟财务绑定在一起,退款、降配有很多限制。按量付费的 ECS 加预留实例券,主要解决包年包月的灵活性问题。

 

当 ECS 的实例规格和预留实例券匹配,按量付费的 ECS 就不会出账,只会收取 ECS 预留实例券的费用。

 

由于预留实例券是预付或锁定时长的理念,所以它比按量付费更便宜,极大降低成本。预留实例券有零预付、部分预付和全预付。

 

按量付费的 ECS 可以每小时出账,随时释放,也是零预付的方式,但预留实例券的零预付与此不同,是指用户购买了一定的时长,不能随时退款或退订。当用户承诺使用一年,每个小时付款,就必须使用一年。

 

部分预付是指用户先付一部分,系统会每小时扣除剩下的金额。全预付和包年包月一样,一次性付清所有的钱。

 

 

为了解决预留实例券不够灵活的问题,阿里云推出了节省计划。相比预留实例券,它能够满足 DevOps,容器化,多规格族,多地域部署等场景下,资源购买账单抵扣需求。

 

节省计划分为两种,即通用型和 ECS 型。通用型没有任何限制,可以直接抵扣 ECS 的按量付费账单。ECS 型有一小部分的限制,即地域规格族的限制。与此同时,节省计划支持多种产品,如 ECS、ECI、RDS 等等。

 

 

某电商用户一直在用包年包月,资源需求不稳定,算力需求变化快。在升降配和退款上产生隐形成本。通过节省计划搭配按量付费,资源随开随用,随时调整,总价稳定,切换后总成本降低 9%

 

某在线教育用户,不同时段对资源需求有不同。该用户白天一部门使用一批资源,晚上另一部门使用另一批资源。包年包月资源有近一半时间在浪费。节省计划搭配按量付费,跨规格族折扣权益共享,切换后总成本降低 42%

 

某游戏用户对弹性要求较高,资源池必须基于按量付费构建,导致按量付费的费用非常高。该用户直接购买节省计划,无需任何改造,总成本直接降低 56%。资源保障侧搭配容量预留,无费用增加,按量创建成功率 100%。

 

 

综上所述,建议用户将多种付费类型,组合使用。因为不同的付费方式,有不同的使用场景

 

抢占式实例支撑无状态、任务型的业务负载。按量付费实例支撑有状态、动态变化型的业务负载。包年包月实例,按量实例+抵扣类产品支撑稳定的业务负载。

 

 

如上图所示,对计算资源各付费方式进行了比对。其中,计算资源的灵活性主要是指,资源是否可以随意创建、释放、变配,以及资源与财务的耦合程度。

 

 

如上图所示,对存储资源各付费方式进行比对。其中,按量付费卸载和释放均无限制,适用于不定时弹性的业务。

 

 

如上图所示,对网络资源各付费方式进行了比对。其中,按固定带宽计费适用于较稳定的业务,按使用流量计费适用于突刺性的业务场景,即偶尔流量特别大,大部分场景流量比较小。

 

共享流量包适用于对流量有一定预估能力的场景,否则流量包购买过大或未及时抵扣,都会造成浪费。

 

 

上图展示了资源规格选型的场景分类,用户可以根据自身场景,进行选择。只有选择适合自身业务场景的规格才能获得最优性价比。

 

如共享类的突发性能实例 t5/t6 成本低廉,非常适合轻量级 web 应用、开发/测试环境等低性能负载业务场景。价格可达相应独享规格的 30%到 60%。

 

如某电商网站根据自身业务特点选择计算型实例(4vCPU),相比通用型,成本降低 20%以上。

 

 

在资源规格选型方面,建议大家选择最新一代。因为最新一代意味着云厂商的软件或硬件进行了技术升级,可以享受云计算的技术红利,与之相呼应的是 2022 年 7 月 6 日阿里云发布官方公告:C6/C7,G6/G7,R6/R7 部分地域价格下调 9%到 19%。

 


03 提升资源利用率

 

 

提升资源利用率,主要针对抵扣类产品。因为抵扣类产品存在匹配不到,使用率、覆盖率不够的情况。所以预估容量很难达到 100%。用户需要关注关注抵扣类产品使用率、覆盖率。

 

如果发现容量达到 100%,可能有一部分账单无法被抵扣。用户需要加购或重新购买预留实例劵或节省计划产品。

 

 

除此之外,弹性伸缩可以有效提升资源利用率。弹性伸缩分为垂直弹性和水平弹性。垂直弹性是指,实例数量的增加或减少,比如 100 台 ECS 变成 200 台或 50 台。水平弹性是指,某台 ECS 的 CPU 内存增加或减少,升配或降配。

 

两种弹性伸缩模式都支持定时模式、动态模式、动态预测模式、健康模式、手工模式、以及多种模式叠加使用。

 

 

上图展示了,其他降本增效的方法。抢占式实例可借助诸如弹性供应、弹性伸缩产品来实现算力集群的稳定交付。

 

按量付费实例若长期使用,可转为包年包月,可选择按周付费。也可购买预留实例券、节省计划等抵扣类产品降低成本。开启节省停机模式,可借助自动化运维工具 OOS 产品实现周期性定时开关机。

 

包年包月实例可开启自动续费,借助统一到期日来提升续费效率。若不再使用,可退订或转按量付费。

 

带宽可借助自动化运维工具 OOS 实现周期性定时升降带宽峰值。购买共享带宽包、共享流量包,多产品间带宽可以互相复用,统一管理。

 

除此之外,用户可以授权智能顾问 Advisor 产品,定期扫描自身资源,给出成本优化建议。借助用户中心成本分析功能,进行费用分析与优化。

 


04 成本管理

 

 

从财务人员的角度看,成本管理有四个需求。

 

第一,清楚地知道企业内部各个部门每月消费了多少金额。

第二,  设置预算来管理各个部门的开支。

第三,需要工具从各个维度分析 &感知自身成本,判断自身成本是否合理,是否有优化空间。

第四,成本异常检测能力。

 

 

在创建资源时,系统会根据分配策略,使用标签将资源自动分配到部门或团队。

 

从而清晰地看到每个团队、每个部门消耗了多少钱。

 

 

预算管理是指,用户根据一定的条件设置预算。如果超过预算,用户可以设置预警,发送邮件或短信。

 

 

成本分析与优化是从各个维度分析成本是否合理。用户可以根据标签,产品、地域、可供区域、实例规格等条件进行筛选和分析。

 

 

成本异常检测通过人工智能算法,识别费用波动异常。异常检测支持评估反馈,用户的反馈结果会参与训练算法,反馈越多、越准确,越有利于提升检测准确率。

 

 

包年包月、按量付费、抢占式实例、预留实例券等付费方式,是经济性、确定性、灵活性的平衡。企业需要关注每种产品适用的场景。只有选择适合自己的,才能达到成本的节约。

 

企业需要根据自己的业务场景,选择合适的实例规格。比如计算型,通用型,突发性能型的实例规格等等。

 

垂直、水平弹性伸缩、节省停机模式、自动化运维工具 OOS 产品等等,可以有效提升企业的资源利用率。成本分析与优化,主要从各个维度分析企业的成本是否合理。

 


05 Q&A 环节,用户问答

 

Q1 为了防止成本浪费,有效管理云服务,企业需要遵循哪些优化云成本的实践?

 


答:比如定期审核、集中计费。除此之外,阿里云推出了一些成本分析,成本优化的功能,帮助企业实现降本增效。


 

Q2 如何把握容量的预估?

 


答:建议一边使用,一边优化。用户可以使用云厂商的监控指标或者基于自己的监控进行实时优化。


 

Q3 同一个标签的资源,如何进行成本分摊?

 


答:财务单元支持成本分摊。在阿里云的用户中心,财务单元会介绍成本分摊。


 

点击这里,查看云上自动化运维 CloudOps 系列沙龙精彩回放合集 &讲师资料下载。



推荐阅读
  • 云原生边缘计算之KubeEdge简介及功能特点
    本文介绍了云原生边缘计算中的KubeEdge系统,该系统是一个开源系统,用于将容器化应用程序编排功能扩展到Edge的主机。它基于Kubernetes构建,并为网络应用程序提供基础架构支持。同时,KubeEdge具有离线模式、基于Kubernetes的节点、群集、应用程序和设备管理、资源优化等特点。此外,KubeEdge还支持跨平台工作,在私有、公共和混合云中都可以运行。同时,KubeEdge还提供数据管理和数据分析管道引擎的支持。最后,本文还介绍了KubeEdge系统生成证书的方法。 ... [详细]
  • 关于我们EMQ是一家全球领先的开源物联网基础设施软件供应商,服务新产业周期的IoT&5G、边缘计算与云计算市场,交付全球领先的开源物联网消息服务器和流处理数据 ... [详细]
  • 如何在服务器主机上实现文件共享的方法和工具
    本文介绍了在服务器主机上实现文件共享的方法和工具,包括Linux主机和Windows主机的文件传输方式,Web运维和FTP/SFTP客户端运维两种方式,以及使用WinSCP工具将文件上传至Linux云服务器的操作方法。此外,还介绍了在迁移过程中需要安装迁移Agent并输入目的端服务器所在华为云的AK/SK,以及主机迁移服务会收集的源端服务器信息。 ... [详细]
  • 2018年人工智能大数据的爆发,学Java还是Python?
    本文介绍了2018年人工智能大数据的爆发以及学习Java和Python的相关知识。在人工智能和大数据时代,Java和Python这两门编程语言都很优秀且火爆。选择学习哪门语言要根据个人兴趣爱好来决定。Python是一门拥有简洁语法的高级编程语言,容易上手。其特色之一是强制使用空白符作为语句缩进,使得新手可以快速上手。目前,Python在人工智能领域有着广泛的应用。如果对Java、Python或大数据感兴趣,欢迎加入qq群458345782。 ... [详细]
  • 2018深入java目标计划及学习内容
    本文介绍了作者在2018年的深入java目标计划,包括学习计划和工作中要用到的内容。作者计划学习的内容包括kafka、zookeeper、hbase、hdoop、spark、elasticsearch、solr、spring cloud、mysql、mybatis等。其中,作者对jvm的学习有一定了解,并计划通读《jvm》一书。此外,作者还提到了《HotSpot实战》和《高性能MySQL》等书籍。 ... [详细]
  • 篇首语:本文由编程笔记#小编为大家整理,主要介绍了软件测试知识点之数据库压力测试方法小结相关的知识,希望对你有一定的参考价值。 ... [详细]
  • 一次上线事故,30岁+的程序员踩坑经验之谈
    本文主要介绍了一位30岁+的程序员在一次上线事故中踩坑的经验之谈。文章提到了在双十一活动期间,作为一个在线医疗项目,他们进行了优惠折扣活动的升级改造。然而,在上线前的最后一天,由于大量数据请求,导致部分接口出现问题。作者通过部署两台opentsdb来解决问题,但读数据的opentsdb仍然经常假死。作者只能查询最近24小时的数据。这次事故给他带来了很多教训和经验。 ... [详细]
  • Centos7搭建ELK(Elasticsearch、Logstash、Kibana)教程及注意事项
    本文介绍了在Centos7上搭建ELK(Elasticsearch、Logstash、Kibana)的详细步骤,包括下载安装包、安装Elasticsearch、创建用户、修改配置文件等。同时提供了使用华为镜像站下载安装包的方法,并强调了保证版本一致的重要性。 ... [详细]
  • 本文介绍了网页播放视频的三种实现方式,分别是使用html5的video标签、使用flash来播放以及使用object标签。其中,推荐使用html5的video标签来简单播放视频,但有些老的浏览器不支持html5。另外,还可以使用flash来播放视频,需要使用object标签。 ... [详细]
  • Sleuth+zipkin链路追踪SpringCloud微服务的解决方案
    在庞大的微服务群中,随着业务扩展,微服务个数增多,系统调用链路复杂化。Sleuth+zipkin是解决SpringCloud微服务定位和追踪的方案。通过TraceId将不同服务调用的日志串联起来,实现请求链路跟踪。通过Feign调用和Request传递TraceId,将整个调用链路的服务日志归组合并,提供定位和追踪的功能。 ... [详细]
  • 本文介绍了自学Vue的第01天的内容,包括学习目标、学习资料的收集和学习方法的选择。作者解释了为什么要学习Vue以及选择Vue的原因,包括完善的中文文档、较低的学习曲线、使用人数众多等。作者还列举了自己选择的学习资料,包括全新vue2.5核心技术全方位讲解+实战精讲教程、全新vue2.5项目实战全家桶单页面仿京东电商等。最后,作者提出了学习方法,包括简单的入门课程和实战课程。 ... [详细]
  • 本文介绍了Hive常用命令及其用途,包括列出数据表、显示表字段信息、进入数据库、执行select操作、导出数据到csv文件等。同时还涉及了在AndroidManifest.xml中获取meta-data的value值的方法。 ... [详细]
  • PatchODAX8: ... [详细]
  • 熟练掌握Spring Cloud,终于成为Java工程师的面试门槛 ... [详细]
  • 1.脚本功能1)自动替换jar包中的配置文件。2)自动备份老版本的Jar包3)自动判断是初次启动还是更新服务2.脚本准备进入ho ... [详细]
author-avatar
MR付的世界
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有