热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

16年云存储历程,亚马逊云科技如何应对数据存储挑战

随着千行万业的数字化转型,数据量暴涨,数据获得了空前的关注度。作为存储计算网络的三大IT基础设施之一,数据存储一直占据IT支出的重要部分。不过,在疫情和经济下行的趋势与压力之下,如

随着千行万业的数字化转型,数据量暴涨,数据获得了空前的关注度。作为存储计算网络的三大 IT 基础设施之一,数据存储一直占据 IT 支出的重要部分。不过,在疫情和经济下行的趋势与压力之下,如何通过创新的 IT 技术去降本增效,成为企业与技术团队必须要面对的问题。

提到灵活的云上资源与存储,业界必然会想到亚马逊云科技的王牌级存储产品 S3。从 2006 年推出 S3 到现在的 16 年间,亚马逊云科技一直在存储技术上投入研发,比如仅 2021 一年,就发布了 130 多项存储领域的新服务和功能特性。亚马逊云科技对于存储成本和性能的优化,为业界提供了重要的参考范本。

连续 16 年,让存储成本持续下降,怎么做到?

在存储技术上,想要提升数据存储和调用性能,降低存储介质成本,通常利用各类存储介质特点,依据数据重要级去分级存储,这一直是存储技术中重要的一项。亚马逊云科技的王牌存储产品 Amazon S3 在 16 年间价格降低 7 倍(以 S3 标准频繁访问层 Amazon S3 Standard Frequent Access 为例),2021 年底,Amazon S3 的标准非频繁访问层和单区非频繁访问层的存储价格又降低了 31%!

压缩存储成本空间的底气,是亚马逊云科技分层存储技术背后的设计逻辑。

数据量爆发,庞杂的数据其实可细分为各种类型,例如实时交易平台数据、业务监控数据、机器学习推理所涉及数据,以及社交媒体产生数据、音视频与图像数据,另外还要容灾备份、开发测试数据以及历史归档数据等等。亚马逊云科技为这些数据定义了“数据的温度”,依据数据调用的频率,分为热数据、温数据、冷数据和冻数据。

2018 年亚马逊云科技就推出了 Amazon S3 智能分层功能,面向未知访问模式的海量数据。Amazon S3 可以自动为数据进行冷热分层,实现至多 68%的成本节省。

另外,亚马逊云科技数据分层存储已经拓展到文件存储 Amazon EFS。Amazon EFS 提供四种存储等级,可节省高达 72%的存储成本。

现在,Amazon S3 智能分层已经涵盖了 Amazon S3 家族的几乎所有存储类别,实现数据全生命周期的智能化存储与使用。用户可以将 Amazon S3 智能分层作为默认的存储层级,用以构建包括数据湖、机器学习等各种云端应用。

存储走向场景细分,亚马逊云科技积累存储全线产品

说到存储的应用场景,数字化深入各行业,也催生了多种多样的业务场景。依据云计算的发展进程,我们可以将业务场景分为云上原生的场景,以及传统的企业业务场景。

如网站托管、数据湖、数字营销、云相册、音视频分享、电商平台、社交媒体等应用,这些云原生现代化应用,客户可以使用云原生 Serverless 文件存储  Amazon EFS,获得简单、无管理成本、海量弹性扩展、高度集成、自动优化的体验。

另外,例如 ERP/CRM、数据库、自动驾驶、生命科学、混合云、模拟仿真、气象分析、EDA、视频渲染等更为复杂多样化的企业级应用,亚马逊云科技提出“专门构建”的思路去提供云端存储产品和服务。

针对企业级工作负载,亚马逊云科技提供了 Amazon EBS IO2 BX 和 Amazon FSx 系列服务。Amazon EBS IO2 BX 是为运行在线下数据中心 SAN 存储上的应用而设计。Amazon FSx 家族是为各类企业应用而专门构建的共享文件存储。FsX = File X System,详细来说,Amazon FSx 家族已经有以下多个存储产品:



  • Amazon FSx for Windows File Server,2018 年 11 月推出,支持 Windows Server 工作负载。



  • 全新一代 Amazon FSx for Lustre,2021 年 11 月发布,面向 HPC 计算密集型工作负载,帮助客户快速完成高性能计算,如基因测序,新药研发,自动驾驶模拟仿真,半导体设计等任务。



  (1)Amazon FSx for Lustre 与当前一代相比,提供 5 倍的吞吐量(每 TB 高达 1GB/秒)。

  (2)Amazon FSx for Lustre 支持与 S3 的数据更新双向同步,在 S3 或 Lustre 任一侧更新数据,都可以在另外一侧实现自动快速同步。



  • Amazon FSx for OpenZFS,2021 年 11 月发布,面向大数据分析 Linux 工作负载。针对那些以往把数据放在 ZFS 或者其它 Linux 文件服务器、而不希望改变架构的云迁移客户。通过它可以让 ZFS 或其他基于 Linux 的文件服务器迁移到亚马逊云科技时,不需要改变应用和管理数据的方式,提供高达 1 百万 IOPS,而延迟仅有几百微秒,非常适合运行像机器学习和音视频实时处理这类数据密集型工作负载。



  • Amazon FSx for NetApp ONTAP,2021 年 9 月发布,方便企业业务无缝迁移上云。使客户能够在亚马逊云科技上启动、运行和扩展全面托管的 NetApp ONTAP 文件存储服务,无需修改其应用、工具、流程或工作流,即可将其在 NAS 设备上运行的应用迁移至亚马逊云科技。Amazon FSx for NetApp ONTAP 让客户可使用其已经熟悉的 NAS 工作流来部署、管理应用和数据,同时尽享亚马逊云科技带来的敏捷性、可扩展性和安全性,以及与亚马逊云科技其它服务之间的无缝集成。



通过对场景的细分与对应存储需求的研究,亚马逊云科技已经覆盖了从块存储、对象存储,到文件存储、备份、容灾,以及数据传输和边缘处理的全线存储产品和服务,堪称云巨头亚马逊云科技在存储技术领域的“全家桶”式产品矩阵。

强大产品矩阵,覆盖场景全面,不是一句简单的宣传口号。举个例子,亚马逊云科技存储产品“全家桶”所覆盖的场景,甚至已经拓展到了地球以外的国际空间站中。今年亚马逊云科技已经向国际空间站部署了 AWS Snowcone 服务,设备内含有固态硬盘,为国际空间站端到端的数据下载和分析事件从 20 小时缩短到 20 分钟。

这应该算是极端的一种边缘场景了,毕竟和地球上的场景比起来,国际空间站的边缘场景中,硬件要尽一切可能轻,经受发射时极端震动和重力,以及在微重力下安全连接主航天器电力、冷却和网络系统。

图:在国际空间站“服役”的 Amazon Snowcone

从存储技术层面看,这款 Amazon Snowcone 是专为运行边缘计算工作负载而设计,所有工作负载均受多层加密保护。在本地收集和处理数据后,通常会将设备运回亚马逊云科技数据中心,以便处理后的数据可以存储在云中并进一步处理。或者,也可以使用 Amazon DataSync 将数据从 Snowcone 设备复制回亚马逊云科技数据中心。

除了极端的边缘场景,以能源电力场景下的金风慧能案例为例。

 

总结

每一代科学技术迭代和变革的背后,都是因为技术切实提升人们生产生活效率,这也是 IT 吞噬一切,并重塑千行万业的终极价值。在不确定因素和多变的市场环境中,如何持续降低成本、提升效率,是每一位技术人都该去思考的问题。在技术实践和积累中,亚马逊云科技在存储领域的产品构建思路,给业界提供了很好的参考样本,值得参考和借鉴。

当然,亚马逊云科技丰富的存储产品和服务矩阵,以及最佳实践、应用案例,还有很多很多。2022年9月22日-23日,亚马逊云科技将在上海举办重要的技术盛会——2022亚马逊云科技中国峰会。点击链接或者扫描下图中二维码获取更多大会信息,更多的技术创新,等你来发现。

 



推荐阅读
  • Asynchronous JavaScript and XML (AJAX) 的流行很大程度上得益于 Google 在其产品如 Google Suggest 和 Google Maps 中的应用。本文将深入探讨 AJAX 在 .NET 环境下的工作原理及其实现方法。 ... [详细]
  • Docker安全策略与管理
    本文探讨了Docker的安全挑战、核心安全特性及其管理策略,旨在帮助读者深入理解Docker安全机制,并提供实用的安全管理建议。 ... [详细]
  • 本文详细介绍了如何在Oracle VM VirtualBox中实现主机与虚拟机之间的数据交换,包括安装Guest Additions增强功能,以及如何利用这些功能进行文件传输、屏幕调整等操作。 ... [详细]
  • Web动态服务器Python基本实现
    Web动态服务器Python基本实现 ... [详细]
  • 本文详细介绍了如何在CentOS 6.5系统上安装和配置Redis 3.0.6,包括必要的环境准备、软件包下载、编译安装及基本功能测试。 ... [详细]
  • Fiddler 安装与配置指南
    本文详细介绍了Fiddler的安装步骤及配置方法,旨在帮助用户顺利抓取用户Token。文章还涵盖了一些常见问题的解决方案,以确保安装过程顺利。 ... [详细]
  • Zabbix自定义监控与邮件告警配置实践
    本文详细介绍了如何在Zabbix中添加自定义监控项目,配置邮件告警功能,并解决测试告警时遇到的邮件不发送问题。 ... [详细]
  • 在使用 Nginx 作为服务器时,发现 Chrome 能正确从缓存中读取 CSS 和 JS 文件,而 Firefox 却无法有效利用缓存,导致加载速度显著变慢。 ... [详细]
  • 本文详细介绍了Oracle 11g中的创建表空间的方法,以及如何设置客户端和服务端的基本配置,包括用户管理、环境变量配置等。 ... [详细]
  • 本文介绍了SIP(Session Initiation Protocol,会话发起协议)的基本概念、功能、消息格式及其实现机制。SIP是一种在IP网络上用于建立、管理和终止多媒体通信会话的应用层协议。 ... [详细]
  • 本文详细介绍了如何在Azure DevOps Services和Azure DevOps Server中调整时区设置,以及这些设置对不同功能的影响。 ... [详细]
  • 本文介绍了如何通过命令行有效地终止所有 Node.js 进程实例,以解决因端口冲突或其他服务冲突导致的问题。 ... [详细]
  • 解决PHP项目在服务器无法抓取远程网页内容的问题
    本文探讨了在使用PHP进行后端开发时,遇到的一个常见问题:即在本地环境中能够正常通过CURL获取远程网页内容,但在服务器上却无法实现。我们将分析可能的原因并提供解决方案。 ... [详细]
  • 图数据库与传统数仓实现联邦查询使用CYPHER实现从关系数据库过滤时间序列指标一、MySQL得到研报实体在Oracle中的唯一ID二、Oracle中过滤时间序列数据三、CYPHER ... [详细]
  • 本文详细介绍了 InfluxDB、collectd 和 Grafana 的安装与配置流程。首先,按照启动顺序依次安装并配置 InfluxDB、collectd 和 Grafana。InfluxDB 作为时序数据库,用于存储时间序列数据;collectd 负责数据的采集与传输;Grafana 则用于数据的可视化展示。文中提供了 collectd 的官方文档链接,便于用户参考和进一步了解其配置选项。通过本指南,读者可以轻松搭建一个高效的数据监控系统。 ... [详细]
author-avatar
Shirley韻
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有