热门标签 | HotTags
当前位置:  开发笔记 > 运维 > 正文

制定混合云中的HPC战略,应该怎么做?

如今,云计算几乎已成为所有企业基本的IT基础设施战略。去年Gartner预测,基础设施即服务(IaaS)的需求将增加36.8%。另外一家咨询公司在2018

  如今,云计算几乎已成为所有企业基本的IT基础设施战略。去年Gartner预测,基础设施即服务(IaaS)的需求将增加36.8%。另外一家咨询公司在2018年的云调查显示,95%的企业都制定了云策略,其中51%采用混合云策略。

  然而,尽管云已经普遍存在,且HPC在云中已经十多年——2008年Univa在AWS上委托了第一个HPC集群——但企业一直不愿将HPC工作负载放在云计算中。对于数据安全性和缺乏相应技术的担忧,已经超过了降低管理成本和避免硬件所有权的好处。

  只有在过去的一年里,我们才真正达到了一个临界点。一项客户调查显示,2017年企业对HPC云的兴趣和使用量增加了10倍。随着与云计算相关挑战的减少,这些企业都看到了采用混合云策略的经济和商业性机会。在公有云中,他们可以在不影响CAPEX的情况下使用像Nvidia GPU这样的专用硬件,也可以扩展计算量繁重的工作负载,如通常会影响其他集群的TensorFlow机器学习模型。而且在混合模式下,他们还可以在不牺牲现有投资的情况下实现这些目标。

制定混合云中的HPC战略,应该怎么做?

  混合云已经成为HPC的重要竞争战略。但是何从开始呢?

  混合云战略

  在HPC领域,大多数公司都开始利用云来扩大现有资源。这样做可以最大化当前的投资,并提供一种方法来简化新的云基础架构模型。然而,这也有可能加剧现有复杂性。如果企业不能很好地了解他们现有的基础设施是如何使用的,那么就不可能知道云服务的增加是否会给他们带来真正需要的结果。因此,在引入新的云资源之前,他们应该尽可能地合并筒仓式的封闭工作负载,并确保有合适的工具,可以让自己看到使用模式和优化资源。

  如此一来,企业就可以将公有云资源引入他们现有的工作流程中。大多数公司开始这种过渡时只迁入一些少量工作负载,然后再有序进行增加。在开始时采用以下策略,并在增加公有云投资时对其进行微调,或许会帮助你实现无缝过渡:

  ·策略自动化对于混合云环境和HPC来说是至关重要的。有HPC工作负载的公司很可能已经意识到了有正确的策略管理工具的好处,而且应该考虑制定一些能够帮助他们最大化使用混合云资源的策略。他们可以通过制定策略来提高吞吐量,这些策略可以自动地确定哪些工作负载在本地运行,而不是在云中,也可以根据工作负载指标和历史记录来可靠地进行监视、响应和做出决策。例如,可以将一个策略设置为,向某个等待资源过久的任务分配一个云实例,或者自动终止未使用的云实例。

  ·云爆发(一个应用部署模式,其应用运行在私有云或数据中心中,当计算能力的需求达到顶峰时突然进入公有云中。)可以用来调整公司的产能以适应需求,极大地加快计算速度,并从对其他集群的影响中不断要求HPC工作负载。组织应该注意将云爆发功能绑定到工作负载管理层,而不是应用程序或基础架构层。这让HPC云管理软件根据公司更广泛的基础设施的需求来决定何时提供服务器实例、阶段数据和拆除资源。当能够有效地使用时,云爆发将使硬件预算决策具有灵活性,同时帮助组织以更快的速度前进。

  ·最终用户应该能够使用他们已经知道且信任的方法与云基础设施进行交互。如果一个组织在采用云计算时突然改变了他们的流水线和提交方法,他们不可避免地会出现错误和延迟。相反,他们应该保留现有的工作流和与之相关的调度器,无论它们是简单的步骤,如“qsub”提交单个任务——还是像环境设置一样复杂的流程,观察工作状态、数据移动,或者是一个从任务到任务的序列。

  ·最后,要带上你自己的映像。使用相同的机器映像有助于使应用程序在本地和基于云的节点之间移植。公司应该使用他们自己的云供应软件定制映像,而不是用每个供应商特有的VM映像。

制定混合云中的HPC战略,应该怎么做?

  HPC拥抱混合云

  混合云是公有云服务提供商和HPC用户的胜利,而我们还只是处于这个巨大改变的开始。HPC往往有数百万台服务器,每年有数十亿的计算时间。随着公司将这些工作负载转移到云上,它们将影响公有云服务的质量和IaaS市场的现状。公有云提供商提供的安全性、GPU和机器学习服务将继续改进,吸引越来越多的企业用户,并巩固混合云中的HPC架构。


推荐阅读
  • 数据管理权威指南:《DAMA-DMBOK2 数据管理知识体系》
    本书提供了全面的数据管理职能、术语和最佳实践方法的标准行业解释,构建了数据管理的总体框架,为数据管理的发展奠定了坚实的理论基础。适合各类数据管理专业人士和相关领域的从业人员。 ... [详细]
  • 2018年3月31日,CSDN、火星财经联合中关村区块链产业联盟等机构举办的2018区块链技术及应用峰会(BTA)核心分会场圆满举行。多位业内顶尖专家深入探讨了区块链的核心技术原理及其在实际业务中的应用。 ... [详细]
  • 随着技术的发展,黑客开始利用AI技术在暗网中创建用户的‘数字孪生’,这一现象引起了安全专家的高度关注。 ... [详细]
  • 浪潮AI服务器NF5488A5在MLPerf基准测试中刷新多项纪录
    近日,国际权威AI基准测试平台MLPerf发布了最新的推理测试结果,浪潮AI服务器NF5488A5在此次测试中创造了18项性能纪录,显著提升了数据中心AI推理性能。 ... [详细]
  • 本文详细介绍了Java编程语言中的核心概念和常见面试问题,包括集合类、数据结构、线程处理、Java虚拟机(JVM)、HTTP协议以及Git操作等方面的内容。通过深入分析每个主题,帮助读者更好地理解Java的关键特性和最佳实践。 ... [详细]
  • 深入探讨CPU虚拟化与KVM内存管理
    本文详细介绍了现代服务器架构中的CPU虚拟化技术,包括SMP、NUMA和MPP三种多处理器结构,并深入探讨了KVM的内存虚拟化机制。通过对比不同架构的特点和应用场景,帮助读者理解如何选择最适合的架构以优化性能。 ... [详细]
  • 随着网络安全威胁的不断演变,电子邮件系统成为攻击者频繁利用的目标。本文详细探讨了电子邮件系统中的常见漏洞及其潜在风险,并提供了专业的防护建议。 ... [详细]
  • vivo Y5s配备了联发科Helio P65八核处理器,这款处理器采用12纳米工艺制造,具备两颗高性能Cortex-A75核心和六颗高效能Cortex-A55核心。此外,它还集成了先进的图像处理单元和语音唤醒功能,为用户提供卓越的性能体验。 ... [详细]
  • 2017年人工智能领域的十大里程碑事件回顾
    随着2018年的临近,我们一同回顾过去一年中人工智能领域的重要进展。这一年,无论是政策层面的支持,还是技术上的突破,都显示了人工智能发展的迅猛势头。以下是精选的2017年人工智能领域最具影响力的事件。 ... [详细]
  • 三星W799在2011年的表现堪称经典,以其独特的双屏设计和强大的功能引领了双模手机的潮流。本文详细介绍其配置、功能及锁屏设置。 ... [详细]
  • 本文深入探讨了Linux系统中网卡绑定(bonding)的七种工作模式。网卡绑定技术通过将多个物理网卡组合成一个逻辑网卡,实现网络冗余、带宽聚合和负载均衡,在生产环境中广泛应用。文章详细介绍了每种模式的特点、适用场景及配置方法。 ... [详细]
  • 本文探讨了领域驱动设计(DDD)的核心概念、应用场景及其实现方式,详细介绍了其在企业级软件开发中的优势和挑战。通过对比事务脚本与领域模型,展示了DDD如何提升系统的可维护性和扩展性。 ... [详细]
  • 三星Galaxy S8/S8+即将登场,全面解析新旗舰
    3月29日晚11点,备受瞩目的三星Galaxy S8/S8+将正式发布。作为三星在Note 7爆炸事件后的重磅产品,S8/S8+不仅承载着恢复消费者信心的重任,其创新的设计和技术也备受期待。 ... [详细]
  • 新手指南:在Windows 10上搭建深度学习与PyTorch开发环境
    本文详细记录了一名新手在Windows 10操作系统上搭建深度学习环境的过程,包括安装必要的软件和配置环境变量等步骤,旨在帮助同样初入该领域的读者避免常见的错误。 ... [详细]
  • 本文详细介绍了如何在Windows环境下配置GPU支持,并使用Keras和TensorFlow实现YOLOv3模型进行图像目标检测。对于环境搭建的具体步骤,可参考外部链接提供的指南。 ... [详细]
author-avatar
蜜蜜鱼鱼_270
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有