热门标签 | HotTags
当前位置:  开发笔记 > 运维 > 正文

ibmplatformcomputing打造大数据方案

IBM技术计算解决方案范围从部门集群延伸到超级计算机,使企业能够通过为广泛的商务和业务挑战提供高性能基础架构来实现更好的成果。技术计算与高性能计算的紧密相关,它把高性能计算机系统使用到其它的行业中,PlatformComputing担负了这个职责,PlatformCo

  IBM技术计算解决方案范围从部门集群延伸到超级计算机,使企业能够通过为广泛的商务和业务挑战提供高性能基础架构来实现更好的成果。技术计算与高性能计算的紧密相关,它把高性能计算机系统使用到其它的行业中, Platform Computing担负了这个职责,Platform Computing是IBM技术运算的战略支撑,在集群、网格和云管理方面积累了雄厚的技术基础和客户案例。

  IBM Platform Computing软件技术理念

  我们先来看看与IBM Platform Computing有关的一组数字,Platform Computing是商用HPC的事实标准,全球60%的顶级金融服务机构采用了Platform Computing,Platform Computing管理的CPU数量超过500万颗。

  IBM Platform Computing软件技术理念就是让客户能把成千上万台计算机当作一台来使用和管理。为了达到这个目的,IBM Platform Computing采用了3层软件功能,第一层是资源整合,把企业所有的服务器及操作系统的软硬件整合成一个逻辑层,交给第二层资源分配来处理,第二层是资源分配,是网络层次的一个概念,把资源整合的逻辑层根据应用的使用、资源情况动态分配,大幅提高资源的利用率,并同时满足用户的服务标准。第三层是资源访问/使用,使用户通过API或UI界面或APP能够清楚明了地使用资源。如果是一个并行任务,用户可以通过一个中间件API调用资源,满足并行应用。

  这三层逻辑抽象,就构成了完整的Platform Computing的软件应用层次,可以支持多用户、多应用、共享、动态的平台,实现主流的技术计算。

  Symphony是Platform Computing平台一个并行分析的计算平台,从理解的角度,与WEB服务器的应用服务器类似,可以把Symphony看成是Platform Computing技术运算平台的应用服务器,它包含针对低延迟、可靠性和资源共享进行优化的MapReduce,还可以兼容 Apache Hadoop,进行大数据分析。

  如何用Platform Symphony做大数据分析

  IBM Platform Symphony是一个并行分析的计算平台,可以支持各种类型的计算密集型和数据密集型的应用。从开发者的角度来说,Symphony是一个可以成百上千倍提高运用速度,提供低延时、高并行度、高可靠性的应用中间件。同时,还可以把Symphony看成是一个面向技术运算的服务器。数据显示,Symphony远程并行服务的延迟低至毫秒级,每秒钟可以同时启动17000个服务任务,每一个应用可以使用多达10000个核,每一个集群可以支持多达40000个核,可以实现多个任务、多个应用同时运行。

  不仅如此,Symphony还可以同时支持计算密集型应用和数据密集型应用的管理软件。随着分析工作负载的计算与数据密集性的不断增高,许多类型的应用程序都要求快速分析使用内存中的数据网格存储的或分布式文件系统上的大量数据。不同于其他网格管理解决方案,Platform Symphony Advanced Edition(Symphony的高级版)并不需要单独的基础架构来支持这些数据密集型问题。它包含针对低延迟、可靠性和资源共享进行优化的MapReduce,还可以兼容 Apache Hadoop 。用户可以通过使用此功能在相同的共享分布式基础架构上运行使用其他语言编写的Hadoop和非Hadoop应用程序。此外,Platform Symphony的多租户架构可以使其在单一的共享式基础架构上部署多个 MapReduce 引擎。

  就工作环境而言,Platform Symphony客户机和服务可以在不同的操作系统、语言和框架上实施,集群还可包含运行多个操作系统的节点。而且,Platform Symphony可在相同的集群中管理多种不同类型的主机,并控制每个主机上运行的应用程序服务。

  Platform Symphony支持GPFS

  IBM Platform Symphony支持各种类型的数据,开源MapReduce只支持开源的HDFS,IBM Platform Symphony支持包括IBM GPFS、HDFS、数据仓库以及其它数据来源和输出端,甚至“数据的输入端和输出目标的类型可以不同”。

  GPFS是一个高性能的,共享磁盘空间的文件系统的管理方案。GPFS运用于集群环境中,提供快速可靠的数据访问。通过GPFS,同一个集群中的多个节点可以同时访问同一个共享文件。

  GPFS还可以提供在线存储管理、可扩展的访问和集成的生命周期管理工具,并且有能力管理PB级的数据和数十亿的文件,可以大大减少切换时间,减小客户应用的不可用时间。

  GPFS可以帮助企业降低存储管理成本,并能减少数据重复和更有效的使用离散的存储组件,使之成为一个逻辑整体,使信息呈现一个集中的、高性能存储的架构。GPFS还可以帮助改善服务器硬件利用率,从任何节点通过允许动态存储访问所有数据,GPFS多层次的方法可以减少存储成本。

  搭载Power Linux的大数据方案

  随着开源开发平台的迅猛发展,Linux市场快速增长,也让IBM看到了Power Systems的新机遇,并希望在这个市场有所斩获。其实早在两三年前,Power Systems就开始涉及Linux市场,从最早的Open Power到现在的Power Linux,Power Systems一直都在根据市场的发展不停的改变。

  作为运行Linux软件的全新Power硬件平台,在Power Linux产品方面,IBM为其PowerLinux 7R1(单插槽)与7R2(双插槽)设备提供了Solarflare的高性能低延迟10Gb每秒以太网适配器。有趣的是,Solarflare卡在网络中嵌入了一套现场可编程门阵列(简称FPGA)。在Open Onload开发环境的支持下,经过调整的FPGA能够在数据到达服务器之前完成各类操作任务??这在高频数据交互环境下意义非凡,而且也是IBM Power设备对抗x86设备的有力武器之一。

  基于Platform Symphony和Power Linux的大数据方案

  为了进一步推广Power Linux产品的应用,打造完善的生态系统,IBM“天合计划”通过将 VAD(增值分销商)合作伙伴的软件预装在PowerLinux服务器上,打包成为“CAMP Box”解决方案,帮助用户大幅降低Power平台的使用成本和PowerVM虚拟化技术门槛,进一步丰富Power企业入门级服务器产品线,让用户同时享受开源和Power平台的各种优势技术,为用户提供更多“智慧的运算”的选择平台。

  Power Linux的出现,为搭载Symphony的硬件平台提供了新的选择,软件方面,Symphony一直是处理非结构化数据的方案,硬件方面,Power Linux具备了从Power产品线延续下来的高度RAS特性,两者的结合为处理大数据提供了完整的打包方案,无疑将进一步发挥Platform对大数据处理的优势和价值。


推荐阅读
  • 本文介绍了如何使用Flume从Linux文件系统收集日志并存储到HDFS,然后通过MapReduce清洗数据,使用Hive进行数据分析,并最终通过Sqoop将结果导出到MySQL数据库。 ... [详细]
  • 深入解析:存储技术的演变与发展
    本文探讨了从单机文件系统到分布式文件系统的存储技术发展过程,详细解释了各种存储模型及其特点。 ... [详细]
  • Hadoop 2.6 主要由 HDFS 和 YARN 两大部分组成,其中 YARN 包含了运行在 ResourceManager 的 JVM 中的组件以及在 NodeManager 中运行的部分。本文深入探讨了 Hadoop 2.6 日志文件的解析方法,并详细介绍了 MapReduce 日志管理的最佳实践,旨在帮助用户更好地理解和优化日志处理流程,提高系统运维效率。 ... [详细]
  • 从理想主义者的内心深处萌发的技术信仰,推动了云原生技术在全球范围内的快速发展。本文将带你深入了解阿里巴巴在开源领域的贡献与成就。 ... [详细]
  • 精选10款Python框架助力并行与分布式机器学习
    随着神经网络模型的不断深化和复杂化,训练这些模型变得愈发具有挑战性,不仅需要处理大量的权重,还必须克服内存限制等问题。本文将介绍10款优秀的Python框架,帮助开发者高效地实现分布式和并行化的深度学习模型训练。 ... [详细]
  • 流处理中的计数挑战与解决方案
    本文探讨了在流处理中进行计数的各种技术和挑战,并基于作者在2016年圣何塞举行的Hadoop World大会上的演讲进行了深入分析。文章不仅介绍了传统批处理和Lambda架构的局限性,还详细探讨了流处理架构的优势及其在现代大数据应用中的重要作用。 ... [详细]
  • 本文介绍了Hadoop的核心组件,包括高可靠性和高吞吐量的分布式文件系统HDFS、分布式的离线并行计算框架MapReduce、作业调度与集群资源管理框架YARN以及支持其他模块的工具模块Common。 ... [详细]
  • 大数据领域的职业路径与角色解析
    本文将深入探讨大数据领域的各种职业和工作角色,帮助读者全面了解大数据行业的需求、市场趋势,以及从入门到高级专业人士的职业发展路径。文章还将详细介绍不同公司对大数据人才的需求,并解析各岗位的具体职责、所需技能和经验。 ... [详细]
  • Hadoop的文件操作位于包org.apache.hadoop.fs里面,能够进行新建、删除、修改等操作。比较重要的几个类:(1)Configurati ... [详细]
  • Python 数据可视化实战指南
    本文详细介绍如何使用 Python 进行数据可视化,涵盖从环境搭建到具体实例的全过程。 ... [详细]
  • 从0到1搭建大数据平台
    从0到1搭建大数据平台 ... [详细]
  • 如何在U8系统中连接服务器并获取数据
    本文介绍了如何在U8系统中通过不同的方法连接服务器并获取数据,包括使用MySQL客户端连接实例的方法,如非SSL连接和SSL连接,并提供了详细的步骤和注意事项。 ... [详细]
  • 本文详细介绍了 `org.apache.hadoop.hdfs.server.namenode.FSNamesystem.shouldUseDelegationTokens()` 方法的用途和实际应用场景,并提供了多个代码示例以帮助开发者更好地理解和使用该方法。 ... [详细]
  • 2012年9月12日优酷土豆校园招聘笔试题目解析与备考指南
    2012年9月12日,优酷土豆校园招聘笔试题目解析与备考指南。在选择题部分,有一道题目涉及中国人的血型分布情况,具体为A型30%、B型20%、O型40%、AB型10%。若需确保在随机选取的样本中,至少有一人为B型血的概率不低于90%,则需要选取的最少人数是多少?该问题不仅考察了概率统计的基本知识,还要求考生具备一定的逻辑推理能力。 ... [详细]
  • 在前一篇文章《Hadoop》系列之“踽踽独行”(二)中,我们详细探讨了云计算的核心概念。本章将重点转向物联网技术,全面解析其基本原理、应用场景及未来发展前景。通过深入分析物联网的架构和技术栈,我们将揭示其在智能城市、工业自动化和智能家居等领域的广泛应用潜力。此外,还将讨论物联网面临的挑战,如数据安全和隐私保护等问题,并展望其在未来技术融合中的重要角色。 ... [详细]
author-avatar
Aircraftl
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有