当前位置: 开发笔记 > 运维 > 正文

重新认识Mesos的设计架构

作者：文民左 | 来源：互联网 | 2018-06-11 04:11

作者:Dong | 新浪微博：西成懂 | 可以转载, 但必须以超链接形式标明文章原始出处和作者信息及版权声明
网址:http://dongxicheng.org/apache-mesos/study-mesos-architecture-in-deep/

Mesos中包含四类主要的服务（实际上是一个socket server），它们分别是Mesos Master，Mesos Slave，SchedulerProcess和ExecutorProcess，它们之间通过Protocal Buffer消息进行通信，每种服务内部注册了若干种Protocal Buffer消息处理器，一旦收到某种消息，则会调用相应的消息处理器进行处理。除了以上四种服务之外，Mesos还对外提供了三种可编程组件，分别是Alloctor、Framework Scheduler和Framework Executor，编写这几个组件必须按照要求实现了几个接口，而这些接口将分别被下图中相邻的服务调用。

大部分人看到以上Mesos架构后，均会认为Framework必须是一个通用的框架，比如MapReduce、Storm、Spark等，而Mesos Master负责将资源分配给各个框架，而各个框架的Scheduler进一步将资源分配给其内部的各个应用程序。这种观念是错误的，是对Mesos架构的一种错误解读。

事实上，Framework不仅可以是通用的框架，也可以是像Hadoop的Job或者YARN的Application那样的简单计算任务，也就是说，Framework并需要一定是一个“Framework”，或者一个长时间运行的服务（比如JobTracker等），也可以是一个短生命周期的Job或者Application。如果让Framework对应一个Hadoop Job，则可以这样设计Framework Scheduler和Framework Executor：

（1）Framework Scheduler功能

Framework Scheduler负责按照作业的输入数据量，将之分解成若干任务，并为这些任务申请资源、监控这些任务的运行状态，一旦发现某个任务运行失败则重新为之申请资源。

（2）Framework Executor功能

为一个节点上的Map Task或者Reduce Task准备运行环境，包括准备各种jar包、二进制文件，设置必要的环境变量，进行必要的资源隔离，启动Jetty Shuffle以为Reduce Task提供远程数据拷贝服务等，接收来自Framework Scheduler的命令（启动任务、杀死任务等），并执行。

通过上面的介绍可以知道，Framework Scheduler只负责运行一个Hadoop Job，而如果你对YARN比较熟悉，便会发现者正是YARN中的MapReduce ApplicationMaster做的事情，没错，Mesos与YARN的设计架构如此的相近，以至于我们很容易通过修改YARN 的任何一个ApplicationMaster，让它作为一个Framework Scheduler运行在Mesos中。

最近Mesos提供了一个mesos-submit工具（https://github.com/apache/mesos/blob/trunk/docs/Using-the-mesos-submit-tool.md，注意，该工具尚不完善），该工具可以让用户的Framework Scheduler运行在任何一个Mesos Slave上，以防止客户端运行过多的Framework Scheduler，这样，Mesos的整个架构和工作流程已经变得与YARN相差无几了。

为了让大家更容易理解Mesos和YARN在架构上的相似性，下面给出了Mesos和YARN的组件对应表：

Mesos中的组件	YARN中的组件	功能
Mesos Master	Resource Manager	整个集群的资源管理和调度
Mesos Slave	Node Manager	单个节点的资源管理（资源隔离、汇报等）、任务启动等
Framework Executor	Node Manager	单个节点的资源管理（资源隔离、汇报等）、任务启动等
Framework Scheduler	ApplicationMaster	单个应用程序的管理和资源二次调度，基本操作均包括注册、资源申请/获取、资源分配（给内部的任务）等。

既然Mesos和YARN如此的相近，那么我们到底应该使用哪一个呢？或者说，哪一个系统更有前景？

就目前看来，YARN在以下几个方面存在明显优势：（1）人力投入大。目前YARN有专门的公司（hortonwork）维护和开发（2）知名度高。YARN之前从Hadoop 1.0中演化而来，继承了Hadoop的知名度，且有大量公司和开发人员共享patch。然而，Mesos最大优点的设计简单、容易上手使用，它不像YARN那样，一个资源的分配过程要涉及到若干个状态机，且每种状态机十几种状态，十几种事件。但稳定性看，两个系统都处于研发和测试阶段，离稳定可用还有一段距离。

原创文章，转载请注明： 转载自董的博客

本文链接地址: http://dongxicheng.org/apache-mesos/study-mesos-architecture-in-deep/

作者：Dong，作者介绍：http://dongxicheng.org/about/

Copyright © 2013
This feed is for personal, non-commercial use only.
The use of this feed on other websites breaches copyright. If this content is not in your news reader, it makes the page you are viewing an infringement of the copyright. (Digital Fingerprint:
)

推荐阅读

apache
精选10款Python框架助力并行与分布式机器学习

随着神经网络模型的不断深化和复杂化，训练这些模型变得愈发具有挑战性，不仅需要处理大量的权重，还必须克服内存限制等问题。本文将介绍10款优秀的Python框架，帮助开发者高效地实现分布式和并行化的深度学习模型训练。 ... [详细]

蜡笔小新 2024-11-20 19:44:05
devops
流处理中的计数挑战与解决方案

本文探讨了在流处理中进行计数的各种技术和挑战，并基于作者在2016年圣何塞举行的Hadoop World大会上的演讲进行了深入分析。文章不仅介绍了传统批处理和Lambda架构的局限性，还详细探讨了流处理架构的优势及其在现代大数据应用中的重要作用。 ... [详细]

蜡笔小新 2024-11-20 13:50:01
devops
从0到1搭建大数据平台

从0到1搭建大数据平台 ... [详细]

蜡笔小新 2024-11-12 15:26:03
server
探索阿里巴巴的开源世界

从理想主义者的内心深处萌发的技术信仰，推动了云原生技术在全球范围内的快速发展。本文将带你深入了解阿里巴巴在开源领域的贡献与成就。 ... [详细]

蜡笔小新 2024-11-21 09:06:54
server
Presto：高效即席查询引擎的深度解析与应用

本文深入解析了Presto这一高效的即席查询引擎，详细探讨了其架构设计及其优缺点。Presto通过内存到内存的数据处理方式，显著提升了查询性能，相比传统的MapReduce查询，不仅减少了数据传输的延迟，还提高了查询的准确性和效率。然而，Presto在大规模数据处理和容错机制方面仍存在一定的局限性。本文还介绍了Presto在实际应用中的多种场景，展示了其在大数据分析领域的强大潜力。 ... [详细]

蜡笔小新 2024-11-07 19:17:47
server
如何高效启动大数据应用之旅？

在前一篇文章中，我探讨了大数据的定义及其与数据挖掘的区别。本文将重点介绍如何高效启动大数据应用项目，涵盖关键步骤和最佳实践，帮助读者快速踏上大数据之旅。 ... [详细]

蜡笔小新 2024-11-04 18:30:38
shell
构建高可用性Spark分布式集群：大数据环境下的最佳实践

在构建高可用性的Spark分布式集群过程中，确保所有节点之间的无密码登录是至关重要的一步。通过在每个节点上生成SSH密钥对（使用 `ssh-keygen -t rsa` 命令并保持默认设置），可以实现这一目标。此外，还需将生成的公钥分发到所有节点的 `~/.ssh/authorized_keys` 文件中，以确保节点间的无缝通信。为了进一步提升集群的稳定性和性能，建议采用负载均衡和故障恢复机制，并定期进行系统监控和维护。 ... [详细]

蜡笔小新 2024-11-02 14:18:50
port
如何在Hive中合理配置Map和Reduce任务数量以优化不同场景下的性能表现

在Hive中合理配置Map和Reduce任务的数量对于优化不同场景下的性能至关重要。本文探讨了如何控制Hive任务中的Map数量，分析了当输入数据超过128MB时是否会自动拆分，以及Map数量是否越多越好的问题。通过实际案例和实验数据，本文提供了具体的配置建议，帮助用户在不同场景下实现最佳性能。 ... [详细]

蜡笔小新 2024-10-31 14:33:41
server
HBase在金融大数据迁移中的应用与挑战

随着最后一台设备的下线，标志着超过10PB的HBase数据迁移项目顺利完成。目前，新的集群已在新机房稳定运行超过两个月，监控数据显示，新集群的查询响应时间显著降低，系统稳定性大幅提升。此外，数据消费的波动也变得更加平滑，整体性能得到了显著优化。 ... [详细]

蜡笔小新 2024-10-31 14:06:06
linux
在Linux系统中配置环境变量以切换不同版本Python的方法与实践

在Linux系统中，原本已安装了多个版本的Python 2，并且还安装了Anaconda，其中包含了Python 3。本文详细介绍了如何通过配置环境变量，使系统默认使用指定版本的Python，以便在不同版本之间轻松切换。此外，文章还提供了具体的实践步骤和注意事项，帮助用户高效地管理和使用不同版本的Python环境。 ... [详细]

蜡笔小新 2024-10-30 09:39:09
server
HBase 数据复制与灾备同步策略

本文探讨了HBase在企业级应用中的数据复制与灾备同步解决方案，包括存量数据迁移及增量数据实时同步的方法。 ... [详细]

蜡笔小新 2024-11-21 19:20:03
server
如何以低成本高效构建Hadoop和Spark大数据处理环境

随着“大数据”价值的日益凸显，从互联网、电商到金融和政府机构等各个领域都在积极应对海量数据的处理需求。如何以较低成本快速高效地构建大数据处理平台，已成为推动大数据应用创新的重要因素。为了帮助用户以最简便的方式实现这一目标，本文将详细介绍如何利用Hadoop和Spark技术搭建稳定可靠的大数据处理环境。 ... [详细]

蜡笔小新 2024-11-08 15:31:10
server
《Hadoop》系列深度探索（三）：物联网技术综述与应用前景

在前一篇文章《Hadoop》系列之“踽踽独行”（二）中，我们详细探讨了云计算的核心概念。本章将重点转向物联网技术，全面解析其基本原理、应用场景及未来发展前景。通过深入分析物联网的架构和技术栈，我们将揭示其在智能城市、工业自动化和智能家居等领域的广泛应用潜力。此外，还将讨论物联网面临的挑战，如数据安全和隐私保护等问题，并展望其在未来技术融合中的重要角色。 ... [详细]

蜡笔小新 2024-11-03 18:20:22
server
Hadoop 2.6 日志文件解析与MapReduce日志管理深入探讨

Hadoop 2.6 主要由 HDFS 和 YARN 两大部分组成，其中 YARN 包含了运行在 ResourceManager 的 JVM 中的组件以及在 NodeManager 中运行的部分。本文深入探讨了 Hadoop 2.6 日志文件的解析方法，并详细介绍了 MapReduce 日志管理的最佳实践，旨在帮助用户更好地理解和优化日志处理流程，提高系统运维效率。 ... [详细]

蜡笔小新 2024-11-03 16:23:38
server
六个关键步骤掌握Python数据分析，探索六款小众但强大的数据处理库

Python 数据分析领域不仅拥有高质量的开发环境，还提供了众多功能强大的第三方库。本文将介绍六个关键步骤，帮助读者掌握 Python 数据分析的核心技能，并深入探讨六款虽不广为人知但却极具潜力的数据处理库，如 Pandas 的替代品和新兴的可视化工具，助力数据科学家和分析师提升工作效率。 ... [详细]

蜡笔小新 2024-10-29 11:26:54

文民左

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章