热门标签 | HotTags
当前位置:  开发笔记 > 运维 > 正文

分布式和集群的区别?

在网上看到很多这样的文章,有的是复制同一个人的,而有的答案和概念都不太一样。请教下大神,能简单明了的说一下他们之间的区别吗
在网上看到很多这样的文章,有的是复制同一个人的,而有的答案和概念都不太一样。请教下大神,能简单明了的说一下他们之间的区别吗

回复内容:

在网上看到很多这样的文章,有的是复制同一个人的,而有的答案和概念都不太一样。请教下大神,能简单明了的说一下他们之间的区别吗

就软件系统来说。分布式指的是你的软件系统可以通过某些手段让各自独立的部分协作起来。这些独立的部分可以是真正独立的,也可以是虽然可以独立运行,但无法构成一个完整系统的,但一般指的是后者。分布的目的有很多,比如说为了分散计算的压力,也可能是为了松散的组件式系统便于扩展。分布式的软件系统模型也有很多,比如早期的EJB,现在的SOA,也有使用消息系统的,比如rabbitMQ,比较有名的有openstack。各种大数据软件都是分布式的,比如Hadoop,spark。他们都有自己的分布模型,做特定的事情。

web相关的软件都是分布的,一部分运行在浏览器里,一部分运行在服务器上。一般来说,数据库系统都是分布的。其实现代的软件大多数都已经是分布式的了,我们使用分布式系统已经很久了。

集群这个概念在软件相关的领域里面指的往往是一种部署的方式。分布式的软件一般都可以支持集群部署,比如数据库。使用集群的目的一般都是为了分散计算的压力。集群一般都是可以伸缩的,甚至可以根据一些策略自动的伸缩。

参考:分布式系统 概念与设计

实名反对@junze,不能到别的文章里拿过来就回到!!!
关于分布式,集群,负载均衡的概念,这两天刚好我也在看。
sf里http://segmentfault.com/q/1010000003052403
这个问题里已经回答的很好了,题主去看下

=========================================
集群:
班级大扫除,每个学生都会被老师调度来负责清理不同的地方。
张三擦黑板,李四摸桌子,王五擦风扇
一不小心王五被电死了,不能再擦风扇了,老师再分配赵六顶上。
一个学生代表一台主机,一个班级就是一个集群,老师就是负载均衡器
概念:是一个团体,要有一个负载均衡器

分布式:
操场大扫除,分给了甲班和乙班来共同清扫(共同处理一个任务)。
甲乙两个班级就是分布式的处理。
甲乙两个班级,也可以由老师分配不同的学生清扫某一小块。
这就是说分布式的处理节点可以是一个集群
概念:每个节点可以分布在不同的地方

简单说,分布式是以缩短单个任务的执行时间来提升效率的,而集群则是通过提高单位时间内执行的任务数来提升效率。
例如:
如果一个任务由10个子任务组成,每个子任务单独执行需1小时,则在一台服务器上执行改任务需10小时。
采用分布式方案,提供10台服务器,每台服务器只负责处理一个子任务,不考虑子任务间的依赖关系,执行完这个任务只需一个小时。(这种工作模式的一个典型代表就是Hadoop的Map/Reduce分布式计算模型)
而采用集群方案,同样提供10台服务器,每台服务器都能独立处理这个任务。假设有10个任务同时到达,10个服务器将同时工作,10小后,10个任务同时完成,这样,整身来看,还是1小时内完成一个任务!

我们一般说分布式远程调用,这样一看分布式是不是和远程调用有关系啦,比如A系统需要调用B系统上的某个服务,这就属于分布式。而如果B系统的请求量很大,一台机器处理不过来,这时就需要部署多个B系统来处理,这就是集群。
个人理解,希望不会误导了你。

"分布式"不一定指硬件, 可以指一种协作的方式
"集群"一般有明确的所属

DNS是个分布式系统, 我们不会说全球的DNS服务器是一个集群

推荐阅读
  • 深入解析Spark核心架构与部署策略
    本文详细探讨了Spark的核心架构,包括其运行机制、任务调度和内存管理等方面,以及四种主要的部署模式:Standalone、Apache Mesos、Hadoop YARN和Kubernetes。通过本文,读者可以深入了解Spark的工作原理及其在不同环境下的部署方式。 ... [详细]
  • Hadoop入门与核心组件详解
    本文详细介绍了Hadoop的基础知识及其核心组件,包括HDFS、MapReduce和YARN。通过本文,读者可以全面了解Hadoop的生态系统及应用场景。 ... [详细]
  • 本文探讨了如何在日常工作中通过优化效率和深入研究核心技术,将技术和知识转化为实际收益。文章结合个人经验,分享了提高工作效率、掌握高价值技能以及选择合适工作环境的方法,帮助读者更好地实现技术变现。 ... [详细]
  • 深入理解一致性哈希算法及其应用
    本文详细介绍了分布式系统中的一致性哈希算法,探讨其原理、优势及应用场景,帮助读者全面掌握这一关键技术。 ... [详细]
  • 本文探讨了2012年4月期间,淘宝在技术架构上的关键数据和发展历程。涵盖了从早期PHP到Java的转型,以及在分布式计算、存储和网络流量管理方面的创新。 ... [详细]
  • 深入解析Hadoop的核心组件与工作原理
    本文详细介绍了Hadoop的三大核心组件:分布式文件系统HDFS、资源管理器YARN和分布式计算框架MapReduce。通过分析这些组件的工作机制,帮助读者更好地理解Hadoop的架构及其在大数据处理中的应用。 ... [详细]
  • 深入解析BookKeeper的设计与应用场景
    本文介绍了由Yahoo在2009年开发并于2011年开源的BookKeeper技术。BookKeeper是一种高效且可靠的日志流存储解决方案,广泛应用于需要高性能和强数据持久性的场景。 ... [详细]
  • 本文详细介绍了使用ZooKeeper构建高可用集群的方法,包括必要的软件环境准备、配置文件调整及集群启动等关键步骤。通常,一个ZooKeeper集群由奇数个节点组成,以确保Leader选举的有效性。 ... [详细]
  • 优化使用Apache + Memcached-Session-Manager + Tomcat集群方案
    本文探讨了使用Apache、Memcached-Session-Manager和Tomcat集群构建高性能Web应用过程中遇到的问题及解决方案。通过重新设计物理架构,解决了单虚拟机环境无法真实模拟分布式环境的问题,并详细记录了性能测试结果。 ... [详细]
  • 58同城的Elasticsearch应用与平台构建实践
    本文由58同城高级架构师于伯伟分享,由陈树昌编辑整理,内容源自DataFunTalk。文章探讨了Elasticsearch作为分布式搜索和分析引擎的应用,特别是在58同城的实施案例,包括集群优化、典型应用实例及自动化平台建设等方面。 ... [详细]
  • 本文深入探讨了Linux系统中网卡绑定(bonding)的七种工作模式。网卡绑定技术通过将多个物理网卡组合成一个逻辑网卡,实现网络冗余、带宽聚合和负载均衡,在生产环境中广泛应用。文章详细介绍了每种模式的特点、适用场景及配置方法。 ... [详细]
  • 本文详细介绍如何使用 Apache Spark 执行基本任务,包括启动 Spark Shell、运行示例程序以及编写简单的 WordCount 程序。同时提供了参数配置的注意事项和优化建议。 ... [详细]
  • 深入解析:OpenShift Origin环境下的Kubernetes Spark Operator
    本文探讨了如何在OpenShift Origin平台上利用Kubernetes Spark Operator来管理和部署Apache Spark集群与应用。作为Radanalytics.io项目的一部分,这一开源工具为大数据处理提供了强大的支持。 ... [详细]
  • MapReduce原理是怎么剖析的
    这期内容当中小编将会给大家带来有关MapReduce原理是怎么剖析的,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。1 ... [详细]
  • 构建Snowflake中的近实时数据摄取管道
    探索如何在Snowflake中构建高效的近实时数据摄取管道,利用其内外表特性及Snowpipe服务,实现数据的快速、稳定加载。 ... [详细]
author-avatar
明天爱你1314_138
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有