热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

解析大型互联网应用架构

大型互联网应用系统平台主要是针对于高访问量、高并发、低延迟、高吞吐量的大型网站建立的底层系统架构。大型网站的运行需要一个可靠、安全、可扩展、易维护的应用系统平台做为应用支撑,以保证

大型互联网应用系统平台主要是针对于高访问量、高并发、低延迟、高吞吐量的大型网站建立的底层系统架构。大型网站的运行需要一个可靠、安全、可扩展、易维护的应用系统平台做为应用支撑,以保证网站应用的高效稳定运行。

大型互联网应用系统又可分为几个子系统:
(1) Web前端应用系统
(2) 负载均衡系统
(3) 数据库集群系统
(4) 应用缓存系统
(5) 分布式存储系统
(6) 分布式服务器管理系统
(7) 代码托管与持续发布系统

1. WEB前端应用系统

《解析大型互联网应用架构》 WEB前端应用系统

为了达到不同应用的服务器共享、避免单点故障、集中管理、统一配置等目的,不以应用划分服务器,而是将所有服务器做统一使用,每台服务器都可以对多个应用提供服务,当某些应用访问量升高时,通过增加服务器节点达到整个服务器集群的性能提高,同时使其他应用也会受益。

该Web前端系统基于Apache/Nginx/Tengine等的Web应用服务器平台,提供用户访问的前端应用程序。服务器对开发人员是透明的,不需要开发人员介入服务器管理。

2. 负载均衡

《解析大型互联网应用架构》 负载均衡

负载均衡系统分为硬件和软件两种。

  • 硬件负载均衡效率高,硬件负载均衡通过对通信链路进行链路负载均衡,保证每条通信线路都能够高效的运转,但是相比软件负载均衡来说其价格比较昂贵,常见的硬件负载均衡有F5、A10等。

  • 软件负载均衡系统价格较低或者开源,效率较硬件负载均衡系统低,不过对于流量一般或稍大些网站来讲也足够使用,常用的软件负载均衡有LVS(四层负载)、HAProxy(四层和七层负载)和Nginx(七层负载)等。目前大多数互联网应用网站都是硬件、软件负载均衡系统相结合使用。

3.数据库集群系统

《解析大型互联网应用架构》 数据库集群系统

由于Web前端采用了负载均衡集群结构提高了服务的有效性和扩展性,因此数据库必须也是高可靠、高可用的,才能保证整个服务体系的高可靠性,如何构建一个高可靠的并可以提供大规模并发处理的数据库体系?

我们可以采用如上图所示的方案:

(1)、 使用 MySQL 数据库,考虑到Web应用的数据库读多写少的特点,我们主要对读数据库做了优化,提供专用的读数据库和写数据库,在应用程序中实现读操作和写操作分别访问不同的数据库。

(2)、 使用 MySQL Replication 机制实现快速将主库(写库) 的数据库复制到从库(读库) 。一个主库对应多个从库,主库数据实时同步到从库。

(3)、 写数据库(主库)有多台,每台都可以提供多个应用共同使用,这样可以解决写库的性能瓶颈问题和单点故障问题。

(4)、 读数据库(备库)有多台,通过负载均衡设备实现负载均衡,从而达到读数据库的高性能、高可靠和高可扩展性。

(5)、 数据库服务器和应用服务器分离。

(6)、 从数据库使用LVS、HaProxy、BigIP做负载均衡。

4. 应用缓存系统

《解析大型互联网应用架构》 应用缓存系统

应用缓存分为文件缓存、内存缓存、数据库缓存。在大型Web应用中使用最多且效率最高的是内存缓存。最常用的内存缓存工具是Memcached。使用正确的缓存系统可以达到实现以下目标:

(1)、使用缓存系统可以提高访问效率,提高服务器吞吐能力,改善用户体验。

(2)、减轻对数据库及存储集服务器的访问压力。

(3)、Memcached服务器有多台,避免单点故障,提供高可靠性和可扩展性,提高性能。

5.分布式存储系统

《解析大型互联网应用架构》 分布式存储系统

Web系统平台中的存储需求有下面两个特点:

(1)、存储量很大,经常会达到单台服务器无法提供的规模,比如相册、视频等应用。因此需要专业的大规模存储系统。

(2)、负载均衡cluster中的每个节点都有可能访问任何一个数据对象,每个节点对数据的处理也能被其他节点共享,因此这些节点要操作的数据从逻辑上看只能是一个整体,不是各自独立的数据资源。

因此高性能的分布式存储系统对于大型网站应用来说是非常重要的一环。

6. 分布式服务器管理系统

《解析大型互联网应用架构》 分布式服务器管理系统

随着网站访问流量的不断增加,大多的网络服务都是以负载均衡集群的方式对外提供服务,随之集群规模的扩大,原来基于单机的服务器管理模式已经不能够满足我们的需求,新的需求必须能够集中式的、分组的、批量的、自动化的对服务器进行管理,能够批量化的执行计划任务。

在分布式服务器管理系统软件中有一些比较优秀的软件,其中比较理想的一个是CfEngine。它可以对服务器进行分组,不同的分组可以分别定制系统配置文件、计划任务等配置。它是基于C/S 结构的,所有的服务器配置和管理脚本程序都保存在CfEngine Server上,而被管理的服务器运行着 CfEngine Client 程序,CfEngine Client通过SSL加密的连接定期的向服务器端发送请求以获取最新的配置文件和管理命令、脚本程序、补丁安装等任务。

有了CfEngine这种集中式的服务器管理工具,我们就可以高效的实现大规模的服务器集群管理,被管理服务器和 CfEngine Server 可以分布在任何位置,只要网络可以连通就能实现快速自动化的管理。

7. 代码托管与持续发布系统

《解析大型互联网应用架构》 代码托管与持续发布

随着网站访问流量的不断增加,大多的网络服务都是以负载均衡集群的方式对外提供服务,随之集群规模的扩大,为了满足集群环境下程序代码的批量分发和更新,我们还需要一个程序代码发布系统。

这个发布系统可以帮我们实现下面的目标:

(1)、生产环境的服务器以虚拟主机方式提供服务,不需要开发人员介入维护和直接操作,提供发布系统可以实现不需要登陆服务器就能把程序分发到目标服务器。

(2)、我们要实现内部开发、内部测试、生产环境测试、生产环境发布的4个开发阶段的管理,发布系统可以介入各个阶段的代码发布。

(3)、我们需要实现源代码管理和版本控制,SVN或者Git可以实现该需求。

这里面可以使用常用的工具Rsync(Linux系统下的异步文件传输工具),通过开发相应的脚本工具实现服务器集群间代码同步分发。


推荐阅读
  • 软件测试行业深度解析:迈向高薪的必经之路
    本文深入探讨了软件测试行业的发展现状及未来趋势,旨在帮助有志于在该领域取得高薪的技术人员明确职业方向和发展路径。 ... [详细]
  • 我的读书清单(持续更新)201705311.《一千零一夜》2006(四五年级)2.《中华上下五千年》2008(初一)3.《鲁滨孙漂流记》2008(初二)4.《钢铁是怎样炼成的》20 ... [详细]
  • 本文探讨了在一个物理隔离的环境中构建数据交换平台所面临的挑战,包括但不限于数据加密、传输监控及确保文件交换的安全性和可靠性。同时,作者结合自身项目经验,分享了项目规划、实施过程中的关键决策及其背后的思考。 ... [详细]
  • 流处理中的计数挑战与解决方案
    本文探讨了在流处理中进行计数的各种技术和挑战,并基于作者在2016年圣何塞举行的Hadoop World大会上的演讲进行了深入分析。文章不仅介绍了传统批处理和Lambda架构的局限性,还详细探讨了流处理架构的优势及其在现代大数据应用中的重要作用。 ... [详细]
  • 如何在U8系统中连接服务器并获取数据
    本文介绍了如何在U8系统中通过不同的方法连接服务器并获取数据,包括使用MySQL客户端连接实例的方法,如非SSL连接和SSL连接,并提供了详细的步骤和注意事项。 ... [详细]
  • Maven + Spring + MyBatis + MySQL 环境搭建与实例解析
    本文详细介绍如何使用MySQL数据库进行环境搭建,包括创建数据库表并插入示例数据。随后,逐步指导如何配置Maven项目,整合Spring框架与MyBatis,实现高效的数据访问。 ... [详细]
  • 本文介绍了SIP(Session Initiation Protocol,会话发起协议)的基本概念、功能、消息格式及其实现机制。SIP是一种在IP网络上用于建立、管理和终止多媒体通信会话的应用层协议。 ... [详细]
  • 问题描述现在,不管开发一个多大的系统(至少我现在的部门是这样的),都会带一个日志功能;在实际开发过程中 ... [详细]
  • 从理想主义者的内心深处萌发的技术信仰,推动了云原生技术在全球范围内的快速发展。本文将带你深入了解阿里巴巴在开源领域的贡献与成就。 ... [详细]
  • 本文总结了一次针对大厂Java研发岗位的面试经历,探讨了面试中常见的问题及其背后的原因,并分享了一些实用的面试准备资料。 ... [详细]
  • 本文探讨了在MySQL数据库中处理大规模数据删除的最佳实践,包括分批删除、利用索引、管理事务以及选择合适的删除命令等策略,旨在提升删除效率并确保系统稳定。 ... [详细]
  • 本文探讨了在SQL Server 2008环境下,当尝试删除拥有数据库架构的用户时遇到的问题及解决方案,包括如何查询和更改架构所有权。 ... [详细]
  • 深入探讨:Actor模型如何解决并发与分布式计算难题
    在现代软件开发中,高并发和分布式系统的设计面临着诸多挑战。本文基于Akka最新文档,详细探讨了Actor模型如何有效地解决这些挑战,并提供了对并发和分布式计算的新视角。 ... [详细]
  • 如何在Django框架中实现对象关系映射(ORM)
    本文介绍了Django框架中对象关系映射(ORM)的实现方式,通过ORM,开发者可以通过定义模型类来间接操作数据库表,从而简化数据库操作流程,提高开发效率。 ... [详细]
  • MySQL InnoDB 存储引擎索引机制详解
    本文深入探讨了MySQL InnoDB存储引擎中的索引技术,包括索引的基本概念、数据结构与算法、B+树的特性及其在数据库中的应用,以及索引优化策略。 ... [详细]
author-avatar
苦柚甜甜
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有