热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

网站架构之架构演化

网站从构建之初的很少有人问津,用户数量较少,并发量较低,到之后的拥有千万上亿用户,数万量级的高并发,之间经历了怎样的过程,小型网站架构是怎样逐步演化的,本文简单探讨下这方面的内容,

网站从构建之初的很少有人问津,用户数量较少,并发量较低,到之后的拥有千万上亿用户,数万量级的高并发,之间经历了怎样的过程,小型网站架构是怎样逐步演化的,本文简单探讨下这方面的内容,主要参考《大型网站架构设计》,这本书知识点总结的还是比较全面的。

1. 初始阶段

网站开始是没有太多访问量的,只需一台服务器就绰绰有余了,应用程序,数据库,静态资源等全部都在一台服务器上,一般使用LAMP/LNMP(Linux+Apache/Nginx+MySQL+PHP/Python等)就可以实现自己的网站了,具体架构如下所示:

技术分享

2. 应用服务与数据服务分离

随着网站业务的发展,用户访问量的增加,存储数据的增长,单台服务器逐渐不能满足需求,需要将应用服务与数据服务分离,具体如下图所示:

技术分享

由于负责提供的服务不同,每台服务器对硬件资源的需求是不同的,具体如下所示:

不同服务所需资源表
服务器类型 处理业务 所需资源
应用服务器 处理所有业务逻辑 更快、更多CPU
文件服务器 存储用户上传文件或服务自身所需文件资源 更大的磁盘空间
数据库服务器 做数据缓存以及进行数据检索 更大的内存以及更快的磁盘

3. 缓存

随着用户逐渐增多,数据库压力太大,导致访问延迟,影响用户体验,而网站性能优化最优先考虑的就是缓存

网站访问特点所遵循的二八定律:80%的业务访问集中在20%的数据上;

 网站使用缓存又可分为应用服务器本地缓存和远程分布式缓存,远程分布式缓存一般可采用集群的方式部署,对服务器内存有比较高的要求,具体如下图所示:

技术分享

4. 应用服务器集群部署

随着访问量进一步增大,单台应用服务器已逐渐不能应对越来越多的请求连接,单台服务器硬件资源再强,也会逐渐满足不了业务高峰时的负载压力;

网站解决高并发、海量数据问题最常用的手段还是使用集群,做横向扩展,集群可以很好地满足伸缩性

负载均衡服务器实现可以有比较多的方案,LVS,Nginx,F5等,可以和HA软件,如Heartbeat与Keepalived等一起使用;

通过应用服务器集群部署,使用负载均衡调度器,可以将用户的请求分发到多台应用服务器集群中的任一台机器上,而且根据用户访问量的多少,可以很容易增删服务器,是每台服务器负载都在可接受范围之内,具体如下图所示:

技术分享

5. 数据库读写分离

对于缓存没命中和缓存过期的数据,仍需要从数据库中来读取,并且所有写操作也都需要访问数据库,数据库压力还是会随着访问量增加而增大;

可采用主从热备的方案,实现读写分离,例如mysql的master-slave模式,当读操作量级更高时,还可采用一主多从的方式来实现;

应用程序中的数据访问模块需要保证数据库的读写分离对应用透明; 

具体如下图所示:

技术分享

6. 使用CDN和反向代理加速网站

中国网络环境复杂,不同地区用户访问相同网站,速度差别较大,而网站访问延时和用户流失率正相关;

主要加速网站访问速度,减轻后端服务器负载压力的方式就是使用CDN反向代理

CDN和反向代理的基本原理都是缓存

CDN部署在网络提供商的机房,缓存网站的一些热点静态资源,用户在请求网站服务时,从距离自己最近的网络提供商机房获取数据,如视频、图片等;

反向代理部署在网站的中心机房,属于网站前端架构的一部分,当用户请求到达中心机房后,首先访问反向代理服务器,如果缓存着用户请求的资源(静态),就直接返回;

反向代理比较成熟的开源软件:Squid、Varnish,推荐使用Varnish,从稳定性、访问速度、并发连接数目比较来看,Varnish都更强大一点;

使用缓存的前提条件:
1. 数据访问热点不均衡,某些数据会被频繁访问;
2. 数据在某个时间段内有效,不会很快过期,否则可能造成缓存数据已经失效,产生脏读,影响结果正确性

具体如下图所示:

技术分享

7. 分布式文件系统和分布式数据库系统

 随着业务量的增长,网站最常用的数据库拆分是按业务分库,将不同业务的数据库部署在不同的服务器上;

一般分布式数据库是网站数据库拆分的最后手段,只有在单表规模非常庞大的时候才使用;

具体如下图所示:

技术分享

8. 使用NoSQL和搜索引擎

全文检索对于大型网站来说已成为不可或缺的一部分,例如LuceneSolr等;

对非格式化的数据使用NoSQL存储更为方便,NoSQL也更适合大数据计算,较为流行的NoSQL数据库有HBase、MongoDB、CouchDB、Redis、Cassandra等;

不同NoSQL数据库使用的存储方式不同,例如Redis,Memcache等采用的是Key/Value键值对存储,MongoDB,CouchDB等采用的是按文档存储,一条记录中所有数据都存储在文档中,HBase,Cassandra等采用的是列存储;

具体如下图所示:

技术分享

9. 按业务拆分

网站在发展壮大之后,往往包含了多种复杂的业务场景,使用分而治之的手段将整个网站业务分成不同的产品线,将网站拆分成多个不同的应用,每个应用独立部署维护,应用之间可以通过超链接、消息队列等关联起来,具体如下图所示:

技术分享

10. 分布式服务

在上面业务拆分的基础上,将一些公共的业务抽取出来,独立部署,如给用户管理、商品管理等,这些可复用的业务连接数据库,提供公共服务,而应用系统只需管理用户界面;

具体如下图所示:

技术分享

分布式主要还是为了解决高并发问题,但也引入了一些其他问题:

1. 服务调用必须通过网络,可能会对性能造成较大影响;
2. 服务器越多,故障概率越大,一台服务器宕机可能会导致连锁反应(滚雪球效应),导致很多应用不可访问,网站可用性降低,设计时应尽量避免;
3. 数据在分布式环境保持数据一致性也比较困难,分布式事务难以保证,这对网站业务正确性和业务流程可能造成影响;
4. 导致网站依赖错综复杂,开发管理维护困难;

简单总结

驱动网站技术发展的主要力量永远是网站业务的发展;

网站都是逐渐演化而来的,根据需要灵活应对才是最重要的;

技术是为了业务而服务的,永远不要为了技术而技术;

网站架构之架构演化


推荐阅读
  • 优化Flask应用的并发处理:解决Mysql连接过多问题
    本文探讨了在Flask应用中通过优化后端架构来应对高并发请求,特别是针对Mysql 'too many connections' 错误的解决方案。我们将介绍如何利用Redis缓存、Gunicorn多进程和Celery异步任务队列来提升系统的性能和稳定性。 ... [详细]
  • 本文深入探讨了MySQL中常见的面试问题,包括事务隔离级别、存储引擎选择、索引结构及优化等关键知识点。通过详细解析,帮助读者在面对BAT等大厂面试时更加从容。 ... [详细]
  • Java项目分层架构设计与实践
    本文探讨了Java项目中应用分层的最佳实践,不仅介绍了常见的三层架构(Controller、Service、DAO),还深入分析了各层的职责划分及优化建议。通过合理的分层设计,可以提高代码的可维护性、扩展性和团队协作效率。 ... [详细]
  • Python Django大学生心理健康管理系统开发(含源码、文档)
    本项目包含完整的源代码、设计文档、数据库结构以及详细的安装指南,旨在为计算机专业的学生提供一个全面的心理健康管理系统解决方案。 ... [详细]
  • 本文详细介绍了 phpMyAdmin 的安装与配置方法,适用于多个版本的 phpMyAdmin。通过本教程,您将掌握从下载到部署的完整流程,并了解如何根据不同的环境进行必要的配置调整。 ... [详细]
  • 本文详细介绍了如何在云服务器上配置Nginx、Tomcat、JDK和MySQL。涵盖从下载、安装到配置的完整步骤,帮助读者快速搭建Java Web开发环境。 ... [详细]
  • 访问一个网页的全过程
    准备:DHCPUDPIP和以太网启动主机,用一根以太网电缆连接到学校的以太网交换机,交换机又与学校的路由器相连.学校的这台路由器与一个ISP链接,此ISP(Intern ... [详细]
  • 深入剖析JVM垃圾回收机制
    本文详细探讨了Java虚拟机(JVM)中的垃圾回收机制,包括其意义、对象判定方法、引用类型、常见垃圾收集算法以及各种垃圾收集器的特点和工作原理。通过理解这些内容,开发人员可以更好地优化内存管理和程序性能。 ... [详细]
  • 在项目中使用 Redis 时,了解其不同架构模式(如单节点、主从复制、哨兵模式和集群)对于确保系统的高可用性和扩展性至关重要。本文将详细探讨这些模式的特点和应用场景。 ... [详细]
  • 本文探讨了如何通过一系列技术手段提升Spring Boot项目的并发处理能力,解决生产环境中因慢请求导致的系统性能下降问题。 ... [详细]
  • 本文深入探讨了 Oracle 数据库的网络配置,包括全局数据库名、实例名等关键参数的设置与作用,旨在为数据库管理员和开发人员提供全面的参考。 ... [详细]
  • 本文介绍了如何利用 MySQL 的原生函数 FIND_IN_SET 和 GROUP_CONCAT 实现树形结构数据的递归查询。通过创建自定义函数,可以轻松获取多层级的数据关系,并优化查询性能。 ... [详细]
  • MongoDB的核心特性与架构解析
    本文深入探讨了MongoDB的核心特性,包括其强大的查询语言、灵活的文档模型以及高效的索引机制。此外,还详细介绍了MongoDB的体系结构,解释了其文档、集合和数据库的层次关系,并对比了MongoDB与传统关系型数据库(如MySQL)的逻辑结构。 ... [详细]
  • 本文详细阐述了云主机流量的概念,探讨其对网站性能和安全的关键影响,并提供了优化配置的实用建议。 ... [详细]
  • 开发笔记:由数据库某字段存数组引发的json_encode/serialize思考
    开发笔记:由数据库某字段存数组引发的json_encode/serialize思考 ... [详细]
author-avatar
坦克大道_639
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有