web架构设计经验分享（转自yizhu2000的专栏）

作者：红台门 | 来源：互联网 | 2023-06-25 21:39

导读：本人作为一位web工程师，着眼最多之处莫过于性能与架构，本次幸得参与sd2.0大会，得以与同行广泛交流,于此二方面&#

导读&＃xff1a;

　　本人作为一位web工程师&＃xff0c;着眼最多之处莫过于性能与架构&＃xff0c;本次幸得参与sd2.0大会&＃xff0c;得以与同行广泛交流,于此二方面&＃xff0c;有些心得&＃xff0c;不敢独享&＃xff0c;与众博友分享&＃xff0c;本文是这次参会与众同撩交流的心得&＃xff0c;有兴趣者可以查看视频

　　架构设计的几个心得&＃xff1a;

　　
一&＃xff0c;不要过设计&＃xff1a;never over design

　　这是一个常常被提及的话题&＃xff0c;但是只要想想你的架构里有多少功能是根本没有用到&＃xff0c;或者最后废弃的&＃xff0c;就能明白其重要性了&＃xff0c;初涉架构设计&＃xff0c;往往倾向于设计大而化一的架构&＃xff0c;希望设计出具有无比扩展性&＃xff0c;能适应一切需求的增加架构&＃xff0c;web开发领域是个非常动态的过程&＃xff0c;我们很难预测下个星期的变化&＃xff0c;而又需要对变化做出最快最有效的响应。。

　　ebay的工程师说过&＃xff0c;他们的架构设计从来都不能满足系统的增长&＃xff0c;所以他们的系统永远都在推翻重做。请注意&＃xff0c;不是ebay架构师的能力有问题&＃xff0c;他们设计的架构总是建立旧版本的瓶颈上&＃xff0c;希望通过新的架构带来突破&＃xff0c;然而新架构带来的突破总是在很短的时间内就被新增需求淹没&＃xff0c;于是他们不得不又使用新的架构

　　web开发&＃xff0c;是个非常敏捷的过程&＃xff0c;变化随时都在产生&＃xff0c;用户需求千变万化&＃xff0c;许多方面偶然性非常高&＃xff0c;较之软件开发&＃xff0c;希望用一个架构规划以后的所有设计&＃xff0c;是不现实的

　　
二&＃xff0c;web架构生命周期&＃xff1a;web architecture‘s life cycle

　　既然要杜绝过设计&＃xff0c;又要保证一定的前瞻性&＃xff0c;那么怎么才能找到其中的平衡呢&＃xff1f;希望下面的web架构生命周期能够帮到你

　　

　　设计的架构需要在1&＃xff0d;10倍的增长下&＃xff0c;通过简单的增加硬件容量就能够胜任&＃xff0c;而在5&＃xff0d;10倍的增长期间&＃xff0c;请着手下一个版本的架构设计&＃xff0c;使之能承受下一个10倍间的增长

　　google之所以能够称霸&＃xff0c;不完全是因为搜索技术和排序技术有多先进&＃xff0c;其实包括baidu和yahoo&＃xff0c;所使用的技术现在也已经大同小异&＃xff0c;然而&＃xff0c;google能在一个月内通过增加上万台服务器来达到足够系统容量的能力确是很难被复制的

　　
三&＃xff0c;缓存&＃xff1a;Cache

　　空间换取时间&＃xff0c;缓存永远计算机设计的重中之重&＃xff0c;从cpu到io&＃xff0c;到处都可以看到缓存的身影&＃xff0c;web架构设计重&＃xff0c;缓存设计必不可少&＃xff0c;关于怎样设计合理的缓存&＃xff0c;jbosscache的创始人&＃xff0c;淘宝的创始人是这样说的&＃xff1a;其实设计web缓存和企业级缓存是非常不同的&＃xff0c;企业级缓存偏重于逻辑&＃xff0c;而web缓存&＃xff0c;简单快速为好。。

　　缓存带来的问题是什么&＃xff1f;是程序的复杂度上升&＃xff0c;因为数据散布在多个进程&＃xff0c;所以同步就是一个麻烦的问题&＃xff0c;加上集群&＃xff0c;复杂度会进一步提高&＃xff0c;在实际运用中&＃xff0c;采用怎样的同步策略常常需要和业务绑定

　　老钱为搜狐设计的帖子设计了链表缓存&＃xff0c;这样既可以满足灵活插入的需要&＃xff0c;又能够快速阅读&＃xff0c;而其他一些大型社区也经常采用类此的结构来优化帖子列表&＃xff0c;memcache也是一个常常用到的工具

　　钱宏武谈架构设计视频 http://211.100.26.82/CSDN_Live/140/qhw.flv

　　Cache的常用的策略是&＃xff1a;让数据在内存中&＃xff0c;而不是在比较耗时的磁盘上。从这个角度讲&＃xff0c;mysql提供的heap引擎&＃xff08;存储方式&＃xff09;也是一个值得思考的方法,这种存储方法可以把数据存储在内存中,并且保留sql强大的查询能力,是不是一举两得呢?

　　我们这里只说到了读缓存&＃xff0c;其实还有一种写缓存&＃xff0c;在以内容为主的社区里比较少用到&＃xff0c;因为这样的社区最主要需要解决的问题是读问题&＃xff0c;但是在处理能力低于请求能力时&＃xff0c;或者单个希望请求先被缓存形成块&＃xff0c;然后批量处理时&＃xff0c;写缓存就出现了&＃xff0c;在交互性很强的社区设计里我们很容易找到这样的缓存

　　
四&＃xff0c;核心模块一定要自己开发&＃xff1a;DIY your core module

　　这点我们是深有体会&＃xff0c;钱宏武和云风也都有谈到&＃xff0c;我们经常倾向于使用一些开源模块&＃xff0c;如果不涉及核心模块&＃xff0c;确实是可以的&＃xff0c;如果涉及&＃xff0c;那么就要小心了&＃xff0c;因为当访问量达到一定的程度&＃xff0c;这些模块往往都有这样那样的问题&＃xff0c;当然我们可以把问题归结为对开源的模块不熟悉&＃xff0c;但是不管怎样&＃xff0c;核心出现问题的时候&＃xff0c;不能完全掌握其代码是非常可怕的

　　
五&＃xff0c;合理选择数据存储方式&＃xff1a;reasonable data storage

　　我们一定要使用数据库吗&＃xff0c;不一定&＃xff0c;雷鸣告诉我们搜索不一定需要数据库&＃xff0c;云风告诉我们&＃xff0c;游戏不一定需要数据库&＃xff0c;那么什么时候我们才需要数据库呢&＃xff0c;为什么不干脆用文件来代替他呢&＃xff1f;

　　首先我们需要先承认&＃xff0c;数据库也是对文件进行操作。我们需要数据库&＃xff0c;主要是使用下面这几个功能&＃xff0c;一个是数据存储&＃xff0c;一个是数据检索&＃xff0c;在关系数据库中&＃xff0c;我们其实非常在乎数据库的复杂搜索的能力&＃xff0c;看看一个统计用的tsql就知道了(不用仔细读,扫一眼就可以了)

　　select c.Class_name,d.Class_name_2,a.Creativity_Title,b.User_name,(select count(Id) from review where Reviewid&＃61;a.Id) as countNum from Creativity as a,User_info as b,class as c,class2 as d where a.user_id&＃61;b.id and a.Creativity_Class&＃61;c.Id and a.Creativity_Class_2&＃61;d.Id

　　select a.Id,max(c.Class_name),(max(d.Class_name_2),max(a.Creativity_Title),max(b.User_name),count(e.Id) as countNum from Creativity as a,User_info as b,class as c,class2 as d,review as e where a.user_id&＃61;b.id and a.Creativity_Class&＃61;c.Id and a.Creativity_Class_2&＃61;d.Id and a.Id&＃61;e.Reviewid group by a.Id ..............................................

　　我们可以看出需要数据库关联&＃xff0c;排序的能力&＃xff0c;这个能力在某些情况下非常重要&＃xff0c;但是如果你的网站的常规操作&＃xff0c;全是这样复杂的逻辑&＃xff0c;那效率一定是非常低的&＃xff0c;所以我们常常在数据库里加入许多冗余字段&＃xff0c;来减小简单查询时关联等操作带来的压力&＃xff0c;我们看看下面这张图&＃xff0c;可以看到数据库的设计重心&＃xff0c;和网站(指内容型社区)需要面对的问题实际是有一些偏差的

　　

　　

　　

　　同样其他一些软件产品也遇到同样的问题所以具我了解&＃xff0c;有许多特殊的运用都有自己设计的特殊数据存储结构与方法&＃xff0c;比如有的大型服务程序采取树形数据存储结构&＃xff0c;lucene使用文件来存储索引和文件

　　从另外一个角度上看&＃xff0c;使用数据库&＃xff0c;意味着数据和表现是完全分离的&＃xff08;这当然是经典的设计思路&＃xff09;&＃xff0c;也就是说当需要展示数据时&＃xff0c;不得不需要一个转换的过程&＃xff0c;也可以说是绑定的过程&＃xff0c;当网站具备一定规模的时候&＃xff0c;数据库往往成为效率的瓶颈&＃xff0c;所以许多网站也采用直接书写静态文件的方法来避免读取操作时的绑定

　　这并不是说我们从今天起就可以把我们亲爱的数据库打入冷宫&＃xff0c;而是我们在设计数据的持久化时&＃xff0c;需要根据实际情况来选择存储方式&＃xff0c;而数据库不过是其中一个选项

　　
六&＃xff0c;搞清楚谁是最重要的人&＃xff1a;who&＃39;s the most important guy

　　在用例需求分析的时候常常讲到涉众&＃xff0c;就是和你的设计息息相关的人&＃xff0c;在web中我们一定以为最重要的涉众莫过于用户了。&＃xff0c;在一个传统的互动社区开发中&＃xff0c;最重要的东西是内容&＃xff0c;用户产生内容&＃xff0c;所以用户就是上帝&＃xff0c;至于内容挑选工具&＃xff0c;不就是给坐我后面三排的妹妹们用的吗&＃xff1f;凑或行了&＃xff0c;实在有问题我就在数据里手动帮你加得了。。这大概是眼下许多小型甚至中型网站技术人员的普遍想法。钱宏武在他的讲座里谈到了这个问题&＃xff1a;实际上网站每天产生的内容非常的多&＃xff0c;普通人是不可能看完的&＃xff0c;而编辑负责把精华的内容推荐到首页上&＃xff0c;所以很多用户读到的内容其实都依赖于编辑的推荐&＃xff0c;所以设计让编辑工作方便的工具也是非常重要&＃xff0c;有时甚至是最重要的。

　　
七&＃xff0c;不要执着于文档&＃xff1a;don&＃39;t be crazy about document

　　web开发的文档重要吗&＃xff1f;什么文档最重要&＃xff1f;我的看法是web开发中交流
>文档&＃xff0c;

　　现在大的软件公司比较流行的做法是&＃xff1a;

　　注重产品设计文档&＃xff0c;在这种方法里&＃xff0c;产品文档非常详尽&＃xff0c;并且没有歧义&＃xff0c;开发人员基于设计文档开发&＃xff0c;测试人员基于设计文档制定测试方案&＃xff0c;任何新人都可以通过阅读产品设计文档来了解项目的概况

　　而web项目从概念到实现的时间是非常短的&＃xff0c;而且越短越好&＃xff0c;并且由于变化迅速&＃xff0c;要想写出完整的产品和需求文档是几乎不可能的&＃xff0c;大多数情况是等你写出完备的文档&＃xff0c;项目早就是另外一个样子&＃xff0c;但是没有文档的问题是&＃xff0c;如果团队发生变化&＃xff0c;添加新成员怎样才能了解软件的结构和概念呢&＃xff0c;一种是每个人都了解软件的整个结构&＃xff0c;除非你的团队整体消失&＃xff0c;否则任何一个人都能够担当培养新人的责任&＃xff0c;这种face2face交流比文档有效率很多。

　　于是就有了前office开发者&＃xff0c;现任yahoo中国某产品开发负责人的刘振飞所感觉到的落差&＃xff0c;他说&＃xff0c;
我们的项目是吵出来的&＃xff0c;我听完会心一笑

　　
八&＃xff0c;团队&＃xff1a;team

　　不要专家团队&＃xff0c;而要外科手术式的团队,你的团队里一定要有清道夫&＃xff0c;需要有弓箭手&＃xff0c;让他们和项目一起成长&＃xff0c;才是项目负责人的最大成就

　　

　　
总结&＃xff1a;

　　0)架构是一种权衡

　　

　　

　　

　　1)web开发的特点是是&＃xff1a;没有太复杂的技术难点&＃xff0c;一切在于迅速的把握需求&＃xff0c;其实这正式敏捷开发的要旨所在&＃xff0c;一切都可以非常快速的建立&＃xff0c;非常快速的重构&＃xff0c;我们的开发工具&＃xff0c;底层库和框架&＃xff0c;包括搜索引擎和web文档提供的帮助&＃xff0c;都提我们供给了敏捷的能力。

　　2)此外&＃xff0c;相应的&＃xff0c;最有效率的交流方式必须留给web开发&＃xff0c;那就是face2face&＃xff08;面对面&＃xff09;&＃xff0c;不要太担心你的设计不能被完备的文档所保留下来&＃xff0c;他们会以交流&＃xff0c;代码和小卡片的方式保存下来

　　3)人的因素会更加重要&＃xff0c;无论是对用户的需求&＃xff0c;还是开发人员的素质。

　　

　　另&＃xff1a;有关web效率&＃xff0c;有著名的14条规则&＃xff0c;由yahoo性能效率小组所总结&＃xff0c;并广为流传。业已出现相关插件&＃xff08;YSlow&＃xff09;&＃xff0c;针对具体网页按彼规则评分&＃xff0c;这次该小组负责人Tenni Theurer也受邀来到此次大会&＃xff0c;我把Tenni小姐&＃xff08;之前真的没有想到她是个女孩&＃xff0c;并且如此年轻&＃xff09;和她的团队的14 rules列在下面

　　Make Fewer HTTP Requests

　　Use a Content Delivery Network

　　Add an Expires Header

　　Gzip Components

　　Put CSS at the Top

　　Move Scripts to the Bottom

　　Avoid CSS Expressions

　　Make Javascript and CSS External

　　Reduce DNS Lookups

　　Minify Javascript

　　Avoid Redirects

　　Remove Duplicate Scripts

　　Configure ETags

　　Make Ajax Cacheable

　　

　　通过安装firebug和YSlow这两个firefox插件(请注意要先安装firebug再安装yslow,下载后拖动到firefox里即可)我们可以看到你的网页根据下面的规则的评分,这是我在博客园博客首页的评分截图,上面D表示总分,下面是单项评分,A最好F最差,不知道还有没有G :)

　　

本文转自

http://blog.csdn.net/yizhu2000/archive/2007/12/04/1915554.aspx

推荐阅读

cpu
如何实现织梦DedeCms全站伪静态

本文介绍了如何通过修改织梦DedeCms源代码来实现全站伪静态，以提高管理和SEO效果。全站伪静态可以避免重复URL的问题，同时通过使用mod_rewrite伪静态模块和.htaccess正则表达式，可以更好地适应搜索引擎的需求。文章还提到了一些相关的技术和工具，如Ubuntu、qt编程、tomcat端口、爬虫、php request根目录等。 ... [详细]

蜡笔小新 2023-12-14 19:45:47
cpu
基于PgpoolII的PostgreSQL集群安装与配置教程

本文介绍了基于PgpoolII的PostgreSQL集群的安装与配置教程。Pgpool-II是一个位于PostgreSQL服务器和PostgreSQL数据库客户端之间的中间件，提供了连接池、复制、负载均衡、缓存、看门狗、限制链接等功能，可以用于搭建高可用的PostgreSQL集群。文章详细介绍了通过yum安装Pgpool-II的步骤，并提供了相关的官方参考地址。 ... [详细]

蜡笔小新 2023-12-14 19:10:25
数组
Linux下部署Symfoy2对app/cache和app/logs目录的权限设置，symfoy2logs

php教程|php手册xml文件php教程-php手册Linux下部署Symfoy2对appcache和applogs目录的权限设置，symfoy2logs黑色记事本源码,vsco ... [详细]

蜡笔小新 2023-10-17 20:32:59
数组
【基础篇】————28、横向渗透

0x00端口渗透端口扫描端口的指纹信息（版本信息）端口所对应运行的服务常见的默认端口号.尝试弱口令端口爆破hydra端口弱口令NTScanHs ... [详细]

蜡笔小新 2023-10-16 19:02:14
go
阿里云mysql性能,阿里云mysql性能

本文目录一览：1、mysqld占用CPU过高是什么原因 ... [详细]

蜡笔小新 2023-10-15 10:32:39
go
DEDECMS最新5.7版在Windows下的Memcache安装

一，织梦后台后台设置进入系统后台,在[系统基本参数]下面的性能选项卡当中,关于memcache进行如下配置:cfg_memcache_enable:是否启用memcache缓存，如果为否(N) ... [详细]

蜡笔小新 2023-10-13 10:45:42
byte
EPICS Archiver Appliance存储waveform记录的尝试及资源需求分析

本文介绍了EPICS Archiver Appliance存储waveform记录的尝试过程，并分析了其所需的资源容量。通过解决错误提示和调整内存大小，成功存储了波形数据。然后，讨论了储存环逐束团信号的意义，以及通过记录多圈的束团信号进行参数分析的可能性。波形数据的存储需求巨大，每天需要近250G，一年需要90T。然而，储存环逐束团信号具有重要意义，可以揭示出每个束团的纵向振荡频率和模式。 ... [详细]

蜡笔小新 2023-12-14 17:43:56
byte
postman测试登录后的接口_使用postman进行接口测试的方法(测试用户管理模块)

本文介绍了使用postman进行接口测试的方法，以测试用户管理模块为例。首先需要下载并安装postman，然后创建基本的请求并填写用户名密码进行登录测试。接下来可以进行用户查询和新增的测试。在新增时，可以进行异常测试，包括用户名超长和输入特殊字符的情况。通过测试发现后台没有对参数长度和特殊字符进行检查和过滤。 ... [详细]

蜡笔小新 2023-12-14 10:29:45
byte
Python连接服务器失败：使用aiohttp模拟服务器出现错误问题及解决方法

本文介绍了在使用Python中的aiohttp模块模拟服务器时出现的连接失败问题，并提供了相应的解决方法。文章中详细说明了出错的代码以及相关的软件版本和环境信息，同时也提到了相关的警告信息和函数的替代方案。通过阅读本文，读者可以了解到如何解决Python连接服务器失败的问题，并对aiohttp模块有更深入的了解。 ... [详细]

蜡笔小新 2023-12-13 12:37:59
byte
海马s5近光灯能否直接更换为H7？

本文主要介绍了海马s5车型的近光灯是否可以直接更换为H7灯泡，并提供了完整的教程下载地址。此外，还详细讲解了DSP功能函数中的数据拷贝、数据填充和浮点数转换为定点数的相关内容。 ... [详细]

蜡笔小新 2023-12-12 11:39:00
go
一句话解决高并发的核心原则

本文介绍了解决高并发的核心原则，即将用户访问请求尽量往前推，避免访问CDN、静态服务器、动态服务器、数据库和存储，从而实现高性能、高并发、高可扩展的网站架构。同时提到了Google的成功案例，以及适用于千万级别PV站和亿级PV网站的架构层次。 ... [详细]

蜡笔小新 2023-12-12 10:56:24
sum
Spark实现高斯朴素贝叶斯模型的低配版

本文介绍了使用Spark实现低配版高斯朴素贝叶斯模型的原因和原理。随着数据量的增大，单机上运行高斯朴素贝叶斯模型会变得很慢，因此考虑使用Spark来加速运行。然而，Spark的MLlib并没有实现高斯朴素贝叶斯模型，因此需要自己动手实现。文章还介绍了朴素贝叶斯的原理和公式，并对具有多个特征和类别的模型进行了讨论。最后，作者总结了实现低配版高斯朴素贝叶斯模型的步骤。 ... [详细]

蜡笔小新 2023-12-10 21:42:37
sum
解决Sharepoint 2013运行状况分析出现的“一个或多个服务器未响应”问题的方法

本文介绍了解决Sharepoint 2013运行状况分析中出现的“一个或多个服务器未响应”问题的方法。对于有高要求的客户来说，系统检测问题的存在是不可接受的。文章详细描述了解决该问题的步骤，包括删除服务器、处理分布式缓存留下的记录以及使用代码等方法。同时还提供了相关关键词和错误提示信息，以帮助读者更好地理解和解决该问题。 ... [详细]

蜡笔小新 2023-12-10 13:37:58
hash
LVS 实现负载均衡的原理

LVS实现负载均衡的原理LVS负载均衡负载均衡集群是LoadBalance集群。是一种将网络上的访问流量分布于各个节点，以降低服务器压力，更好的向客户端 ... [详细]

蜡笔小新 2023-12-10 12:10:22
hash
php yac缓存如何清理,yac和memcache性能对比测试

yac是Laruence开发的一个php进程共享内存的开源项目。详情可以查看。http:www.laruence.com201303182846.htmlmemcache就不用多说 ... [详细]

蜡笔小新 2023-10-13 10:40:45

红台门

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章