目录儿
- 1 使用HTTP协议访问Web
- 2 HTTP的诞生
- 2.1 因特网的起源
- 2.2 互联网、因特网与万维网
- 2.3 万维网与HTTP
- 3 网络基础 TCP/IP
- 3.1 TCP/IP 协议族
- 3.2 TCP/IP 的分层管理
- 3.3 TCP/IP 通信传输流
- 4 与 HTTP 关系密切的协议:IP、TCP 和 DNS
- 4.1 负责传输的 IP 协议
- 4.2 确保可靠性的 TCP 协议
- 4.3 负责域名解析的 DNS 服务
- 5 各种协议与 HTTP 协议的关系
1 使用HTTP协议访问Web
在Web 浏览器根据地址栏中指定的 URL
,从 Web 服务器端获取文件资源(resource)等信息,返回浏览器中,由浏览器解析返回的信息,渲染出我们看到的 Web 页面。
像这种通过发送请求获取服务器资源的都可称为客户端
(client),包括但不限于浏览器。
在这个访问的过程中,使用了HTTP
传输协议来处理传输的信息。
HTTP
(HyperText Transfer Protocol)是一种超文本传输协议,Web
以该协议作为规范,完成从客户端到服务器端等一系列运作处理。可以说,Web
是建立在 HTTP
协议上通信的。
超文本:
超文本也是一种文本,传统文本主要是线性方式组织的,而超文本是非线性方式进行组织的,可以将各种不同空间的文字信息组织在一起,形成区别于传统文本的网状结构的文本。
2 HTTP的诞生
2.1 因特网的起源
因特网起源于 美苏冷战时期 美国的阿帕网(ARPANET ),起初目的是美国为了保证在遭受苏联核打击后,仍然具有一定的生存和反击能力, 于是认为有必要设计出一种分散的指挥系统:它由一个个分散的 指挥点组成,当部分指挥点被摧毁后,其它点仍能正常工作, 并且这些点之间,能够绕过那些已被摧毁的指挥点而继续保持联系。这是因特网的设想雏形。
2.2 互联网、因特网与万维网
- 互联网:由通信的设备,如计算机、手机等,组成的网络。
- 因特网:是线路、协议以及通过 TCP/IP 协议实现数据电子传输的硬件和软件的集合体。Internet提供的主要服务有万维网(WWW)、文件传输(FTP)、电子邮件E-mail、远程登录(Telnet)等。
- 万维网:则存在于互联网之上。它是无数个网络站点和网页的集合,构成了因特网主要的部分。它实际上是多媒体的集合,是由超级连接连接而成的。我们通常通过网络浏览器上网观看的,就是万维网的内容。万维网由浏览器浏览连超文本页面组成,这些超文本页面是通过TCP/IP协议从网络上获取的。网页的开头部分总是http://或者https://,表明被浏览器的信息是超文本,是利用超文本传输协议来传输的。所以,如果把互联网看成是基础,那么万维网就可以被看成是对互联网的应用。
三者之间的关系:互联网包含因特网,因特网包含万维网。即互联网
>因特网
>万维网
。
这其实是一个概念排序,如果按照一定的量化指标来排个人认为应该是因特网
>万维网
>互联网
。
为啥这样说?
- 互联网本质上是指由通信的设备,如计算机、手机等,组成的网络,就是局域网!一堆硬件设备不管你通过什么协议用什么方法(网线电线还是什么东西)连接起来形成一个互联通路,就能称为互联网。
- 因特网是基于互联网的联网,它是把多个互联网(局域网)连起来的一个公网,表面上是一个软网概念,但是它也是要基于硬件去实现,而且因特网的每个节点(互联网)的基础终端就是一堆硬件设备,所以说因特网是一个软硬件结合集合,它的量化规模一定是比它的单个节点(互联网)大的。
- 万维网则是基于因特网实现的多媒体应用网络,凡是使用
HTTP
协议的网络都是万维网,但是因为它生长在因特网之上,所以它的量化规模比因特网小,至于和互联网比规模大小则需要用具体的量化指标才能比较。
2.3 万维网与HTTP
1989 年 3 月,当时的互联网还只属于少数人,欧洲核子研究组织的蒂姆 • 伯纳斯 - 李(Tim Berners Lee)博士提出了一种 能让远隔两地的研究者们共享知识 的设想(万维网的奠基思想)。
最初设想的基本理念是:借助多文档之间相互关联形成的超文本(HyperText),连成可相互参阅文档的互联网WWW
(万维网)。于是提出了 3 项 WWW
构建技术,分别是:
- 创建基于标准通用标记语言
SGML
(Standard Generalized Markup Language)的超文本标记语言HTML
(HyperText Markup Language,)作为页面的文本标记语言 ; - 建立文档传输协议(
HTTP
协议 ); - 提出统一资源定位符
URL
(Uniform Resource Locator,)概念,用来指定文档所在地址 。
也就是说。其实HTML
、HTTP
、URL
、WWW
等都是与万维网相关的概念。
万维网制定的标准是一个叫做万维网联盟的组织。万维网联盟,又称W3C理事会。
3 网络基础 TCP/IP
为了理解 HTTP
,有必要事先了解一下 TCP/IP
协议族。
通常使用的网络是在 TCP/IP
协议族的基础上运作的。而 HTTP
属于它内部的一个子集,说人话就是HTTP
协议是基于TCP/IP
协议族创建出来的协议。
3.1 TCP/IP 协议族
计算机与网络设备要相互通信,双方就必须基于相同的方法。比如,如何探测到通信目标、由哪一边先发起通信、使用哪种语言进行通信、怎样结束通信等规则都需要事先确定。不同的硬件、操作系统之间的通信,所有的这一切都需要一种规则。而我们就把这种规则称为 协议(protocol)
协议中存在各式各样的内容:从电缆的规格到 IP 地址的选定方法、寻找异地用户的方法、双方建立通信的顺序,以及 Web 页面显示需要处理的步骤,等等。
协议族:多个相关协议的集合。例如TCP/IP 协议族
,它包含了 TCP
、IP
、UDP
、Telnet
、FTP
、SMTP
等上百个互为关联的协议,其中 TCP
和 IP
是最常用的两种底层协议,所以把它们统称为TCP/IP 协议族
。
3.2 TCP/IP 的分层管理
TCP/IP 协议族按层次分别分为以下 4 层:
- 应用层:应用层决定了向用户提供应用服务时通信的活动。TCP/IP 协议族内预存了各类通用的应用服务。比如,
FTP
(File
Transfer Protocol,文件传输协议)和 DNS
(Domain Name System,域名系统)服务就是其中两类。HTTP
协议也处于该层。 - 传输层:传输层对上层应用层,提供处于网络连接中的两台计算机之间的数据传输。在传输层有两个性质不同的协议:
TCP
(Transmission Control Protocol,传输控制协议)和 UDP
(User Data Protocol,用户数据报协议) - 网络层:网络层用来处理在网络上流动的数据包。数据包是网络传输的最小数据单位。该层规定了通过怎样的路径(所谓的传输路线)到达对方计算机,并把数据包传送给对方。与对方计算机之间通过多台计算机或网络设备进行传输时,网络层所起的作用就是在众多的选项内选择一条传输路线。
- 链路层:用来处理连接网络的
硬件
部分。包括控制操作系统、硬件的设备驱动、NIC(Network Interface Card,网络适配器,即网卡),及光纤等物理可见部分(还包括连接器等一切传输媒介)。硬件上的范畴均在链路层的作用范围之内。
3.3 TCP/IP 通信传输流
利用 TCP/IP 协议族进行网络通信时,会通过分层顺序与对方进行通信。发送端从应用层往下走,接收端则往应用层往上走。我们用 HTTP 举例来说明,首先作为发送端的客户端在应用层(HTTP 协议)发出一个想看某个 Web 页面的 HTTP 请求。接着,为了传输方便,在传输层(TCP 协议)把从应用层处收到的数据(HTTP 请求报文)进行分割,并在各个报文上打上标记序号及端口号后转发给网络层。在网络层(IP 协议),增加作为通信目的地的 MAC 地址后转发给链路层。这样一来,发往网络的通信请求就准备齐全了。接收端的服务器在链路层接收到数据,按序往上层发送,一直到应010用层。当传输到应用层,才能算真正接收到由客户端发送过来的 HTTP请求。
发送端在层与层之间传输数据时,每经过一层时必定会被打上一个该层所属的首部信息。反之,接收端在层与层传输数据时,每经过一层时会把对应的首部消去。这种把数据信息包装起来的做法称为 封装(encapsulate)。
一个请求的过程:客户端应用程序→网卡→网络→网卡→服务端应用程序
其实本质就是 由 应用层 → 物理层 逐层封装,由 物理层 → 应用层 逐层解封
4 与 HTTP 关系密切的协议:IP、TCP 和 DNS
4.1 负责传输的 IP 协议
按层次分,IP
(Internet Protocol 网际协议)位于网络层
,几乎所有使用网络的系统都会用到 IP 协议。TCP/IP 协议族中的 IP
指的就是网际协议
,有人会把IP
和IP 地址
搞混,IP
其实是一种协议的名称。
IP 协议的作用是把各种数据包传送给对方。而要保证确实传送到对方那里,则需要满足各类条件。其中两个重要的条件是 IP 地址和 MAC地址(Media Access Control Address)。
IP 地址
指明了节点被分配到的地址,MAC 地址
是指网卡所属的固定地址。IP 地址
可以和 MAC 地址
进行配对。IP 地址可
变换,但 MAC地址
基本上不会更改。
使用 ARP 协议凭借 MAC 地址进行通信
IP
间的通信依赖 MAC 地址
。在网络上,通信的双方在同一局域网(LAN)内的情况是很少的,通常是经过多台计算机和网络设备中转才能连接到对方。而在进行中转时,会利用下一站中转设备的 MAC 地址
来搜索下一个中转目标。这时,会采用 ARP
协议(Address Resolution Protocol)。
ARP 是一种用以解析地址的协议,根据通信方的 IP 地址就可以反查出对应的 MAC 地址。
4.2 确保可靠性的 TCP 协议
按层次分,TCP
位于传输层
,提供可靠的字节流服务。
所谓的字节流服务(Byte Stream Service)是指,为了方便传输,将大块数据分割成以报文段(segment)为单位的数据包进行管理。
而可靠的传输服务是指,能够把数据准确可靠地传给对方。一言以蔽之,TCP 协议
为了更容易传送大数据才把数据分割,而且 TCP 协议
能够确认数据最终是否送达到对方。
如何确保数据能到达目标?
为了准确无误地将数据送达目标处,TCP 协议采用了三次握手(three-way handshaking)策略。用 TCP 协议把数据包送出去后,TCP不会对传送后的情况置之不理,它一定会向对方确认是否成功送达。握手过程中使用了 TCP 的标志(flag)——SYN(synchronize)和 ACK(acknowledgement)。
发送端首先发送一个带 SYN 标志的数据包给对方。接收端收到后,回传一个带有 SYN/ACK 标志的数据包以示传达确认信息。最后,发送端再回传一个带 ACK 标志的数据包,代表“握手”结束。
若在握手过程中某个阶段莫名中断,TCP 协议会再次以相同的顺序发送相同的数据包。
4.3 负责域名解析的 DNS 服务
DNS(Domain Name System)服务是和 HTTP 协议一样位于应用层的协议。它提供域名到 IP 地址之间的解析服务。计算机既可以被赋予 IP 地址,也可以被赋予主机名
和域名
。比如www.hackr.jp
。
用户通常使用主机名或域名来访问对方的计算机,而不是直接通过IP 地址访问。因为与 IP 地址的一组纯数字相比,用字母配合数字的表示形式来指定计算机名更符合人类的记忆习惯。
但要让计算机去理解名称,相对而言就变得困难了。因为计算机更擅长处理一长串数字。
为了解决上述的问题,DNS 服务应运而生。DNS 协议提供通过域名查找 IP 地址,或逆向从 IP 地址反查域名的服务。
5 各种协议与 HTTP 协议的关系
6 URI 和 URL
摘取文档、书籍:
- https://zhuanlan.zhihu.com/p/336912995
- 《图解HTTP》-上野宣注-于均良译-人民有点出版社