1.浏览器与web服务器的通信原理概述

大家都看到过苹果落地，但只有牛顿追问了为什么。

本章看点：

浏览器如何解析URL
浏览器会根据网址含义生成请求消息，通过它将用户需要哪些数据告知服务器，那么请求消息具体是什么
浏览器会委托操作系统向web服务器发出请求，但需要先告诉操作系统接收方的IP地址。URL中只有web服务器的域名，因此浏览器需要向DNS服务器查询域名对应的IP地址
全世界的DNS服务器相互协作完成IP地址的查询
IP地址查到后，浏览器就会委托操作系统向web服务器发出请求，这个委托是如何完成的

1.1 生成HTTP请求消息

1.1.1 输入网址

URL（Uniform resource locator），统一资源定位符
URL有多种，因为浏览器是一个具备客户端功能的综合性客户端软件，不同的URL适用于不同的场合
URL的开头部分就表示协议类型，也可以说是访问方法
1.访问web服务器使用HTTP（hypertext transfer protocol）协议 2.访问FTP（file transfer protocol）服务器使用FTP协议（使用FTP协议来传送文件的程序也被叫做FTP）

1.1.2 解析URL

URL =协议类型+web服务器域名+文件路径
如：https://mp.csdn.net/postedit/80036681

1.1.3 省略文件名的情况

http://www.lab.dgd.com/dir/ 以 / 结尾表示后面的文件名被省略
http://www.lab.dgd.com/ 也表示省略了文件名（只有 / 表示根目录）
http://www.lab.dgd.com 没有路径名，表示访问根目录下事先设定好的默认文件
以上的URL，只要没有文件名或文件路径，都会访问默认文件
只要末尾有 / ，就表示这是一个目录，下级还有文件

1.1.4 HTTP协议基本思路

客户端发送请求消息
服务器接受消息，处理，发响应消息
客户端接受响应消息，使用
注：一条请求消息只能含1个URL，如果需要多个文件，必须对每个文件单独发送1条请求（后来人们设计出了能在一次连接中收发多个请求和响应的办法）

1.请求消息

请求消息 = URI（对什么） + 方法（进行什么操作）注：还有一些表示附加信息的头字段，客户端会先发送头字段，再发送数据
URI（identifier，统一资源标识符）：URI的内容是一个存放网页数据的文件或是一个CGI程序（对web服务器程序调用其他程序的规则所做的定义，按照CGI规范来工作的程序称为CGI程序），也可以使用URL作为URI，换句话说，可以写各种访问目标，它们统称为URI
方法：GET， POST等
POST：URI会指向web服务器中运行的一个应用程序的文件名；在请求消息中，还要加上传给应用程序和脚本的数据（表单中填写的数据）

2.响应消息

响应消息开头有一个状态码，表示操作结果成功与否。如：访问web服务器时，遇到找不到的文件就会显示404 NOT found
状态码后面就是头字段和网页数据

1.1.5 生成HTTP请求消息

第一行称为请求行，包括方法，URI，HTTP版本等
然后是消息头，每一行包含一个头字段，表示请求的附加信息（日期，客户端支持的数据类型，语言，压缩格式等）
空行
然后是消息体，包含向服务器发送的数据，例如POST方法中的网页表单数据，GET方法的消息体中则不需要任何数据

1.1.6 响应消息

与请求消息差别只在第一行，内容为状态码（告知程序执行的结果）+响应短语（告知人）

1.2 向DNS服务器查询web服务器的IP地址

1.2.1 IP地址基本知识

子网：用集线器连接起来的几台计算机（当计算机数量较多时，一台集线器可能无法承受，可以增加集线器数量并将它们相互连接起来，这时，凡是通过集线器连接的所有设备都属于一个子网）
网络：将子网通过路由器连接起来（一些路由器内置了集线器功能）
IP地址= 网络号+主机号
准确的说，IP地址不是分配给每一台设备的，而是分配给设备中安装的网络硬件的。很多服务器上都会安装多块网卡，这是一台计算机就有多个IP地址
子网掩码
主机号：全0表示整个子网，全1表示向子网上所有设备发送包，即广播

1.2.2 域名和IP地址并用的原因

IP地址记忆困难，所以使用域名
域名最短也要几十个字节，所以使用IP地址

1.2.3 Socket库提供查询IP地址的功能

对于DNS（domain name system）服务器，计算机上有相应的DNS客户端，叫DNS解析器
解析器实际上是一段程序，包含在操作系统的Socket库中（网络开发的一种标准库）
Socket库中包含的程序组件可以让其他应用程序调用操作系统的网络功能

1.2.4 通过解析器向DNS服务器发出查询

只需要调用解析器程序，将域名告诉它就可以了（实际上实现解析器需要多个程序配合）

DNS服务器的IP地址事先以已置好，不需要查询

1.2.5 解析器的内部原理

解析器会生成要发送给DNS服务器的查询消息
发送消息不是由解析器执行，而是委托给操作系统内部的协议栈（网络控制软件，也叫协议驱动，TCP/IP驱动），因为和浏览器一样，解析器也不具备使用网络收发数据的功能。
协议栈会通过网卡将消息发送出去

1.3 DNS服务器大接力

1.3.1 DNS服务器的基本工作

DNS服务器会从域名与IP地址的对照表中查找相应的记录，并返回IP地址

来自客户端的查询消息包括以下三种信息：

域名
class：识别是哪一种网络
记录类型：A：表示域名对应的是IP地址 MX（mail exchange）：表示对应的是邮件服务器（对于不同的类型，服务器返回的信息也不同）（当然还有其他的类型）

DNS服务器中信息是保存在配置文件中的，一行信息成为一条资源记录

1.3.2 域名的层次结构

在域名中，越靠右的位置表示其层级越高
一个域的信息是作为整体存放在DNS服务器中的，不能将一个域拆开存在多台服务器
一台服务器可以存放多个域的信息

1.3.3 寻找相应的DNS服务器并获取IP地址

根域：在域名的最后加一个点
根域的DNS服务器信息保存在互联网所有DNS服务器中
根域服务器不止一个
客户端首先会访问默认的DNS服务器

1.3.4 通过缓存加快服务器的响应

DNS服务器有缓存功能，可以记住之前查询过的域名
“不存在”的响应结果也可以被缓存
缓存信息有有效期，超期会被删除
响应时，DNS服务器会告知客户端相应结果来自缓存还是负责管理该域名的服务器

1.4委托协议栈发送消息

1.4.1 数据收发概览

创建套接字
连接
收发数据
断开并删除

以上每一步在Socket库中都有对应的程序组件

委托这个操作是通过调用Socket库中的程序组件来执行的，而这些程序组件不执行任何实质性的操作，应用程序的委托内容最终会传递到协议栈

1.4.2 创建套接字

套接字创建后，协议栈会返回一个描述符，用来识别不同的套接字

1.4.3 连接

调用connect，需指定描述符，服务器IP地址，端口号
端口号和IP地址：客户端和服务器之间用来识别对方套接字的机制
描述符：应用程序用来识别套接字的机制

1.4.4 通信

1.4.5 断开

扫描二维码关注公众号，回复： 918489 查看本文章

1.浏览器与web服务器的通信原理概述

猜你喜欢