在浏览器输入URL后的Web流程

第一部分:URL

URL:是平常输入的站点链接,支持多种链接。

URL的作用:定位服务器的资源。

URL的详细格式:schema(底层协议,如:http,https,ftp....)://host(服务器的域名或者IP地址)[:port#](服务器端口,http默认端口为80,可省略,其他端口要注明)/path/(访问资源的路径)···/[?query-string](发送给http服务器的数据)[#anchor](锚)


第二部分:在浏览器输入URL后的Web流程

具体可以分为三个部分:

1.创建连接;因为http是构建在TCP之上,那么自然是要经过3次握手创建连接。

2.服务器处理;创建连接后,服务器会根据url请求中的信息进行处理,作出响应,一般来说是找到一个html文件返回给客户端。

3.客户端渲染;客户端即浏览器得到html,进行渲染。

 
 

创建连接

这个跟网络关联多一些,我网络学的马马虎虎,只能大体说一下。

  • 对于http的客户端,它的输入就是一个url
  • 而对于创建连接,它需要的只是url的host(主机)部分
  • 主机地址一般是网站的域名,所以第一步肯定是域名解析,也就是要通过DNS服务器进行域名解析得到网站的ip地址,然后向这个ip地址发送一个连接建立的请求,如果服务器接收到请求会返回一个确认,客户端得到确认再次发送确认,连接建立成功

当然在这个过程中还会涉及到很多细节,这是网络中的知识,在这里不多讲。

服务器处理

建立好连接后,客户端就会发送http请求,请求信息包含一个头部和一个请求体

一般的web技术都会把请求进行封装然后交给我们的服务器进行处理,比如servlet会把请求封装成httpservletrequest对象,把响应封装成httpsevletresponse对象。nodejs的http模块,当你创建服务器的时候会写一个回调函数,回调的参数用来接受http请求对象和响应对象,然后在回调函数中对请求进行处理。

在请求对象中我们可以得到path(路径),queryString(查询字符串),body(post请求中提交的数据)等。

对请求的处理就可以很复杂,也可以很简单。

我们可以根据path找到客户端想要的文件,读取这个文件,然后通过响应对象把内容返回给客户端,这个过程,不同的技术提供的api可能不同,尤其是用惯了MVC框架的人,可能只是指定一个文件,或者在配置文件中设置一下就好了。

但是最终的实现肯定是符合http响应标准的,也就是要有一个响应头和一个响应体

我一般接触到的设置响应头就是设置content-type来决定MIME类型,设置Cache-Control,last-modify等缓存内容。

一般来说返回给客户端的内容是一个html字符串,然后content-type设为text/html。

当然也可能客户端请求的是一个image文件,那么就是读取image文件后,content-type可能设为image/png,image/jpg等,然后把内容返回给客户端。

这样一次对请求的处理就结束了。

当然这个过程太单一,而且处理过程也可能很复杂,又有数据的操作,又有页面的构建,又有路径的查找匹配,又有文件的读取等等,于是就出现了MVC框架以及后来演变出的各种MV框架。这里不细讲MVC的内容,因为需要很长的篇幅

只是概述一下MVC主要做了什么,在我看来最重要的就是解耦和模块化。我认为MVC实现最重要的有两点:

1.路由匹配,http请求的path中就不需要指定到具体的视图位置,而是按照我们制定的规则进行匹配,这样就有了很大的灵活性,可编程性。

2.模板技术,一般来说我们最后返回给客户端的是一个html字符串,而有时候这个字符串往往不是静态单一的,有的时候需要和数据进行结合,需要拼接。这就带来了很大的麻烦,模板技术为解决这个问题带来很大的便利性,同时又能够把视图和数据进行解耦。

客户端渲染

客户端接收到服务器传来的响应对象,从中得到html字符串和MIME,根据MIME知道了要用页面渲染引擎来处理内容即html字符串,于是进入页面渲染阶段,这又是一个很庞杂的体系。我只能大体上说一下:

从浏览器的角度讲,它包含几大组件,网络功能(比如http的实现)算是其中之一,渲染引擎也是其中之一,还有其它的一些比如自己UI界面,javascript解释器,客户端数据存储等等。在这里我们主要关注渲染引擎和javascript解释器,对于web开发者来说,这才是浏览器的核心

我们能够在浏览器中看到一个页面,那么这个页面是怎么出现的呢?实际上就是调用底层绘图API给画出来的。不同的渲染引擎,它的实现也不同,主流的引擎包括IE的Trident,chrome和safary的webkit,firefox的Gecko,chrome又出了一个Blink,放弃webkit。于是乎才有了让人头疼的各种兼容性问题。

整体上页面渲染的过程大致是这样的:

渲染引擎得到html字符串作为输入,然后对html进行转换,转化成能够被DOM处理的形式,接着转换成一个dom树,在解析html的过程,解析到<link>,<script>,<img>等一些请求标签时,会发送请求把对应的内容获取到。这时又会同步进行css的解析,构建出css样式规则应用到dom树上,然后进行一定的布局处理,比如标记节点块在浏览器中的坐标等形成最终的渲染树,最后根据这棵渲染树在浏览器窗口中进行绘制。

最终我们就看到了页面的样子。

当然在页面渲染过程中还会同步进行javascript的解析,而且这两者是在同一个线程中的,所以一旦javascript死循环,页面的渲染也就进行不下去了

以上是我从一个web开发者的角度思考的整个过程。如果从别的角度更细化的去想,还包括许多内容:

比如整个网络通信中协议的封装:

在本机中,把要传输的内容即请求对象在应用层上加上App首部,传递到传输层加上TCP首部,到网络层加上IP首部,数据链路层加上以太网的首部和尾部,然后转换成bit流进入网络环境中。到达主机后在一层层解封装,最后把内容交给服务器程序。

再比如这个过程中的认证,加密,安全,编码等问题都会有一定的处理,不过这些内容我就不是很了解。

作者:单纯的土豆 链接:http://www.jianshu.com/p/19fde9ed9fc6 來源:简书

猜你喜欢

转载自blog.csdn.net/pony_18/article/details/78703748