HTTP浅谈

HTTP浅谈

1···什么是HTTP?

HTTP协议就是超文本传输协议(HyperText Transfer Protocol),通俗理解是浏览器和web服务器传输数据格式的协议,HTTP协议是一个应用层协议。

HTTP协议是基于TCP协议的,发送数据之前需要建立好连接

HTTP是万维网的数据通信的基础。设计HTTP最初的目的是为了提供一种发布和接收HTML页面<网页>的方法。

HTTP协议的制作者是蒂姆·伯纳斯-李,他供职于CERN(欧洲核子研究组织)

1991年发布的0.9版,该版本极其简单,只有一个GET请求方法1996年5月,HTTP/1.0版本发布1997年1月,HTTP/1.1版本发布,目前使用就是HTTP/1.1版本

2···网络传输-TCP/IP四层的模型

TCP/IP模型又称为TCP/IP协议族,是一系列网络协议的总称。TCP/IP模型一共包括几百种协议,制作协议的目的,就是保证计算机之间可以进行按照一定格式进行数据通信。

3··· HTTP协议#的工作模式

HTTP协议的工作模式是一次请求(request)和一次响应(response)的模式

4···Http与Https的区别:

a-HTTP 的URL http:// 开头,
而HTTPS 的URL https:// 开头

b-HTTP 是不安全的,
HTTPS 是安全的

c-HTTP 标准端口是80
HTTPS 的标准端口是443

d-在OSI 网络模型中,HTTP工作于应用层,
  而HTTPS 的安全传输机制工作在传输层

e-HTTP 无法加密,
而HTTPS 对传输的数据进行加密

f-HTTP  无需证书,
 而HTTPS 需要CA机构的颁发的SSL证书

5···什么是Http协议无状态协议?

无状态协议对于事务处理没有记忆能力。缺少状态意味着如果后续处理需要前面的信息
也就是说,当客户端一次HTTP请求完成以后,客户端再发送一次HTTP请求,HTTP并不知道当前客户端是一个”老用户“。

解决方法:
可以使用Cookie来解决无状态的问题,Cookie就相当于一个通行证,第一次访问的时候给客户端发送一个Cookie,当客户端再次来的时候,拿着Cookie(通行证),那么服务器就知道这个是”老用户“。

6···URI和URL的区别

URI  (是uniform resource identifier,统一资源标识符,用来唯一的标识一个资源。)

Web上可用的每种资源如HTML文档、图像、视频片段、程序等都是一个来URI来定位的
URI一般由三部组成:
①访问资源的命名机制
②存放资源的主机名
③资源自身的名称,由路径表示,着重强调于资源。

URL  (是uniform resource locator,统一资源定位器,它是一种具体的URI,即URL可以用来标识一个资源,而且还指明了如何locate这个资源。)

URL是Internet上用来描述信息资源的字符串,主要用在各种万维网的客户程序和服务器程序上,特别是著名的Mosaic。
采用URL可以用一种统一的格式来描述各种信息资源,包括文件、服务器的地址和目录等。URL一般由三部组成:
①协议(或称为服务方式)
②存有该资源的主机IP地址(有时也包括端口号)
③主机资源的具体地址。如目录和文件名等

URN  (是uniform resource name,统一资源命名,是通过名字来标识资源,比如mailto:[email protected]。)

URI是以一种抽象的,高层次概念定义统一资源标识,而URL和URN则是具体的资源标识的方式。

URL和URN都是一种URI。笼统地说,每个 URL 都是 URI,但不一定每个 URI 都是 URL。

这是因为 URI 还包括一个子类,即统一资源名称 (URN),它命名资源但不指定如何定位资源。

上面的 mailto、news 和 isbn URI 都是 URN 的示例。

 

7···常用的HTTP方法有哪些?

GET: 用于请求访问已经被URI(统一资源标识符)识别的资源,可以通过URL传参给服务器
POST:用于传输信息给服务器,主要功能与GET方法类似,但一般推荐使用POST方式。
PUT: 传输文件,报文主体中包含文件内容,保存到对应URI位置。
DELETE:删除文件,与PUT方法相反,删除对应URI位置的文件。
OPTIONS:查询相应URI支持的HTTP方法。(当客户端想要决定其他可用的方法来检索或者处理Web服务端的一个文档时使用。)

HEAD: 获得报文首部,与GET方法类似,只是不返回报文主体,一般用于验证URI是否有效。(当客户端向Web服务器请求一个资源的一些信息而不是资源的全部信息的时候使用。)

TRACE: 当客户端要求可用的代理服务器或者中间服务更改请求来宣布自己的时候使用。

CONNECT: 当客户端想要确定一个明确的连接到远程主机的时候使用,通常便于通过Http代理服务器进行SSL加密通信(Https)连接使用。

8···HTTP请求报文与响应报文格式

请求报文主要有两种(POST和GET),包含四部分:

请求报文的请求头常用到的字段

Host:请求资源所在服务器

Accept:可处理的媒体类型

Accept-Charset:可接收的字符集

Accept-Encoding:可接受的内容编码

Accept-Language:可接受的自然语言

响应报文也是包含了四部分:

 

9···HTTPS工作原理

一、首先HTTP请求服务端生成证书,客户端对证书的有效期、合法性、域名是否与请求的域名一致、证书的公钥(RSA加密)等进行校验;

二、客户端如果校验通过后,就根据证书的公钥的有效, 生成随机数,随机数使用公钥进行加密(RSA加密);

三、消息体产生的后,对它的摘要进行MD5(或者SHA1)算法加密,此时就得到了RSA签名;

四、发送给服务端,此时只有服务端(RSA私钥)能解密。

五、解密得到的随机数,再用AES加密,作为密钥(此时的密钥只有客户端和服务端知道)

具体的参考链接:http://blog.csdn.net/sean_cd/article/details/6966130

10···一次完整的HTTP请求所经历的7个步骤

HTTP通信机制是在一次完整的HTTP通信过程中,Web浏览器与Web服务器之间将完成下列7个步骤:

  • 建立TCP连接

在HTTP工作开始之前,Web浏览器首先要通过网络与Web服务器建立连接,该连接是通过TCP来完成的,该协议与IP协议共同构建 Internet,即著名的TCP/IP协议族,因此Internet又被称作是TCP/IP网络。HTTP是比TCP更高层次的应用层协议,根据规则, 只有低层协议建立之后才能,才能进行更层协议的连接,因此,首先要建立TCP连接,一般TCP连接的端口号是80。

  • Web浏览器向Web服务器发送请求行

一旦建立了TCP连接,Web浏览器就会向Web服务器发送请求命令。例如:GET /sample/hello.jsp HTTP/1.1。

  • Web浏览器发送请求头

    • 浏览器发送其请求命令之后,还要以头信息的形式向Web服务器发送一些别的信息,之后浏览器发送了一空白行来通知服务器,它已经结束了该头信息的发送。

  • Web服务器应答

    • 客户机向服务器发出请求后,服务器会客户机回送应答, HTTP/1.1 200 OK ,应答的第一部分是协议的版本号和应答状态码。

  • Web服务器发送应答头

    • 正如客户端会随同请求发送关于自身的信息一样,服务器也会随同应答向用户发送关于它自己的数据及被请求的文档。

  • Web服务器向浏览器发送数据

    • Web服务器向浏览器发送头信息后,它会发送一个空白行来表示头信息的发送到此为结束,接着,它就以Content-Type应答头信息所描述的格式发送用户所请求的实际数据

  • Web服务器关闭TCP连接

    Connection:keep-alive

    • 一般情况下,一旦Web服务器向浏览器发送了请求数据,它就要关闭TCP连接,然后如果浏览器或者服务器在其头信息加入了这行代码:

TCP连接在发送后将仍然保持打开状态,于是,浏览器可以继续通过相同的连接发送请求。保持连接节省了为每个请求建立新连接所需的时间,还节约了网络带宽。

建立TCP连接->发送请求行->发送请求头->(到达服务器)发送状态行->发送响应头->发送响应数据->断TCP连接

最具体的HTTP请求过程:http://blog.51cto.com/linux5588/1351007

11···常见的HTTP相应状态码

  • 200:服务器已成功处理了请求

  • 201:请求成功并且服务器创建了新的资源
  • 204: 服务器成功处理了请求,但没有返回任何内容

  • 206:服务器成功处理了部分 GET 请求

  • 301:请求的网页已永久移动到新位置

  • 302:服务器目前从不同位置的网页响应请求,但请求者应继续使用原有位置来进行以后的请求。

  • 303:请求者应当对不同的位置使用单独的 GET 请求来检索响应时,服务器返回此代码

  • 304:自从上次请求后,请求的网页未修改过。 服务器返回此响应时,不会返回网页内容

  • 307:服务器目前从不同位置的网页响应请求,但请求者应继续使用原有位置来进行以后的请求

  • 400:服务器不理解请求的语法

  • 401: 请求要求身份验证

  • 403:服务器拒绝请求

  • 404:服务器无法找到对应资源

  • 500:服务器内部错误

  • 503: 服务器目前无法使用(由于超载或停机维护)。 通常,这只是暂时状态。

 

 

12···HTTP1.1版本新特性

  • a、默认持久连接节省通信量,只要客户端服务端任意一端没有明确提出断开TCP连接,就一直保持连接,可以发送多次HTTP请求

  • b、管线化,客户端可以同时发出多个HTTP请求,而不用一个个等待响应

  • c、断点续传

    • 实际上就是利用HTTP消息头使用分块传输编码,将实体主体分块传输。

13···HTTP优化方案

我下面就简要概括一下:

  • TCP复用:TCP连接复用是将多个客户端的HTTP请求复用到一个服务器端TCP连接上,而HTTP复用则是一个客户端的多个HTTP请求通过一个TCP连接进行处理。前者是负载均衡设备的独特功能;而后者是HTTP 1.1协议所支持的新功能,目前被大多数浏览器所支持。

  • 内容缓存:将经常用到的内容进行缓存起来,那么客户端就可以直接在内存中获取相应的数据了。

  • 压缩:将文本数据进行压缩,减少带宽

  • SSL加速(SSL Acceleration):使用SSL协议对HTTP协议进行加密,在通道内加密并加速

  • TCP缓冲:通过采用TCP缓冲技术,可以提高服务器端响应时间和处理效率,减少由于通信链路问题给服务器造成的连接负担。

详情参考:

以上部分内容参考于:https://www.cnblogs.com/Java3y/p/8444033.html

均为个人学习总结,若有误之处,还望大牛们评论指出,互相学习共勉

猜你喜欢

转载自www.cnblogs.com/BUG-Hugo-qing/p/10612310.html
今日推荐