Web服务(03)——HTTP协议

Web服务(03)——HTTP协议

前言

HTTP协议是Hyper Text Trasfer Protocol(超文本传输协议)的缩写。是用于从万维网服务器传输超文本到本地浏览器的传送协议。HTTP是一个基于TCP/IP通信协议来传递数据(HTML文件,图片文件,查询结果等)。

HTTP/HTTPS是应用层上的协议,建立在传输层TCP之上,客户端通过与鼓舞短进行TCP链接之后发送HTTP请求与接收HTTP响应都是通过访问Socket接口来调用TCP协议实现。

HTTP默认端口号为80,也可以根据中间件需求改为8080或其他端口。

一、HTTP工作原理

HTTP协议工作于客户端-服务端架构上。浏览器作为HTTP客户端通过URL向HTTP服务端即WEB服务器发送所有请求。Web服务器根据接收到的请求之后,向客户端发送响应信息。

注意事项:

①HTTP是无连接的,限制每次连接只处理一个请求。服务器处理完客户的请求,并收到客户的应答后,即断开连接。采用这种方式可以节省传输时间。

②HTTP是媒体独立的,只要哭护短和服务器知道图和处理的数据内容,任何类型的数据都可以通过HTTP发送。客户端以及服务器指定使用合适的MIME-type内容类型。

③HTTP是无状态的,指的是协议对于事务处理没有记忆能力。缺少状态意味着如果后续处理需要前面的信息,则必须重传,这样可能导致每次链接传送的数据量增大。另一方面,在服务器不需要先前信息时它的应答就较快。本身不会对发送过的请求和相应的通信状态进行持久化处理。这样做的目的是为了保持HTTP协议的简单性,从而能够快速处理大量的事务,提高效率。然而,在许多应用场景中,我们需要保持用户登录的状态或记录用户购物车中的商品。由于HTTP是无状态协议,所以必须引入一些技术来记录管理状态,例如Cookie(浏览器缓存)、session(服务端缓存)。

HTTP协议通信流程图:

二、HTTP的版本

HTTP协议的版本有:HTTP 0.9(已过时)、HTTP 1.0、HTTP 1.1、HTTP 2.0。而目前使用最多的版本是1.0和1.1版本。

HTTP1.0和1.1版本的区别:

①缓存处理

HTTP1.0中主要使用header里的If-Modified-Since,Expires来做为缓存判断的标准。

HTTP1.1则引入了更多的缓存控制策略例如Entitytag,If-Unmodified–Since,If-Match,If-None-Match等更多可供选择的缓存头来控制缓存策略。

②带宽优化及网络连接的使用

HTTP1.0中,存在一些浪费带宽的现象,例如客户端只是需要某个对象的一部分,而服务器却将整个对象送过来了,并且不支持断点续传功能。

HTTP1.1则在请求头引入了range头域,它允许只请求资源的某个部分,即返回码是206(PartialContent),这样就方便了开发者自由的选择以便于充分利用带宽和连接。

③错误通知的管理

在HTTP1.1中新增了24个错误状态响应码,如409表示请求的资源与资源的当前状态发生冲突;410表示服务器上的某个资源被永久删除。

④Host头处理

在HTTP1.0中认为每台服务器都绑定一个唯一的IP地址,因此请求消息中的RZ并没有传递主机名。但随着虚拟主机技术的发展,在一台物理服务器上可以存在多个虚拟主机,并且它们共享一个IE地址。

HTTP1.1的请求信息和响应消息都应支持Host头域,且请求消息中如果没有inost头域会报告一个错误——400。

⑤长链接

HTTP1.1支持长链接和请求的流水线处理,在一个TCP连接上可以传送多个HTTP请求和响应,减少了建立和关闭连接的消耗和延迟,在HTTP1.1中默认开启connection:keep-alive,一定程度上弥补了HTTP1.0每次请求都要创建连接的缺点。

三、客户端请求信息

客户端发送一个HTTP请求到服务器的请求消息包括一下格式:请求行(request line)、请求头部(header)、空行和请求数据(请求体)四个部分组成,如图:

P0ST/HTTP1,1####请求行,请求类型、访问资源、HTTP版本Host:www.wrox.com
User-Agent:Mozilla/4.0 (compatible;MSIE 6.0;windows NT 5.1;SV1;.NET CLR 2.0.50727;.NET CLR3.0.04506.648;.NET CLR3.5.21022)
Content-Type:application/x-www-form-urlencoded
Content-Length:40Connection:Keep-Alive

name=Professional%20Ajax&publisher=wiley

四、HTTP的请求方法

根据HTTP标准,HTTP请求可以使用多种请求方法,其中:

HTTP1.0定义了三种请求方法:GET、POST、HEAD方法。

HTTP1.1新增了五种请求方法:OPTIONS、PUT、DELETE、TRACE、CONNECT。

方法 描述
GET 请求指定的页面信息,并返回实体主体
POST 向指定资源提交数据进行处理请求(例如提交表单或者上传文件)。数据被包含在请求体中。POST请求可能会导致新的资源的建立和/或已有资源的修改
HEAD 类似于get请求,只不过返回的响应中没有具体的内容,用于获取报头
PUT 从客户端向服务器传送的数据取代指定的文档内容。
DELETE 请求服务器删除指定的页面
OPTIONS 允许客户端查看服务器的性能
TRACE 回显服务收到的请求,主要用于测试或判断
CONNECT HTTP1.1协议中预留给能够将连接改为管道方式的代理服务器

Http协议主要的请求格式是:GET和POST的方法。

1.GET方式

①请求行

请求的方式;请求的资源路径;请求的版本协议号

②请求头

请求头 描述
Accept 客户端可以接受的数据类型
Accept-Language 客户端可以接受的语言类型
User-Agent 浏览器信息
Accpect-Encoding 客户端可以接受的编码格式
Host 表示请求的ip和端口号
Connection 告诉服务器请求连接如何处理
Keep-Alive 通知服务器回传数据不要马上关闭,保持一小段链接
Closed 马上关闭

③请求体

发送给服务器的数据

2.POST方式

①请求行

请求的方式;请求的资源路径;请求的版本协议号

②请求头

请求头 描述
Accept 客户端可以接受的数据类型
Accept-Language 客户端可以接受的语言类型
Content-Type 发送数据的类型
Content-Length 发送数据的长度
Referer 表示请求发起时,浏览器地址栏中的地址
User-Agent 浏览器的信息

3.GET和POST的区别

①语言上的区别

GET向服务器请求数据,依照HTTP协议,get是用来请求数据。

POST向服务器发送数据,依照HTTP协议,POST的语义是向服务器添加数据,也就是说按照POST的语义,该操作是会修改服务器上的数据。

②服务器请求的区别

GET请求是可以被缓存的。例如访问百度后的内容被缓存在浏览器中,短时间内再次访问,就是拿到缓存的内容。另外GET请求只能接收ASCII码的回复。

POST请求是不可以被缓存的。对于POST方式提交表单,刷新页面浏览器会弹出提示框“是否重新提交表单”。POST可以接受二进制等各种数据形式,所以如果要上传文件一般用POST请求。

③参数放请求头和请求体的差别

GET请求通常没有请求体,在TCP传输中只需传输一次,所以GET请求效率高。

POST请求将数据放在请求体中,而实际传输中,会先传输完请求头,再传输请求体,是分两次传输的。POST请求头比GET更小,请求头更容易在一个TCP包中完成传输,可以更好的保证HTTP包的完整性。

总结:

GET方法:

从指定的服务器上获得数据

GET请求能被缓存

GET请求会保存在浏览器的浏览纪录里(cookit)

GET请求有长度的限制

主要用于获取数据

查询的字符串会显示在URL中,不安全

POST方法:

提交数据给指定服务器处理

POST请求不能被缓存

POST请求不会保存在浏览器的浏览纪录里

POST请求没有长度限制

查询的字符串不会显示在URL中,比较安全

五、服务器响应消息

HTTP响应也由四个部分组成:状态行、信息报头、空行和响应正文。

HTTP/1.1 200 OK ###版本号、状态码、状态消息
Date:Mon,27 Jul 2009 12:28:53 GMT
Server:Apache
Last-Modified:Wed,22 Jul 2009 19:15:56 GMT
ETag:"34aa387-d-1568eb00"
Accept-Ranges:bytes
Content-Length:51
Vary:Accept-Encoding
Content-Type:text/plain

七、HTTP状态码

当浏览者访问一个网页时,浏览者的浏览器会向网页所在服务器发出请求。当浏览器接收并显示网页前,此网页所在的服务器会返回一个包含 HTTP 状态码的信息头(server header)用以响应浏览器的请求。

HTTP 状态码的英文为 HTTP Status Code

1、HTTP 状态码分类

HTTP 状态码由三个十进制数字组成,第一个十进制数字定义了状态码的类型。响应分为五类:信息响应(100–199),成功响应(200–299),重定向(300–399),客户端错误(400–499)和服务器错误 (500–599):

分类 分类描述
1** 信息,服务器收到请求,需要请求者继续执行操作
2** 成功,操作被成功接收并处理
3** 重定向,需要进一步的操作以完成请求
4** 客户端错误,请求包含语法错误或无法完成请求
5** 服务器错误,服务器在处理请求的过程中发生了错误

2、HTTP状态码列表

状态码 英文名称 含义
100 Continue 继续。客户端应继续其请求
101 Switching Protocols 切换协议。服务器根据客户端的请求切换协议。只能切换到更高级的协议,例如,切换到HTTP的新版本协议
状态码 英文名称 含义
200 Ok 请求成功。一般用于GET和POST请求
201 Created 已创建。成功请求并创建了新的资源
202 Accepted 已接收。已经接受请求,但未处理完成
203 Non-Authoritative Information 非授权信息。请求成功,但返回的meta信息不在原始的服务器,而是一个副本
204 No Content 无内容。服务器成功处理,但未返回内容。在未更新网页的情况下,可确保浏览器继续显示当前文档
205 Reset Content 重置内容。服务器处理成功,用户终端(例如:浏览器)应重置文档视图。可通过此返回码清除浏览器的表单域
206 Partial Content 部分内容。服务器成功处理了部分GET请求
状态码 英文名称 含义
300 Multiple Choices 多种选择。请求的资源可包括多个位置,相应可返回一个资源特征与地址的列表用于用户终端(例如:浏览器)选择
301 Moved Permanently 永久移动。请求的资源已被永久的移动到新URI,返回信息会包括新的URI,浏览器会自动定向到新URI。今后任何新的请求都应使用新的URI代替
302 Found 临时移动。与301类似。但资源只是临时被移动。客户端应继续使用原有URI
303 See Other 查看其它地址。与301类似。使用GET和POST请求查看
304 Not Modified 未修改。所请求的资源未修改,服务器返回此状态码时,不会返回任何资源。客户端通常会缓存访问过的资源,通过提供一个头信息指出客户端希望只返回在指定日期之后修改的资源
305 Use Proxy 使用代理。所请求的资源必须通过代理访问
306 Unused 已经被废弃的HTTP状态码
307 Temporary Redirect 临时重定向。与302类似。使用GET请求重定向
状态码 英文名称 含义
400 Bad Request 客户端请求的语法错误,服务器无法理解
401 Unauthorized 请求要求用户的身份认证
402 Payment Required 保留,将来使用
403 Forbidden 服务器理解请求客户端的请求,但是拒绝执行此请求
404 Not Found 服务器无法根据客户端的请求找到资源(网页)。通过此代码,网站设计人员可设置"您所请求的资源无法找到"的个性页面
405 Method Not Allowed 客户端请求中的方法被禁止
406 Not Acceptable 服务器无法根据客户端请求的内容特性完成请求
407 Proxy Authentication Required 请求要求代理的身份认证,与401类似,但请求者应当使用代理进行授权
408 Request Time-out 服务器等待客户端发送的请求时间过长,超时
409 Conflict 服务器完成客户端的 PUT 请求时可能返回此代码,服务器处理请求时发生了冲突
410 Gone 客户端请求的资源已经不存在。410不同于404,如果资源以前有现在被永久删除了可使用410代码,网站设计人员可通过301代码指定资源的新位置
411 Length Required 服务器无法处理客户端发送的不带Content-Length的请求信息
412 Precondition Failed 客户端请求信息的先决条件错误
413 Request Entity Too Large 由于请求的实体过大,服务器无法处理,因此拒绝请求。为防止客户端的连续请求,服务器可能会关闭连接。如果只是服务器暂时无法处理,则会包含一个Retry-After的响应信息
414 Request-URI Too Large 请求的URI过长(URI通常为网址),服务器无法处理
415 Unsupported Media Type 服务器无法处理请求附带的媒体格式
416 Requested range not satisfiable 客户端请求的范围无效
417 Expectation Failed 服务器无法满足Expect的请求头信息
状态码 英文名称 含义
500 Internal Server Error 服务器内部错误,无法完成请求
501 Not Implemented 服务器不支持请求的功能,无法完成请求
502 Bad Gateway 作为网关或者代理工作的服务器尝试执行请求时,从远程服务器接收到了一个无效的响应
503 Service Unavailable 由于超载或系统维护,服务器暂时的无法处理客户端的请求。延时的长度可包含在服务器的Retry-After头信息中
504 Gateway Time-out 充当网关或代理的服务器,未及时从远端服务器获取请求
505 HTTP Version not supported 服务器不支持请求的HTTP协议的版本,无法完成处理

END

猜你喜欢

转载自blog.csdn.net/tu464932199/article/details/125905069