Http全称是传输控制协议,是用来做数据传输的某种协议!互联网的网络传输分为应用层,传输层,网络层,链路层,物理层五大层次。而HTTP则是运输层里面的协议。常见的协议有两种,一种是Http传输控制协议,一种UDP用户数据报协议。HTTP属于TCP协议,无状态 , 面向连接,支持三次握手四次挥手!
一般来说,TCP能够保证数据的顺序和准确性,因为是基于连接通道传输,数据相对比较安全,但速度慢。而UDP则比较多数据,对网络源要求高,多用来传输数据文件,对网络资源要求比较高,容易丢包,稳定性低点,速度快!
以上为TCP三次握手的步骤:
当客户端与服务器启动后,服务器是处理被动等待(监听端口)的过程中,等待客户端的发起,这个过程如下:
1.客机将携带步骤码syn的数据包发送给主机,主机收到syn标志,知道了客机的请求!
2.主机收到客机请求后确认信息,将syn+ack标志的数据包发送给客机让客机确认!
3.客机收到主机发回来的请求确认信息的syn+ack后,确认成功,建立连接
===========================================================================
Http请求的结构
|----请求方式,协议,版本号: POST http://localhost:8080/xxx/index.jsp HTTP/1.1
|----请求报文头(Request Header):用户代理信息(一般为浏览器),请求的数据格式,数据编码,数据长度,虚拟机地址,连接的时长等信息;
可以供参考的样式如下:
User-Agent: DGroupPatient/1.052701.230/Dalvik/2.1.0 (Linux; U; Android 5.1.1; KIW-AL10 Build/HONORKIW-AL10) //用户发送请求的客户端环境 Content-Type: application/x-www-form-urlencoded; charset=UTF-8 //表单默认的提交数据的格式Host: xg.mediportal.com.cn //请求资源的Intenet主机和端口号 Connection: Keep-Alive //持久连接 Accept-Encoding: gzip //浏览器能够进行解码的数据编码方式 Content-Length: 33 //请求正文的长度 |
Content-Type |
是返回消息中非常重要的内容,表示后面的文档属于什么MIME类型。Content-Type: [type]/[subtype]; parameter。例如最常见的就是text/html,它的意思是说返回的内容是文本类型,这个文本又是HTML格式的。原则上浏览器会根据Content-Type来决定如何显示返回的消息体内容 |
Host |
指定请求资源的Intenet主机和端口号,必须表示请求url的原始服务器或网关的位置。HTTP/1.1请求必须包含主机头域,否则系统会以400状态码返回 |
Accept |
浏览器可接受的MIME类型 |
Accept-Charset |
浏览器可接受的字符集 |
Accept-Encoding |
浏览器能够进行解码的数据编码方式,比如gzip。Servlet能够向支持gzip的浏览器返回经gzip编码的HTML页面。许多情形下这可以减少5到10倍的下载时间 |
Accept-Language |
浏览器所希望的语言种类,当服务器能够提供一种以上的语言版本时要用到 |
Authorization |
授权信息,通常出现在对服务器发送的WWW-Authenticate头的应答中 |
Connection |
表示是否需要持久连接。如果Servlet看到这里的值为“Keep- Alive”,或者看到请求使用的是HTTP1.1(HTTP 1.1默认进行持久连接),它就可以利用持久连接的优点,当页面包含多个元素时(例如Applet,图片),显著地减少下载所需要的时间。要实现这一点,Servlet需要在应答中发送一个Content-Length头,最简单的实现方法是:先把内容写入 ByteArrayOutputStream,然后在正式写出内容之前计算它的大小 |
Content-Length |
表示请求消息正文的长度 |
Cookie |
这是最重要的请求头信息之一 |
From |
请求发送者的email地址,由一些特殊的Web客户程序使用,浏览器不会用到它 |
Host |
初始URL中的主机和端口 |
If-Modified-Since |
只有当所请求的内容在指定的日期之后又经过修改才返回它,否则返回304“Not Modified”应答 |
Pragma |
指定“no-cache”值表示服务器必须返回一个刷新后的文档,即使它是代理服务器而且已经有了页面的本地拷贝 |
Referer |
包含一个URL,用户从该URL代表的页面出发访问当前请求的页面 |
User-Agent |
浏览器类型,如果Servlet返回的内容与浏览器类型有关则该值非常有用 |
UA-Pixels,UA-Color,UA-OS,UA-CPU |
由某些版本的IE浏览器所发送的非标准的请求头,表示屏幕大小、颜色深度、操作系统和CPU类型 |
MIN类型如下:
text/html : HTML格式
text/plain :纯文本格式
text/xml : XML格式
image/gif :gif图片格式
image/jpeg :jpg图片格式
image/png:png图片格式
以application开头的媒体格式类型:
application/xhtml+xml :XHTML格式
application/xml : XML数据格式
application/atom+xml :Atom XML聚合格式
application/pdf :pdf格式
application/msword : Word文档格式
application/octet-stream : 二进制流数据(如常见的文件下载)
application/x-www-form-urlencoded : <form encType=””>中默认的encType,form表单数据被编码为key/value格式发送到服务器(表单默认的提交数据的格式)
另外一种常见的媒体格式是上传文件之时使用的:
multipart/form-data : 需要在表单中进行文件上传时,就需要使用该格式:
|
|----请求正文:请求头和请求正文之间是一个空行,这个行非常重要,它表示请求头已经结束,接下来的是请求正文。请求正文中可以包含客户提交的查询字符串信息:
以上通常将请求方式+请求报文头统称为报文头,将正文部分统称为报文体!
==========================================================================================
相应报文请求机构
|---状态行:协议类型,版本号,状态码
|----响应头(Respnse Header):用户代理信息(一般为浏览器),请求的数据格式,数据编码,数据长度,虚拟机地址,连接的时长等信息;
|----响应正文:
可以供参考的样式如下:
常用状态码:
第一个数字有五种可能的取值: - 1xx: 指示信息—表示请求已接收,继续处理。 - 2xx: 成功—表示请求已经被成功接收、理解、接受。 - 3xx: 重定向—要完成请求必须进行更进一步的操作。 - 4xx: 客户端错误—请求有语法错误或请求无法实现。 - 5xx: 服务器端错误—服务器未能实现合法的请求。 状态代码 状态描述 说明 200 OK 客户端请求成功 400 Bad Request 由于客户端请求有语法错误,不能被服务器所理解。 401 Unauthonzed 请求未经授权。这个状态代码必须和WWW-Authenticate报头域一起使用 403 Forbidden 服务器收到请求,但是拒绝提供服务。服务器通常会在响应正文中给出不提供服务的原因 404 Not Found 请求的资源不存在,例如,输入了错误的URL。 500 Internal Server Error 服务器发生不可预期的错误,导致无法完成客户端的请求。 503 Service Unavailable 服务器当前不能够处理客户端的请求,在一段时间之后,服务器可能会恢复正常 |
状态码描述为常用的几种类型(重点),而状态类型描述则属于该指定的规则
常用响应头:
Location: Location响应报头域用于重定向接受者到一个新的位置。例如:客户端所请求的页面已不存在原先的位置,为了让客户端重定向到这个页面新的位置,服务 器端可以发回Location响应报头后使用重定向语句,让客户端去访问新的域名所对应的服务器上的资源。当我们在JSP中使用重定向语句的时候,服务器 端向客户端发回的响应报头中,就会有Location响应报头域。 Server: Server响应报头域包含了服务器用来处理请求的软件信息。它和User-Agent请求报头域是相对应的,前者发送服务器端软件的信息,后者发送客户 端软件(浏览器)和操作系统的信息。下面是Server响应报头域的一个例子:Server: Apache-Coyote/1.1 WWW-Authenticate: WWW-Authenticate响应报头域必须被包含在401(未授权的)响应消息中,这个报头域和前面讲到的Authorization请求报头域是 相关的,当客户端收到401响应消息,就要决定是否请求服务器对其进行验证。如果要求服务器对其进行验证,就可以发送一个包含了 Authorization报头域的请求,下面是WWW-Authenticate响应报头域的一个例子:WWW-Authenticate: Basic realm="Basic Auth Test!" 从这个响应报头域,可以知道服务器端对我们所请求的资源采用的是基本验证机制。 Content-Encoding: Content-Encoding实体报头域被使用作媒体类型的修饰符,它的值指示了已经被应用到实体正文的附加内容编码,因而要获得Content- Type报头域中所引用的媒体类型,必须采用相应的解码机制。Content-Encoding主要用语记录文档的压缩方法,下面是它的一个例子: Content-Encoding: gzip。如果一个实体正文采用了编码方式存储,在使用之前就必须进行解码。 Content-Language: Content-Language实体报头域描述了资源所用的自然语言。Content-Language允许用户遵照自身的首选语言来识别和区分实体。 如果这个实体内容仅仅打算提供给丹麦的阅读者,那么可以按照如下的方式设置这个实体报头域:Content-Language: da。 如果没有指定Content-Language报头域,那么实体内容将提供给所以语言的阅读者。 Content-Length: Content-Length实体报头域用于指明正文的长度,以字节方式存储的十进制数字来表示,也就是一个数字字符占一个字节,用其对应的ASCII码存储传输。 要注意的是:这个长度仅仅是表示实体正文的长度,没有包括实体报头的长度。 Content-Type : Content-Type实体报头域用语指明发送给接收者的实体正文的媒体类型。例如: Content-Type: text/html;charset=ISO-8859-1 Content-Type: text/html;charset=GB2312 Last-Modified : Last-Modified实体报头域用于指示资源最后的修改日期及时间。 Expires : Expires实体报头域给出响应过期的日期和时间。通常,代理服务器或浏览器会缓存一些页面。当用户再次访问这些页面时,直接从缓存中加载并显示给用 户,这样缩短了响应的时间,减少服务器的负载。为了让代理服务器或浏览器在一段时间后更新页面,我们可以使用Expires实体报头域指定页面过期的时 间。当用户又一次访问页面时,如果Expires报头域给出的日期和时间比Date普通报头域给出的日期和时间要早(或相同),那么代理服务器或浏览器就 不会再使用缓存的页面而是从服务器上请求更新的页面。不过要注意,即使页面过期了,也并不意味着服务器上的原始资源在此时间之前或之后发生了改变。 Expires实体报头域使用的日期和时间必须是RFC 1123中的日期格式,例如: Expires: Thu, 15 Sep 2005 16:00:00 GMT HTTP1.1的客户端和缓存必须将其他非法的日期格式(也包括0)看作已过期。例如,为了让浏览器不要缓存页面,我们也可以利用Expires实体报头 域,设置它的值为0,如下(JSP):response.setDateHeader("Expires",0); |
响应正文:
根据客户端的请求返回对应内容或者json格式
注意:http只是一种协议,不限制数据的类型和格式,理论上只要文件可以被处理,那么只要在context-type指定好类型,则可以传递,http不会管用户传递的是什么类型的数据;