http与tcp面试题1

1.简述 Http 请求 get 和 post 的区别以及数据包格式。

HTTP（HyperText Transport Protocol，超文本传送协议）

http请求数据包的格式：头部（request line + header）+ 数据（data）

头部和数据包体通过一个空行来隔开，头部的格式主要包括请求行+请求头部。如下图

HTTP请求头

请求行

请求行由请求方法字段、URL字段和HTTP协议版本字段3个字段组成，它们用空格分隔如：

GET /index.html HTTP/1.1。

HTTP协议的请求方法有GET、POST、HEAD、PUT、DELETE、OPTIONS、TRACE、CONNECT。这里介绍最常用的GET方法和POST方法。

GET方式：在URL里面就说明要请求的资源，URL里面包含参数，“?”后面就是参数，而“？”前面就是URL的结束。“?ip=192.168.156.11&active=on”这种就是GET方式的包，而服务器把客户端请求的内容在数据段里面发回给客户端。

POST方式：传输的数据不在URL里面出现，而是在数据段里面出现。但是请求头部多了Content-Type和Content-Length两个字段。

请求头部

请求头部由（关键字:<空格>值）对组成，每行一对，关键字和值用英文冒号“:<空格>”分隔。请求头部通知服务器有关于客户端请求的信息，典型的请求头有：

User-Agent：产生请求的浏览器类型。

Accept：客户端可识别的内容类型列表。

Host：请求的主机名，允许多个域名同处一个IP地址，即虚拟主机。

下面是GET包的一个例子：传输的数据在URL里

再看看POST包的例子：传输的数据在数据段里面

HTTP响应报文

HTTP响应也由两个个部分组成，分别是：响应头（状态行+消息报头）+响应正文。

状态行格式如下：

HTTP-Version Status-Code Reason-Phrase CRLF

HTTP-Version表示服务器HTTP协议的版本；Status-Code表示服务器发回的响应状态代码；Reason-Phrase表示状态代码的文本描述。状态代码由三位数字组成，第一个数字定义了响应的类别，且有五种可能取值。

1xx：指示信息–表示请求已接收，继续处理。

2xx：成功–表示请求已被成功接收、理解、接受。

3xx：重定向–要完成请求必须进行更进一步的操作。

4xx：客户端错误–请求有语法错误或请求无法实现。

5xx：服务器端错误–服务器未能实现合法的请求。

下面是http响应包的例子

Get和Post主要区别如下：

1、Get是用来从服务器上获得数据，而Post是用来向服务器上传递数据。
本质区别：get数据放在http请求报文的头部的请求行的url中/ post数据放在http请求报文的数据体中

2、Get将表单中数据的按照variable=value的形式，添加到action所指向的URL后面，并且两者使用“?”连接，而各个变量之间使用“&”连接；Post是将表单中的数据放在form的数据体中，按照变量和值相对应的方式，传递到action所指向URL。
3、Get是不安全的，因为在传输过程，数据被放在请求的URL中，而如今现有的很多服务器、代理服务器或者用户代理都会将请求URL记录到日志文件中，然后放在某个地方，这样就可能会有一些隐私的信息被第三方看到。另外，用户也可以在浏览器上直接看到提交的数据，一些系统内部消息将会一同显示在用户面前。Post的所有操作对用户来说都是不可见的。
4、Get传输的数据量小，这主要是因为受URL长度限制；而Post可以传输大量的数据，所以在上传文件只能使用Post。
5、Get限制Form表单的数据集的值必须为ASCII字符；而Post支持整个ISO10646字符集。

常见错误认识：

"GET方式提交的数据最多只能是1024字节"，因为GET是通过URL提交数据，那么GET可提交的数据量就跟URL的长度有直接关系了。而实际上，URL不存在参数上限的问题，HTTP协议规范没有对URL长度进行限制。这个限制是特定的浏览器及服务器对它的限制。IE对URL长度的限制是2083字节(2K+35)。对于其他浏览器，如Netscape、FireFox等，理论上没有长度限制，其限制取决于操作系统的支持。

　　注意这是限制是整个URL长度，而不仅仅是你的参数值数据长度。

理论上讲，POST是没有大小限制的，HTTP协议规范也没有进行大小限制，说“POST数据量存在80K/100K的大小限制”是不准确的，POST数据是没有限制的，起限制作用的是服务器的处理程序的处理能力。

若符合下列任一情况，则用POST方法：

请求的结果有持续性的副作用，例如，数据库内添加新的数据行。
若使用GET方法，则表单上收集的数据可能让URL过长。
要传送的数据不是采用7位的ASCII编码。

若符合下列任一情况，则用GET方法：

请求是为了查找资源，HTML表单数据仅用来帮助搜索。
请求结果无持续性的副作用。
收集的数据及HTML表单内的输入字段名称的总长不超过1024个字符。

2.说说你知道的几种 HTTP 响应码，比如 200, 302, 404。

在这个广域网中，我们所有人都一定会看到3个Logo：测试你网速的蓝色熊掌，令你绝望的加载圆圈，还有“裤子都脱了就给我看这个？”的404页面。前两个好歹还能让你看点东西，而最后一个则是最糟糕的用户体验——除了告诉你打不开网页就似乎真的什么也没有了，不知道各位有没有想过这个404是怎么产生的，除了404还有什么？今天我们就来谈一谈那些状态码。

404和HTTP状态码

上面所说的404其实是一种标准的HTTP返回代码，官方名称是HTTP状态码（HTTPStatusCode），用于表示网页服务器HTTP的响应状态。但似乎一般人都不会仔细研究这些HTTP状态码和这些状态码对开发人员的影响。也许，一个开发人员就算不知道这些状态码也能开发出一个网站，但如果企业要开发一个大型网站，在某些时候需要微调或系统整合需要到更底层的网络工作时，就有可能遇到瓶颈，特别是在出错时更加明显。对于状态码的分类有三个层级，就好像404那样用3三个数字表示，分为大类，中类和小类。值得一提的是，在IIS（Internet信息服务）中还有不少微软制定的扩充状态码，格式类似404.1这样，能更深层次的让开发者清楚出错原因。

在进行请求的时候，我们看到的都只是服务器最后返回来的状态码，比如出错的404和成功的200，但是实际上在请求的过程中，会有很多的状态码在快速变化，除非是类似打断点的操作，一步操作停一下，否则是不能看出这些状态码是怎么变化的，这就导致在服务器响应过程中有很多状态码我们都看不到。

审查元素可以看到各个请求最终的状态码

首先，我们要知道几乎所有的HTTP状态码都被分成了五大类：

1开头的表示服务器收到请求并需要请求这继续处理；

2开头的成功响应，表示成功处理了请求；

3开头的重定向，引导浏览器跳转到另一个资源页面；

4开头表示请求出错，妨碍了服务器的处理，服务器会返回一个状态码解释到底是什么错误；

5开头的表示服务器错误，并不是请求者的原因；

就拿404举个例子，作为最出名的状态码，我们想来详细解释下404这三个数字的含义：第一个4表示客户端出错，第二个0表示请求者把网址打错了，最后的4表示4开头的错误状态码中排第四。

那么404是怎么产生的呢？当用户在地址栏输入一个网址后，这时候IIS首先会检测用户输入的地址是否有对应的网页信息，如果没有，IIS就会通过服务器想用户返回404错误状态码提示，告诉用户找不到地址对应的网页信息，但服务器并不清楚这种情况是暂时性的还是永久性的。出现404最多的原因就是用户输入了错误的链接，或者无法响应并找不到原因，也有可能就是网页被删除了。

为什么要设计404页面

以4xx开头的错误都是跟“客户端”有关，比如用户可能访问了不存在的页面，用户权限不足或者未提供有效的验证信息（输入错误的账号密码等）。尽管404页面被用户浏览到的概率相对于全站的其他页面来说要小得多，但页面难免会出错，无论是用户的误操作还是服务器的原因，作为网站开发者也无法控制错误页面的出现，但开发者可以通过设计一个特别的404错误页面将用户失望度降到最低，开发者需要在这个页面很好的把信息传达给用户，并引导用户进行下一步的操作。

访问到错误页面是不愉快的用户体验，作为开发者可以提供一些应对方法

还有什么比较出名的状态码？

其实除了404NotFound外，还有很多HTTP状态码，这些状态码都有自己的含义，所以我们说说一些比较常见的状态码以及它们的表达信息。

400错误请求：400代表语义有误，服务器无法理解用户的请求，除非进行修改，不然没必要一边按F5一边喷服务器垃圾。比如说别把www.baidu.com.打成com.baidu.www.，否则服务器是不知道你在说什么鸟语。在减少这类错误的道路上，伟大的人类发明了搜索引擎，容错率随之提高。

401未授权：一般来说该错误消息表明你首先需要登录（输入有效的用户名和密码）。如果你不输入这些信息，就会有401错误，这意味着验证信息出错，服务器无法识别你的身份。

403禁止：有句话叫“拉不出屎千万别怪地球没引力”，因为出现403是因为服务器拒绝了你的地址请求，或者你根本没权限访问网站，提供身份验证也没用，也就是说，用户被禁止访问了。然而除非与Web服务器管理员联系，否则一旦遇到403状态码都无法自行解决。

408请求超时：遇到408意味着你的请求发送到该网站花的时间比该网站的服务器准备等待的时间要长，即链接超时。408错误往往难以解决，通常涉及系统工作量或系统操作中的一次性变化。如果用户持续看到408错误，管理员首先要考虑到Web服务器的工作量，特别是在产生408错误的时间段，另外网络流量激增也可能导致用户无法访问网页从而出现该错误。

梯子不够长，墙外的世界不是你想看就能看的

410永久删除：如果用户访问的网页被永久删除，服务器就会返回410代码。410实际上和404有点相似，在服务器不确定这个情况是不是永久的情况下，应该使用404状态码。410响应的目的主要是帮助网站管理员维护网站，通知用户这个网页资源已经不能再使用，并且服务器拥有者希望所有指向这个资源的远端链接也被删除。不过之后的事，就涉及到301和302返回码了。

301永久移动，302临时移动：在优化网站的时候，301重定向是网站管理员必用的，在网页被移动后多数情况下浏览器会自动定向到新的URI（统一资源标识符），并且以后任何新的请求都应使用新的URI来代替。而302只是URI被理解为临时交换而已，客户端还是会继续使用原来的地址发送请求。这两种现象出现在网页的域名更换后，搜索引擎还使用原有域名地址访问URI，如果搜索引擎得到301返回码，那么搜索引擎就知道管理员更换了域名，下次就会自动用新域名来索引网站。

305使用代理：访问者只能使用代理来访问网页，如果服务器放回这个状态码，意思是你需要一张梯子。想要登陆诸如Google，Youtube，Facebook这些不存在的网站，除了使用VPN别无办法。

509超过带宽限制：相比其他500状态码，509算是一个特殊的存在。之所以特殊，是因为这个错误要用钱来解决。509并不是官方的状态码，但是仍然被广泛使用。正如名字所示，网站流量增大，带宽不够用就会出现这类错误，网站管理员只能掏钱向主机商买流量。

除了上述所说的一部分HTTP状态码外，还有很多其他的状态码，比如100,200等，这些状态码都有自己的信息定义和作用，限于篇幅原因只能列举一些很常见的状态码。HTTP状态码通常都与用户的浏览体验息息相关，它能告诉客户端当前发生了什么事，或者说当前Web服务器的响应状态。作为开发者有必要了解这些状态码，能够明白问题出在哪，从而针对性地解决问题。

请求行

请求头部

HTTP响应报文

猜你喜欢