【面试必备】用最明白的话总结面试最常问的HTTP

本文旨在用“通俗”一点、又不失专业的话术，来说明白这些知识点。

文章目录

HTTP请求方法
URL和URI的区别
GET和POST有什么区别？
PUT和POST都可以给服务器新增资源，有什么区别？
PUT和PATCH都可以向服务器更新资源，有什么区别？
HTTP请求报文是什么样的？
HTTP响应报文是什么样的？
聊一聊HTTP首部有哪些？

RFC2616定义的47种首部字段

通用首部（General Header Fields）9个
请求首部（Request Header Fields）19个
响应首部（Response Header Fields）9个
实体首部（Entiy Header Fields）10个

非HTTP/1.1的首部字段

HTTP状态码
HTTP的keep-alive是干什么的？
HTTP和HTTPS的区别？
HTTP/1.0和HTTP/1.1有什么区别？
HTTP2相对于HTTP/1.X有什么优势？
HTTPS的加密通信是怎么样的？
HTTP缓存过程是怎样的？
强缓存和协商缓存？
常见的网络攻击方法和解决方案？

SQL注入
XSS（跨站脚本攻击）
CSRF（跨站请求伪造）

HTTP请求方法

HTTP/1.0

GET：向服务器请求，获取资源。eg：请求某个页面。
POST：传输实体主体，将数据发送给服务器。eg：把登录信息发送给服务器验证是否可以登录。
HEAD：请求资源头部信息，和GET的资源头部信息一致，只是不返回报文主体。eg：下载大文件之前，先获取其大小，再决定是否要下载，以此节省带宽资源。

HTTP/1.1

PUT：传输文件给服务器，然后保存到URI指定位置。eg：博客添加新文章。
DELETE：删除指定文件，与PUT相反。eg：博客删除已存在的文章。
OPTIONS：获取目标资源所支持的请求方法。eg：黑客常用OPTIONS请求来查看目标服务器支持的HTTP请求方法。
TRACE：原样返回客户端请求的内容。eg：测试代理服务器中转时，请求是否被篡改。
CONNECT：与代理服务器建立隧道来通信（网页开发用不到）。eg：翻墙时，为了通过国外服务器进行中转，首先需要客户端与国外服务器建立连接，这时使用CONNECT方法。
PATCH：局部更新资源，是对PUT方法对补充。eg：局部更新指定文章的标题。

URL和URI的区别

URI是统一资源标识符，只是一个字符串的格式标准，并没有指定它的用途。
URL是统一资源定位符，是资源定位的规范，包括网址、ftp服务器、文件路径等。

可以把URI理解成URL更高层次的抽象，其实URI本来是由URL和URN（统一资源名称）组成的，但URN没流行起来，导致现在的URI基本都是URL。

GET和POST有什么区别？

数据传输方式不同：get在URL中，post在请求体中
安全性不同：get在URL中，很容易通过历史记录、缓存查到数据信息
数据类型不同：get只允许ASCII字符，post无限制
特性：get安全幂等。post非安全非幂等。这里的安全是指不会引起服务器状态变化。

幂等(idempotence)：多次请求结果和一次请求结果相同。

“Methods can also have the property of “idempotence” in that (aside from error or expiration issues) the side-effects of N > 0 identical requests is the same as for a single request.”

PUT和POST都可以给服务器新增资源，有什么区别？

PUT：幂等，URI指向单一资源。
POST：非幂等，URI指向资源集合。

eg：比如博客系统，创建新文章，用POST https://www.blog.com/articles,多次调用，就创建多个文章。如果更新指定文章的标题，用PUT https://www.blog.com/articles/000001,多次调用，和第一次调用效果相同。

PUT和PATCH都可以向服务器更新资源，有什么区别？

PATCH是对PUT的补充。PUT是更新整条记录，对重复字段也进行覆盖。PATCH对资源进行“局部更新”。

HTTP请求报文是什么样的？

请求报文4部分组成：

请求行
请求头部
空行
请求体

请求报文的组成

《图解HTTP》——请求报文

上图来自《图解HTTP》，GET方法无请求体，如果是POST方法，可能会有形如name=admin&password=admin的请求体。

HTTP响应报文是什么样的？

请求报文有4部分组成:

响应行
响应头
空行
响应体

响应报文组成

《HTTP图解》响应报文

聊一聊HTTP首部有哪些？

RFC2616定义的47种首部字段

通用首部（General Header Fields）9个

首部字段名	说明
Cache-Control✨	控制缓存
Connection✨	控制代理不再转发的首部字段、管理持久链接
Transfor-Encoding✨	指定报文主体的传输编码方式
Date	创建报文的日期
Via	代理服务器相关信息
Warning	错误通知
Upgrade	升级为其他协议
Trailer	记录了报文主体之后的首部字段
Pragma	报文指令，HTTP/1.1之前的历史遗留字段

请求首部（Request Header Fields）19个

首部字段名	说明
Accept	客户端或代理能够处理的媒体类型✨
Accept-Encoding	优先的内容编码（gzip、deflate……）
Accept-Language	优先的语言（中文、英文……）
Accept-Charset	优先的字符集（ISO-8859-1……）
If-Match✨	比较实体标记(ETage),匹配一致则同意请求
If-None-Match✨	比较实体标记，匹配不一致则同意请求
If-Modified-Since✨	比较资源更新时间，如果当前在指定日期之后，则接受请求
If-Unmodified-Since✨	比较资源更新时间，与If-Modified-Since相反
Range✨	获取部分资源的范围。eg：bytes=5001-10000
If-Range	资源未更新时发送实体byte的范围请求
Authorization✨	Web的认证信息
Proxy-Authorization	代理服务器要求Web认证信息
Host✨	请求资源所在的服务器
From	用户的邮箱地址
User-Agent	客户端程序信息
Max-Forwrads	最大逐跳次数
TE	传输编码的优先级
Referer	请求中URI的原始获取方
Expect	期待服务器的特定行为

响应首部（Response Header Fields）9个

首部字段名	说明
Accept-Range	是否接受字节范围请求
Age	推算资源创建经过的时间
ETag✨	实体标记，资源的匹配信息
Location✨	令客户端重定向到指定URI
Proxy-Authenticate	代理服务器对客户端的认证信息
Retry-After	下次请求服务器的时间，与503一起使用
Server✨	HTTP服务器的安装信息
Vary	代理服务器的缓存信息
WWW-Authenticate	服务器对客户端的认证信息

实体首部（Entiy Header Fields）10个

实体首部字段是包含在请求报文和响应报文中实体部分所用的首部，用于补充内容的更新时间等与实体相关的信息
。

首部字段名	说明
Allow✨	资源可支持的HTTP方法
Expires✨	实体主体过期的日期时间
Last-Modified✨	资源最后的修改日期时间
Content-Encoding	实体主体使用的编码方式
Content-Language	实体主体的自然语言
Content-Length	实体主体的大小（单位：字节）
Content-Location	代替对应资源的URI
Content-MD5	实体主体的报文摘要
Content-Range	实体主体的位置范围
Content-Type	实体主体的媒体类型

非HTTP/1.1的首部字段

Cookie、Set-Cookie为cookie服务，Content-Disposition来指示如何显示附加的文件……

HTTP状态码

状态码	说明
200 Ok✨	客户端请求在服务器被正确处理
201 Created	请求已经实现，并且有新资源已经依据请求的需要被建立
202 Accepted	请求已接受，但还没执行，不保证完成请求
204 Not Content	请求成功，但相应报文不包含实体的主体部分
206 Partial Content✨	进行范围请求
301 Moved Permanently	永久重定向，资源被分配了新的URL
302 Found✨	临时重定向，资源被临时分配了新的URL
303 See Other	资源存在着另一个URL，应使用GET获取资源
304 Not Modified✨	服务器允许访问资源，但请求未满足条件
307 Temporary Redirect	临时重定向，和302含义相同
400 Bad Request✨	请求报文存在语法错误
401 Unauthorized✨	请求需要通过有HTTP认证信息
403 Forbidden✨	请求资源访问被服务器拒绝
404 Not Found✨	资源未找到
408 Request Timeout	客户端请求超时
409 Confict	请求资源可能引起冲突
500 Internal Sever Error✨	服务器在执行请求时发生了错误
503 Service Unavailable	服务器正超负载或停机维护

HTTP的keep-alive是干什么的？

早期HTTP/1.0每次请求都要重新建立一次连接，为了减少资源消耗、缩短响应时间，就要重用连接，想要保持长连接，需要在请求头上加上Connection:keep-alive。

HTTP和HTTPS的区别？

https是安全版的http，http协议都是明文传输，https的加密传输可以最大程度保证通信安全。

HTTP/1.0和HTTP/1.1有什么区别？

HTTP/1.0有GET、POST、HEAD三个请求方法，HTTP/1.1新增了PUT、DELETE、PATCH、OPTIONS、TRACE、CONNECT
请求方法，并且支持了持久连接。

HTTP2相对于HTTP/1.X有什么优势？

多路复用，合并TCP请求✨
头部压缩，只发送差异数据，减少头部信息量
二进制分帧解析更高效
服务器主动推送

HTTPS的加密通信是怎么样的？

HTTPS使用了两种加密，对称加密和非对称加密。

对称加密：通讯双方使用同一密钥。性能好，但不安全。
非对称加密：通讯双方各有一个私钥，共享一个公钥。安全，但性能差。

解决方案（混合加密）：
将对称加密的密钥通过非对称加密的公钥进行加密，并发送出去,通信双方在通过各自的私钥进行解密获得对称加密的密钥，然后双方就可以使用对称加密来沟通。

混合加密+数字证书保证安全性：

服务器把自己的公钥登录到AC（数字证书认证机构）。
AC用自己的私钥部署数字签名并颁发公钥证书。

公钥证书=服务器的公开密钥+AC的数字签名。

客户端拿到服务器的公钥证书后，用AC公钥进行验证真实性。

AC的公钥，已经事先写进浏览器了。

客户端使用服务器公钥加密报文。
服务器使用自己的私钥进行解密。

HTTP缓存过程是怎样的？

客户端向服务器请求资源
服务器缓存资源，并通过响应头决定缓存策略
客户端根据响应头的缓存策略决定是否缓存（这里假设是），并将响应头与资源缓存下来
当客户端再次请求命中资源的时候，检查缓存策略，根据策略不同、过期时间等判断直接读取本地缓存还是服务器协商缓存。

缓存过程

强缓存和协商缓存？

强缓存(Cache-Control)：只有首次请求和服务器通信，读取缓存不用发送请求。返回200

协商缓存(ETag/If-None-Match)：总会与服务器交互，第一次是拿数据和ETag，之后凭ETag询问是否更新。返回304

常见的网络攻击方法和解决方案？

SQL注入

攻击手段：

某些服务器处理用户账号，是直接将账号字符串拼接到SQL语句中，如果黑客利用规则拼接类似1=1的判断语句，数据库中可能会产生异常行为。

解决方案：

在Java中使用prepareStatement类预编译SQL语句，把固定格式的SQL编译后放入数据库缓冲池中，之后传入的字符串都当作参数来处理，而不是SQL指令。

XSS（跨站脚本攻击）

攻击手段：

攻击者往Web页面插入恶意<script>代码，当用户浏览页面时，嵌入其中的script恶意代码就会执行。

解决方案：

过滤<script>、<img>、<a>标签
对<、>在输入的时候进行编码转换
限制字符串长度
如果使用React的JSX语法，渲染输入内容之前会进行转义

CSRF（跨站请求伪造）

攻击手段：

用户登录受信任的A网站，产生Cookie，在没有登出A的情况下，访问了危险的B网站，B要求访问第三方站点（A），并发送一个请求（request），然后B就带着之前的Cookie（伪装成用户的名义）去请求。

解决方案：

验证码