http协议中编码问题

http协议报文有两种:请求报文和响应报文,这两种报文结构是差不多的,都由三个部分组成,依次是:

1)start line 开始行(在请求报文中叫请求行,响应报文中叫状态行)如:GET /index.jsp HTTP/ (CRLF)

2)header 报头 如:Accept:xxx Host:xxx User-Agent等

3)body 消息正文

其中1)和2)部分必须是ASCII码字符

3)中可以是任何编码,可以是字符编码,也可以是图像编码等等,到底是什么,通过2)中的Content-Type来说明

而在ASCII码字符中有部分保留字符不能出现在直接出现在1)和2)的部分地区。如:保留字符“=”,在get方法中地址有可能包含参数如key=value,“=”就不能直接出现在key和value中,key要是‘=man’,那么就应该编码成%3dman,其中3d是“=”的ASCii码的十六进制表示。原则上这种百分比编码只用于保留的ascII码,现在人们也扩展了这种方法,利用这种方法编码复杂字符,如GB2312和utf-8等,如把GB2312的“好人”编码为%BA%C3%C8%CB,又比如常见的%20则是空格符的编码后的样子

猜你喜欢

转载自xiaoxiaoher.iteye.com/blog/2357295
今日推荐