使用http的chunked模式下载文件网络详解

基础知识:
TCP的三次握手。
TCP的ACK机制。
IP协议的MTU。
HTTP协议。
LF的ASCII编码为10(10进制),0A(16进制)。
CR的ASCII编码为13(10进制),0D(16进制)。
数字0的ASCII编码为48(10进制),30(16进制)。

使用http的chunked模式下载文件。

这里使用抓包工具监控一个小文件下载的全过程。


网络包概览:



2104

client -> server (http)
MTU=1500,以太网一般都是1500。
减掉IP header和TCP header。1500-20-20=1460Bytes, 这个地方payloadlen=1460。


2105

Clinet -> Server (TCP)

由于一个TCP的payload没有发完所有的http请求,tcp协议再发一次,104Bytes。
注意这里的Push标识。
对于发送端,使tcp cache中的数据都发送出去。对于服务端,提交cache的数据到高一层的协议处理。这里,就是服务端的http协议层处理。


2109

Server -> Client (TCP)
服务端给了一个ACK。


2110

Server -> Client (TCP)
服务端又给了一个ACK。这个ACK和前一个比增大了3911564407 - 3911564303 =104


2195


Server -> client (Http)
这里2809就是下载文件的大小。
Chunked模式下载。第1个chunk的第1块数据。


一个简单的理解,可以认为chunk的模式为。
[Chunk大小]
[CR LF]
[Chunk数据体]
[CR LF]

[Chunk大小]
[CR LF]
[Chunk数据体]
[CR LF]

....

[0]  //最后一个块。
[CR LF]

这次传输了1058bytes数据。(这个值是看不到的,可以通过抓包结果计算。找到 [Chunk大小] [CR LF] ,之后的字节就是实际的数据。



2196

Server -> client (Tcp)
Chunked模式下载。第1个chunk的第2块数据。
这次传输了1460bytes数据。



2197

Client -> server (Tcp)
一个Ack。

2198

Server -> client (Tcp)
Chunked模式下载。第1个chunk的第3块数据。
2809-1058-1460=291
291+2(CR LF所占用的2个bytes)=293(该payload的大小)


2199






30是数字0.
这里实际上是:
[Chunk大小] 0
[CR LF] 0D 0A

这是实际上是第2个chunk,同时也是end chunk。标示chunk模式结束。

Server -> client (http)
Chunked模式下载完成。


2200


client->server (TCP)
ACK

下载完成



猜你喜欢

转载自zhang-xzhi-xjtu.iteye.com/blog/1757351