论文Optimizing the Throughput of Data-Driven Peer-to-Peer Streaming读书笔记

论文链接

http://ieeexplore.ieee.org/document/4509427

看这篇论文想解决的问题

P2P时，确定某个block由哪个结点下载。
block：会把视频文件分成一个个小片传输，这个小片就是block
结点：用户。当大家同时观看同一视频时，可以分享视频数据，这时大家互为结点
P2P： peer to peer，大家看同一视频时，会互相分享视频数据文件，加快下载速度。不会碰你电脑上的其他文件，更不会泄漏隐私声明的，只是分享、也只能分享当前你在看的这个视频的数据！

为什么要解决哪个block由哪个结点下载的问题

大家播放进度不同，需要优先下离播放点近的视频数据
大家缓存了的视频时长不同
大家的网络状况存在差异
存在某个结点已经缓存了很多数据了，但还是一直向网络状况好的结点请求数据的情况。这里这个结点其实可以向网络状况差的结点请求数据，让网络状况好的结点给其他缓存数据少的结点提供数据
期望最大化数据分享率，节省运营商带宽成本

笔记

论文提出，在知道全局位图信息、带宽上限的情况下，可以把问题转化为 min-cost flow problem，存在最优解。
但实际情况下，对于一个结点而言，无法知道全局信息。只知道自己相连结点的位图信息、带宽信息，这时用贪婪或LRF都不是最优解。
LRF： Local rarest first, 稀缺优先。优先下最稀缺的block，即在所有相连结点中，对拥有某个block的结点进行计数，数量最小的block优先下，思想是尽量让稀缺的数据更快扩散开来。
不能知道全局最优，论文提出了HEURISTIC DISTRIBUTED ALGORITHM，这里之后就看不太懂了，之后都是猜测。
这里提出是，确定了两个结点间最优传输数据量，再用LRF（本来除了稀缺，还要考虑离播放点近不近这个因素，但似乎用实验数据证明了只需要考虑稀缺），就可以接近全局最优。而确定两个结点间最优传输数据量这个问题，取最近若干次速度平均值的若干倍。

疑惑

为什么能取之前的速度作为最优传输数据量呢？论文是这样说的
This is because the data-driven protocol has the inherent ability to allocate the traffic to each neighbor and make full utilize of all bandwidths from every neighbor.
data-driven 协议有能力分配出最大化利用带宽的方案。
什么是data-driven协议？似乎就是BT协议……
如果一开始结点A给B提供数据，这是C进来了，A要给C数据，那C怎么能从B那里抢到带宽呢？
论文似乎没有解答以上问题，只是说data-driven协议能解决以上问题（但真的可以吗？怎么做到的呢？），然后算出每次请求时，某个结点要从相连结点请求多少的数据量，在这个数据量限制下（不是小于，也不是大于，是等于这个数据量），再做LRF，就能接近全局最优。

结论

如果无法解答，为什么data-driven协议能做到最大化带宽？或者如何做到，那看这篇论文就没有参考价值了。这是第一次为了工程而去读论文，但似乎不太顺利……

论文Optimizing the Throughput of Data-Driven Peer-to-Peer Streaming读书笔记

论文Optimizing the Throughput of Data-Driven Peer-to-Peer Streaming读书笔记

论文链接

看这篇论文想解决的问题

为什么要解决哪个block由哪个结点下载的问题

笔记

疑惑

结论

猜你喜欢