9.17论文阅读笔记

一、Present or future: Optimal pricing for spot instances

1、问题挑战：

如何给竞价型实例定价，当前定价过高，可获得当前较高收益，但会导致将来实例价格过低，从而使将来的收益过低。目标是在保证用户服务质量的前提下，合理定价获取整体较高收益。

2、两个模型：

1、In the basic model, assuming that all requests cannot be dropped.

2、Extending the basic model to achieve worst-case delay guarantees.

基本思想：用公式（13）来表示收入和服务质量的一个平衡公式，总体目标是使这个公式尽可能得小，达到收入较高和服务质量较好的综合目的，参数V是一个非负的平衡因子，V越大，收入所占的比重越大，也就越接近于最优解决办法（仅考虑收入方面最优）。公式（14）推导过程已经明了，就是找到一个公式（13）的上界，至于这个上界结果（仅是一个公式）代表了什么还没明白。公式（15）是指在做每一个时间点的决定时要穷举各种可能，选择一种最佳解决方案，即使公式（15）达到最大。

C部分假设了一种简单情况，并以这个情况为例分析各个算法的表现，在这个简单例子上实现了离线最优算法，文中算法在一定程度上接近于离线最优算法。

实验数据用的谷歌集群数据，根据波动情况分为四组(Assuming that the requests with higher latency-sensitive value have higher maximum price.)，假设每组中最大价格一致。实验中有两个基准算法：Match All（baseline）、Single Slot. 再加上文中提到的基本模型算法和扩展模型算法，共有四种算法。Single Slot 在某些情况下表现不错（图7表5），收益居中，延迟居中。但价格波动较大时，Single Slot虽然可以取得最好的收益，但是其延迟也是巨大的。

二、Optimizing resource allocation while handling SLA violations in cloud computing platforms

如何将一堆虚拟机分配在一堆物理机上面？虚拟机有相应需求，物理机提供相应能力。目标是使物理机的利用率达到更高。当物理机的能力不足以支持虚拟机的需求时，会发生SLA violations。此时需要将一些虚拟机的需求从一台物理机上面转移到另外一台物理机上。文章通过装箱问题提出了一个算法，目标是在资源利用率和SLA violations之间做一个权衡。

模型：每一个虚拟机作为一个一定大小（0到1之间）的物品，每一台物理机作为一个大小为1的箱子。将物品按照大小分为四类（B、L、S、T）。可以证明文章提出的装箱算法竞争比为3/2，能够使物理机的资源利用率达到66%，而且发生SLA violations时，只需要额外的3个箱子来修正，并且最多移动6次。迁移影响的讨论没仔细看完。

文章中竞争比的证明是分情况讨论得出，感觉文章巧妙地进行了抽象，将虚拟机需求分配问题简化为装箱子问题，然后自定义物件分类标准，在此基础上再提出装箱子的算法。

三、Above the Clouds: A Berkeley View of Cloud Computing（科普）

文章介绍了关于云计算的一些基本问题，包括：什么是云计算？云计算为和在现在兴起？（移动交互式应用程序、并行批处理工作、分析工作的兴起、计算密极型桌面应用程序的扩展）、Utility Computing分类（Google AppEngine、Amazon EC2、Microsoft’s Azure的区分比较）、云计算经济学以及关于云计算十个障碍及对应的机遇。

四、SLA-based virtual machine management for heterogeneous workloads in a cloud datacenter

文章介绍了在保证服务质量的前提下如何使资源有效配置，而且要考虑不同SLA类型。主要针对两种应用程序：非交互型和交互型（web应用）。

transactional workload：惩罚措施包括：Fixed penalty（与时间长短无关）、Delay-dependent penalty（时间长度*单位时间惩罚额度）、Proportional penalty（不仅和时间有关，还和提供能力差别大小有关）

非交互型批处理作业：惩罚只和时间有关。

调度算法和准入控制算法还没看完。

五、Moving Big Data to The Cloud: An Online Cost-Minimizing Approach

如何将大量数据上传至云中。传统硬件驱动传输方式效率低且不稳定，通过对MapReduce框架的学习，文章提出了两种在线算法：OLM、RFHC。

六、Online algorithms for uploading deferrable big data to the cloud

1、问题挑战：

用户和云平台之间的数据传输过程中，除了计算成本控制（云平台中心的费用计算），通信成本控制（带宽费用）也是一个很大的挑战，本文就带宽费用（传输费用）最小化问题做出了研究。已存在的研究都是假设用户生成的数据必须立即上传到云端，没有任何延迟，这种解决办法只能限制在流量比较平滑这种情况。基于延迟传输的传输费用最小化在线算法还没有出现（有一个例外），难度较大。

一个例外：Simple Smoothing，一个基于单个连接（点对点）的简单最小化费用在线算法。局限：忽视了截至目前记录的最大容量以及当前积压的数据量和截止日期？

提出第一个算法：The Heuristic Smoothing Algorithm。基于单个连接，采用MAX模型，克服了Simple Smoothing的局限。

第二个算法：分布式随机在线算法。以启发式平滑作为插件模块，将单个连接扩展为多ISP，使用MapReduce框架。

猜你喜欢