贪心算法epsilon-greedy

1、贪心的定义

贪心算法是什么意思？举个例子就很清楚了：现在你有一个能装4斤苹果的袋子，苹果有两种，一种3斤一个，一种2斤一个，怎么装才能得到最多苹果？当然我们人考虑的话当然是拿两个2斤的苹果，就刚好装满了，但是如果按贪心算法拿的话，首先就要把最重的苹果拿下（是不是很符合贪心两个字？），但并没有得到最多苹果。

贪心算法在对问题求解时，总是做出在当前看来是最好的选择。也就是说，不从整体最优上加以考虑，他所做出的是在某种意义上的局部最优解。

2、贪心的思想

建立数学模型来描述问题；
把求解的问题分成若干个子问题；
.对每一子问题求解，得到子问题的局部最优解；
把子问题的解局部最优解合成原来解问题的一个解。

3、贪心的要素

（1）贪心选择

什么叫贪心选择？从字义上就是贪心也就是目光短线。贪图眼前利益。在算法中就是仅仅依据当前已有的信息就做出选择，并且以后都不会改变这次选择。（这是和动态规划法的主要差别）。

所以对于一个详细问题。要确定它是否具有贪心选择性质，必须证明每做一步贪心选择是否终于导致问题的总体最优解。
　　
（2）最优子结构

当一个问题的最优解包括其子问题的最优解时，称此问题具有最优子结构性质。

这个性质和动态规划法的一样，最优子结构性质是可用动态规划算法或贪心算法求解的关键特征。

4、贪心算法的典型应用

背包问题（物体可切分时的0-1背包问题），Huffman编码，单源最短路径，Prim算法，Kruskal算法等都是贪心算法的经典应用。
案例
这边的案例来自"算法图解"一书

案例一
区间调度问题:

假设有如下课程，希望尽可能多的将课程安排在一间教室里：

课程开始时间结束时间
美术 9AM 10AM
英语 9:30AM 10:30AM
数学 10AM 11AM
计算机 10:30AM 11:30AM
音乐 11AM 12PM
这个问题看似要思考很多，实际上算法很简单:

1.选择结束最早的课，便是要在这教室上课的第一节课 2.接下来，选择第一堂课结束后才开始的课，并且结束最早的课，这将是第二节在教室上的课。

重复这样做就能找出答案，这边的选择策略便是结束最早且和上一节课不冲突的课进行排序，因为每次都选择结束最早的，所以留给后面的时间也就越多，自然就能排下越多的课了。

每一节课的选择都是策略内的局部最优解(留给后面的时间最多)，所以最终的结果也是近似最优解(这个案例上就是最优解)。 (该案例的代码实现，就是一个简单的时间遍历比较过程)

案例二
背包问题：有一个背包，容量为35磅，现有如下物品

物品重量价格
吉他 15 1500
音响 30 3000
笔记本电脑 20 2000
显示器 29 2999
笔 1 200
要求达到的目标为装入的背包的总价值最大，并且重量不超出。

方便计算所以只有3个物品，实际情况可能是成千上万。

同上使用贪婪算法，因为要总价值最大，所以每次每次都装入最贵的,然后在装入下一个最贵的，选择结果如下：

选择: 音响 + 笔，总价值 3000 + 200 = 3200

并不是最优解: 吉他 + 笔记本电脑, 总价值 1500 + 2000 = 3500

当然选择策略有时候并不是很固定，可能是如下：

(1)每次挑选价值最大的,并且最终重量不超出：

选择: 音响 + 笔，总价值 3000 + 200 = 3200

(2)每次挑选重量最大的,并且最终重量不超出(可能如果要求装入最大的重量才会优先考虑)：

选择: 音响 + 笔，总价值 3000 + 200 = 3200

(3)每次挑选单位价值最大的(价格/重量),并且最终重量不超出：

选择: 笔+ 显示器，总价值 200 + 2999 = 3199

如上最终的结果并不是最优解，在这个案例中贪婪算法并无法得出最优解，只能得到近似最优解,也算是该算法的局限性之一。该类问题中需要得到最优解的话可以采取动态规划算法(后续更新，也可以关注我的公众号第一时间获取更新信息)。

案例三
集合覆盖问题:

假设存在如下表的需要付费的广播台，以及广播台信号可以覆盖的地区。如何选择最少的广播台，让所有的地区都可以接收到信号。

广播台覆盖地区
K1 ID,NV,UT
K2 WA,ID,MT
K3 OR,NV,CA
K4 NV,UT
K5 CA,AZ
… …

如何找出覆盖所有地区的广播台的集合呢，听起来容易，实现起来很复杂，使用穷举法实现：

(1) 列出每个可能的广播台的集合，这被称为幂集。假设总的有n个广播台，则广播台的组合总共有2ⁿ个

(2) 在这些集合中，选出覆盖全部地区的最小的集合，假设n不在，但是当n非常大的时候，假设每秒可以计算10个子集

广播台数量n 子集总数2ⁿ 需要的时间
5 32 3.2秒
10 1024 102.4秒
32 4294967296 13.6年
100 1.26*100³º 4x10²³年
目前并没有算法可以快速计算得到准备的值，而使用贪婪算法，则可以得到非常接近的解，并且效率高:

选择策略上，因为需要覆盖全部地区的最小集合:

(1) 选出一个广播台，即它覆盖了最多未覆盖的地区即便包含一些已覆盖的地区也没关系 (2) 重复第一步直到覆盖了全部的地区

这是一种近似算法（approximation algorithm，贪婪算法的一种）。在获取到精确的最优解需要的时间太长时，便可以使用近似算法，判断近似算法的优劣标准如下:

速度有多快
得到的近似解与最优解的接近程度
在本例中贪婪算法是个不错的选择，不仅运行速度快，本例运行时间O(n²),最坏的情况，假设n个广播台，每个广播台就覆盖1个地区,n个地区，总计需要查询n*n=O(n²),实现可查看后面的java代码实现

广播台数量n 子集总数2ⁿ 穷举需要时间贪婪算法
5 32 3.2秒 2.5秒
10 32 102.4秒 10秒
32 32 13.6年 102.4秒
100 32 4x10²³年 1000秒
此时算法选出的是K1, K2, K3, K5，符合覆盖了全部的地区，可能不是预期中的K2, K3,K4,K5(也许预期中的更便宜，更便于实施等等)

NP完全问题
案例四:

旅行商问题

假设有旅行商需要从下面三个城市的某一个城市出发，如何规划路线获取行程的最短路径。

存在3！(阶乘)=6种可能情况:

A->B->C
A->C->B
B->A->C
B->C->A
C->A->B
C->B->A
复制代码
这边和之前求最短路径的算法(广度搜索、狄克斯特拉、贝尔曼-福特)，最大的差别是没有固定源点(起点),，每一个节点都可能是源点，并且需要经过每一个节点，所以若穷举法则不得不找出每一种可能并进行比较。

当城市数量为n,则可能性为n!，假设每秒处理判断一个路线

数量n 总数n! 穷举需要时间
5 120 120秒
10 32 42天
而使用贪婪算法，随机选择从一个城市出发，比如A，每次选择从最近的还没去过的城市出发,则可以得到近似最优解。

第一次比较n-1个城市第二次比较n-2个城市 … 第n-1次比较1个城市第n次不存在需要比较的了个

0+1+2+3+…+(n-1) ≈ O(n²/2)

数量n 总数n! 穷举需要时间贪婪需要时间
5 120 120秒 12.5秒
10 32 42天 50秒
类似上述集合覆盖问题、旅行商问题，都属于NP完全问题，在数学领域上并没有快速得到最优解的方案，贪婪算法是最适合处理这类问题的了。

如何判断是NP完全问题的:

1.元素较少时，一般运行速度很快，但随着元素数量增多，速度会变得非常慢 2.涉及到需要计算比较"所有的组合"情况的通常是NP完全问题 3.无法分割成小问题，必须考虑各种可能的情况。这可能是NP完全问题 4.如果问题涉及序列（如旅行商问题中的城市序列）且难以解决，它可能就是NP完全问题 5.如果问题涉及集合（如广播台集合）且难以解决，它可能就是NP完全问题 6.如果问题可转换为集合覆盖问题或旅行商问题，那它肯定是NP完全问题

小结
1.贪婪算法可以寻找局部最优解，并尝试与这种方式获得全局最优解

2.得到的可能是近似最优解，但也可能便是最优解(区间调度问题，最短路径问题(广度优先、狄克斯特拉))

3.对于完全NP问题，目前并没有快速得到最优解的解决方案

4.面临NP完全问题，最佳的做法就是使用近似算法

5.贪婪算法(近似算法)在大部分情况下易于实现，并且效率不错

贪心算法epsilon-greedy

猜你喜欢