算法图解第2章选择排序

2.1 内存的工作原理

假设你去看演出，需要将东西寄存。寄存处有一个柜子，柜子有很多抽屉。

每个抽屉可放一样东西，你有两样东西需要寄存，因此要了两个抽屉。

你将两样东西放在这里。

现在你可以去看演出了！这大致就是计算机内存的工作原理。计算机就像是很多抽屉的集合体，每个抽屉都有地址。

fe0ffeeb是一个内存单元的地址。

需要将数据存储到内存时，你请求计算机提供存储空间，计算机给你一个存储地址。需要存储多项数据时，有两种基本方式---数组和链表。但它们并非都适用于所有的情形，因此知道它们差别很重要。接下来介绍数组和链表以及它们的优缺点。

2.2 数组和链表

有时候，需要在内存中存储一系列元素。假设你要编写一个管理待办事荐的应用程序，为此需要将这此待办事项存储在内存中。

应使用数组还是链表呢？鉴于数组更容易掌握，我们先将待办事项存储在数组中。使用数组意味着所有待办事项在内存中都是相连的（紧靠在一起的）。

现在假设你要添加第四个待办事项，但后面的那个抽屉放着别人的东西！

这就像你与朋友去看电影，找到地方就坐后又来了一们朋友，但原来的地方没有空位置，只得再找一个可坐下所有人的地方。在这种情况下，你需要请求计算机重新分配一块可容纳4个待办事项的内存，再将所有待办事项都移到那里。

如果又来了一位朋友，而当前坐的地方也没有穴位，你们就得再次转移！真是大麻烦了。同样，在数组中添加新元素也可以很麻烦。如果没有了空间，就得移到内存的其他地方，因此添加新速度会很慢。一种解决之道是“”预留座位“：即便当臆只有3个待办事项，也请计算机提供10个位置，以防需要添加待办事项。这样，只要待办事项不起过10个，就无需转移。这是一个不错的权变措施，但你应该明白，它存在如下两个缺点。

你额外请求的位置可能根本用不上，这将浪费内存。你没用使用，别人也用不了。

待办事项超过10个后，你还香转移。

因些，这种权宜措施虽然不错，但绝非完善的解决方案。对于这种问题，可使用链表来解决。

2.2.1 链表

链表中的元素可存储的内存的任何地方。

链表的每个元素都存储了下一个元素的地址，从而使一系列随机的内存地址串在一起。

这犹如寻宝游戏。你前往第一个地址，那里有一张纸条写着”下一个元素的地址为123“。因此，你前往地址123，那里又有一张纸条，写着”下一下元素的地址为847“，以此类推。在链表中添加元素很容易：只需要将其放放内存，并将其地址存储到前一个元素中。

使用链表时，根本不需要移动元素。这还可避免另一个问题。假设你与五位朋友去看一部很火的电影。你们六人想坐在一起，便掉进电影的人较多，没有六个在一起的座位。使用数组时有时就会遇到这样的情况。假设你要为数组分配10000个位置，内丰中有10000个位置，但都不靠在一起。在这种情况下，你将无法为该数组分配内存！链表相当于说”我们分开来坐”，因此，只要有足够的内存空间，就能为链表分配内存。

链表的优势在插入元素方面，那数组的优势又是什么呢？

2.2.2 数组

排行榜网站使用卑鄙的手段来增加页面流星量。它们不在一个页面中显示整个排行榜，而将排行榜的每项内容都放在一个页面中，并让你单击Next来查看下一项内容。例如，显示十大电视反派时，不在一个页面中显示整个排行榜，而是先显示第十大反派（Newman）。你必须在个个页面中显示广告，但用户需要单击Next九次才能看到第一个，真的是很烦。

如果整个排行榜都显示在一个页面中，将方便得多。这样，用户可单击排行榜中的人名来获得更详细的信息。

链表存在类似的问题。在需要读取链表的最后一个元素时，你不能直接读取，因为你不知道它所处的地址。必须先访问元素#1,，从中获取元素#2的地址，再访问元素#2并从中获取元素#3的地址，以此类推，直到访问最后一个元素。需要同时读取所有元素时，链表的效率很高：你读取第一个元素，根据其中的地址再读取第二个元素，以此类推。但如果你需要跳跃，链表的效率真的很低。

数组与此不同：你知道其中每个元素的地址。例如，假设有一个数组，它包含五个元素，起始地址为00，那么元素#5的地址是多少呢？

只需要执行简单的数学运算就知道:04。需要随机读取元素时，数组的效率很高，因为可迅速找到数组的任何元素。在链表中，元素并非靠在一起的，你无法迅速计算出每五个元素的内存地址，而必须先访问每一个元素以获取第二个元素的地址，再访问第二个元素以获取第三个元素，以此类推，直到访问每五个元素。

2.3.3 术语

数组的元素带编号，编号从0而不是1开始。例如，在下在的数组中，元素20的位置为1。

而元素10的位置为0.这通常会让新手晕头转向。从0开始让基于数组的代码编写起来更容易，因此程序员始终坚持这样做。几乎所有的编程语文都从0开始对数组元素进行编号。

元素的位置称为索引。因此，不说”元素20的位置为1“，而说”元素20位于索引1处“。本书将使用索引来表示位置。

下面列出了常见的数组和链表操作的运行时间。

问题：在数组中播放元素是地，为何运行时间为 O(n)呢？假设要在数组开头插入一个元素，你将如何做？这需要多长时间？

请阅读下一节，找出这些问题的答案。

2.2.4 在中间插入

假设你要让待办事项按日期排列。之前，你在清单末尾添加了待办事项。

但现在你要根据新增选办事项的日期将其插入到正确的位置。

需要在中间插入元素时，数组和链表哪个更好呢？使用链表时，插入元素很简单，只需要修改它前面的那个元素指向的地址。

而使用数组时，则必须将后面的元素都向后移。

如果没有足够的空间，可能还得将整个数组复制到其他地方！因此，当需要在中间插入元素时，链表是更好的选择。

2.2.5 删除

如果你要删除元素呢？链表也是更好的选择，困为只需要修改前一个元素指向的地址即可。而使用数组时，删除元素后，必须将后面的元素都向前移。

不同于插入，删除元素总能成功。如果内存中没有足够的空间，插入操作可能失败，但在任何情况下都能将元素邮件。

下在是常见的数组和链表操作的运行时间。

需要指出的是，仅当能够立即访问要删除的元素时，删除操作的运行时间才为O(1)，通常我们都记录了链表的第一个元素和最后一个元素。因此删除这些元素时运行时间为O(1)。

数组和链表哪个用得更多呢？显然要看情况。但数组用得很多，因为它支持随机访问。有两种方式：随机访问和顺序访问。顺序访问意味着从第一个元素开始逐个地读取元素，链表只能顺序访问：要读取链表的第十个元素，得读取前九个元素，并沿链接找到第十个元素。随机访问意味着可直接跳到第十个元素。本书经常说数组的读取速度更快，这是因为它们支持随机访问。很多情况都要求能够随机访问，因此数组用得很多。数组和链表还被用来实现其他数据结构，这将在本书后面介绍。

2.3 选择排序

有了前面的知识，你就可以学习第二种算法-------选择排序了。要理解本节的内容，你必须熟悉数组、链表和大O表示法。

假设你的计算机存储了很多乐曲。对于每个乐队，你都记录了其作品被播放的次数。

你要将这个列表按播放次数从多到少的顺序排序，从而将你喜欢的乐队排序。该如何做呢？

一种办法是遍历这个列表，找出作品播放次数最多的乐队，并将该乐队添加到一个新列表中。

再次这样做，找出播放次数第二多的乐队。

继续这样做，你将得到一个有序列表。

下面从计算机科学的角度出发，看看这需要多长时间。别戽了，O(n)时间意味着查看列表中的每个元素一次。例如，对乐队列表进行简单查找时，意味着每个乐队都要查看一次。

要找出播放次数最多的乐队，必须检查列表中的每个元素。正如你刚才看到的，这需要的时间为O(n)。因此对于这种时间为O(n)(n)。因此对于这种情况为O(n)的操作。你需要执行n次。

需要的总时间为O(n * n)，即O（n*n）

排序算法很有用。你现在可以对如下内容进行排序：

电话薄中的人名

旅行日期

电子邮件（从新到旧）

需要检查的元数越来越来少

随着排序的进行，每次需要检查的元素数在逐渐减少，最后一次需要检查的元素都只有一个。既然如此，运行时间怎么琮是O(n*n)呢？这个问题问得好，这与大O表示法中的常数相关。第4章将详细解释，这里只简单地说一说。

你说得没错，并非每次都需要检查n个元素。第一次需要检查n个元素，但随后检查的元素数依次为n-1,n-2,---2和1。平均每次检查的元素为1/2 *n,因此运行时间为O(n21/2*n)。但大O表示法省略诸如1/2这样的常量（有关这方面的完整讨论，请参阅每4章），因些简单地写作O(n *n)。

选择排序是一种灵巧的算法，但其速度不是很快。快速排序是一种更快的排序算法，其运行时间为)(nl og n).这将在下一章介绍。

示例代码

前面没有列出对乐队进行排序的代码，但下述代码提供了类似的功能：将数组元素按从小到大的顺序排列。先编写一个用于找出数组中最小元素的函数。

# coding=utf-8
def findSmallest(arr):
    smallest = arr[0]       # 存储最小的值
    smalltest_index = 0     #存储最小元素的索引
    for i in range(1,len(arr)):
        if arr[i] < smallest:
            smalltest = arr[i]
            smalltest_index = i
    return smalltest_index

def selectionSort(arr):             #对数组进行排序
    newArr = []
    for i in range(len(arr)):
        smalllest = findSmallest(arr)       #找出数组中最小的元素
        newArr.append(arr.pop(smalllest))   #并将其加入到新数组 中
    return newArr

print selectionSort([5,3,6,2,10])

程序输出

[2, 3, 5, 6, 10]

2.4 小结

计算机内存犹如一大堆抽屉。

需要存储多个元素时，可使用数组或链表。

数组元素都在一起。

链表的元素是分开的，其中每个元素都存储了下一个元素的地址。

数组的读取速度很快。

链表的插入和删除速度很快。

在同一个数组中，所有元素的类型都必须相同（都为int、double等）。

tjjingpan

发布了139 篇原创文章 · 获赞 38 · 访问量 18万+

私信关注

算法图解 第2章 选择排序

猜你喜欢

算法图解第2章选择排序