07.链表(下):如何轻松写出正确的链表代码?
markdown文件已上传至github
1.理解指针或引用的含义
有些语言有“指针”的概念,如C语言;
有些语言没有指针的概念,取而代之的是’'引用“,如Java、Python;
不管是“指针”还是“引用”,它们的意思都是一样的,都是存储所指对象的内存地址。
将某个遍历赋值给指针,实际上就是将这个变量的地址复制给指针。指针中存储了这个变量的内存地址,通过指针就能找到这个变量。
p–>next =q,指p结点中的next指针存储了q结点的内存地址。
p–>next =p–>next–>next,指p结点的next指针存储了p结点的下下一个结点的内存地址。
2.警惕指针丢失和内存泄漏
指针是如何弄丢的?
如下图,我们需要在a,b之间插入结点x。指针p指向a。
下方的代码实现就会发生指针丢失。
p->next = x
x->next = p->next
p->next指针在完成第一步后已经不指向结点b,而指向了x。第2行代码相当于将x赋值给x->next,自己指向自己,整个链表断成了两半,从结点b往后的所有结点都无法访问到了。将第一二行代码换下顺序就正确了。
有些语言,如C语言,内存管理是由程序员负责的,如果没有手动释放结点对应的内存空间,就会导致内存泄漏(指程序中己动态分配的堆内存由于某种原因程序未释放或无法释放,造成系统内存的浪费,导致程序运行速度减慢甚至系统崩溃等严重后果)。**所以删除结点时,一定要记得手动释放内存空间。**对于Java这种虚拟机自动管理内存的编程语言来说,可以不用考虑这些。
3.利用哨兵简化实现难度。
先来看看单链表的插入和删除操作。如果我们要在结点p后面插入一个新的结点,代码如下:
new_node->next = p->next;
p->next = new_node;
向一个空链表中插入第一个节点,head表示头节点,代码如下,对比上方,可以看到第一个结点和其他结点的逻辑是不一样的。
if (head == null) {
head = new_node;
}
再来看单链表结点的删除操作,如果要删除结点p的后继结点,只需一行代码:
p->next = p->next->next;
但是如果我们要删除链表的最后一个结点,上面的删除代码就不work了,这时代码如下:
if (head->next == null) {
head = null;
}
从以上可以看出,对链表的插入和删除操作,需要对插入第一个结点和删除最后一个结点的情况进行特殊处理。
这样代码实现起来会很繁琐,不简洁,而且容易因为考虑不全而出错。这个问题可由哨兵解决。
**哨兵:**解决的是国家之间的边界问题。同理,这里说的哨兵也是解决“边界问题”的,不直接参与业务逻辑。
还记得的如何表示一个空链表吗?head = null 表示链表中没有结点了,head表示头结点指针,指向链表的第一个结点。
如果引入哨兵结点,在任何时候,不管链表是不是空,head指针都会一直指向这个哨兵结点。这种带有哨兵结点的链表夹带头链表,没有哨兵结点的链表叫做不带头链表。
下图即为带头链表,可以发现,哨兵结点是不存储数据的,因为哨兵结点一直存在,所以插入第一个结点和插入其他结点,删除第一个结点和删除其他结点,都可以统一为相同的代码实现逻辑了。
实际上,这种利用哨兵简化编程难度的技巧在很多代码实现中都有用到,比如插入排序、归并排序、动态规划等
下面举一个非常简单的例子:
代码一:
// 在数组a中,查找key,返回key所在的位置
// 其中,n表示数组a的长度
int find(char* a, int n, char key) {
// 边界条件处理,如果a为空,或者n<=0,说明数组中没有数据,就不用while循环比较了
if(a == null || n <= 0) {
return -1;
}
int i = 0;
// 这里有两个比较操作:i<n和a[i]==key.
while (i < n) {
if (a[i] == key) {
return i;
}
++i;
}
return -1;
}
代码二:
// 在数组a中,查找key,返回key所在的位置
// 其中,n表示数组a的长度
// 我举2个例子,你可以拿例子走一下代码
// a = {4, 2, 3, 5, 9, 6} n=6 key = 7
// a = {4, 2, 3, 5, 9, 6} n=6 key = 6
int find(char* a, int n, char key) {
if(a == null || n <= 0) {
return -1;
}
// 这里因为要将a[n-1]的值替换成key,所以要特殊处理这个值
if (a[n-1] == key) {
return n-1;
}
// 把a[n-1]的值临时保存在变量tmp中,以便之后恢复。tmp=6。
// 之所以这样做的目的是:希望find()代码不要改变a数组中的内容
char tmp = a[n-1];
// 把key的值放到a[n-1]中,此时a = {4, 2, 3, 5, 9, 7}
a[n-1] = key;
int i = 0;
// while 循环比起代码一,少了i<n这个比较操作
while (a[i] != key) {
++i;
}
// 恢复a[n-1]原来的值,此时a= {4, 2, 3, 5, 9, 6}
a[n-1] = tmp;
if (i == n-1) {
// 如果i == n-1说明,在0...n-2之间都没有key,所以返回-1
return -1;
} else {
// 否则,返回i,就是等于key值的元素的下标
return i;
}
}
两段代码,当字符串a很长的时候,比如几万,几十万,代码二将运行得更快,因为两断代码中执行次数最多的就是while循环那一部分,第二段代码我们通过一个哨兵a(n-1) = key ,成功省掉了比较语句i<n。
这里只是为了举例说明哨兵的作用,写代码时不要写成了代码二这样,因为可读性太差了,大部分情况下,我们不需要如此追求极致的性能。
4.重点留意边界条件的处理
软件开发时,代码在一些边界或者异常情况下,最容易产生Bug。在代码编写过程中和完成后,要检查边界条件是否考虑全面,以及在边界条件下是否能正确运行。
经常用来检查链表代码是否正确的边界条件有这几个:
- 如果链表为空时,代码能否正常工作?
- 如果链表只包含一个结点时,代码能否正常工作?
- 如果链表只包含两个结点时,代码能否正常工作?
- 代码逻辑在处理头结点和尾结点的时候,能否正常工作?
当写完链表代码后,除了看写的代码在正常情况下能否工作,还要看在上面列举的几个边界条件下能否正常工作。
5.举例画图,辅助思考。
对于稍微复杂的链表操作,指针一会指这一会指那,可以把它画在纸上,释放一些脑容量,留更多给逻辑思考。
例如:往单链表中插入一个数据,画出插入前和插入后的链表变化。
这样看图写代码就简单多了。
6.多写多练,没有捷径。
7.参考
这个是我学习王争老师的《数据结构与算法之美》所做的笔记,王争老师是前谷歌工程师,该课程截止到目前已有87244人付费学习,质量不用多说。
截取了课程部分目录,课程结合实际应用场景,从概念开始层层剖析,由浅入深进行讲解。本人之前也学过许多数据结构与算法的课程,唯独王争老师的课给我一种茅塞顿开的感觉,强烈推荐大家购买学习。课程二维码我已放置在下方,大家想买的话可以扫码购买。
本人做的笔记并不全面,推荐大家扫码购买课程进行学习,而且课程非常便宜,学完后必有很大提高。