一、树
树(英语:tree)是一种抽象数据类型(ADT)或是实作这种抽象数据类型的数据结构,用来模拟具有树状结构性质的数据集合。它是由n(n>=1)个有限节点组成一个具有层次关系的集合。
树具有以下特点:
- 每个节点有零个或多个子节点;
- 没有父节点的节点称为根节点;
- 每一个非根节点有且只有一个父节点;
- 除了根节点外,每个子节点可以分为多个不相交的子树;
树里面每个元素我们叫作“节点”;用来连线相邻节点之间的关系,我们叫作“父子关系”。
A 节点就是 B 节点的父节点,B 节点是 A 节点的子节点。B、C、D 这三个节点的父节点是同一个节点,所以它们之间互称为兄弟节点。我们把没有父节点的节点叫作根节点,也就是图中的节点 E。我们把没有子节点的节点叫作叶子节点或者叶节点,比如图中的 G、H、I、J、K、L 都是叶子节点。
树的概念:高度(Height)、深度(Depth)、层(Level)
- 节点的高度:节点到叶子节点的最长路径
- 节点的深度:根节点到这个节点所经历的边的个数
- 节点的层数:节点的深度+1
- 树的高度:根节点的高度
这里需要注意的是深度这个概念,有的教材中是从1开始计算的,有的教材是从0开始计算,这里暂定为0开始。
树的种类:
-
无序树:树中任意节点的子节点之间没有顺序关系,这种树称为无序树,也称为自由树;
-
有序树:树中任意节点的子节点之间有顺序关系,这种树称为有序树;
- 二叉树:每个节点最多含有两个子树的树称为二叉树;
- 完全二叉树:对于一颗二叉树,假设其深度为d(d>1)。除了第d层外,其它各层的节点数目均已达最大值,且第d层所有节点从左向右连续地紧密排列,这样的二叉树被称为完全二叉树。
满二叉树的定义是所有叶节点都在最底层的完全二叉树;
- 平衡二叉树(AVL树):当且仅当任何节点的两棵子树的高度差不大于1的二叉树;
- 排序二叉树(二叉查找树(Binary Search Tree),也称二叉搜索树、有序二叉树); - 霍夫曼树(用于信息编码):带权路径最短的二叉树称为哈夫曼树或最优二叉树;
- B树:一种对读写操作进行优化的自平衡的二叉查找树,能够保持数据有序,拥有多余两个子树。
- 二叉树:每个节点最多含有两个子树的树称为二叉树;
二叉树,每个节点最多有两个“叉”,也就是两个子节点,分别是左子节点和右子节点。不过,二叉树并不要求每个节点都有两个子节点,有的节点只有左子节点,有的节点只有右子节点(小于等于2个节点)。
叶子节点全都在最底层,除了叶子节点之外,每个节点都有左右两个子节点,这种二叉树就叫作满二叉树。
下图二叉树中,图中编号2是满二叉树。
编号 3 的二叉树中,叶子节点都在最底下两层,最后一层的叶子节点都靠左排列,并且除了最后一层,其他层的节点个数都要达到最大,这种二叉树叫作完全二叉树。
树的存储与表示:
二叉树通常以链式存储。
链式存储中每个节点有三个字段,其中一个存储数据,另外两个是指向左右子节点的指针。我们只要拎住根节点,就可以通过左右子节点的指针,把整棵树都串起来。这种存储方式我们比较常用。大部分二叉树代码都是通过这种结构来实现的。
顺序存储:将数据结构存储在固定的数组中,然在遍历速度上有一定的优势,但因所占空间比较大,是非主流二叉树。
二叉树的代码实现:
节点表示:
# 节点实现
class Node(object):
'''节点类'''
def __init__(self, item, l_item=None, r_item=None): # 默认没有指向其他节点的
self.item = item # 节点的数据值
self.l_item = l_item # 指向下面左节点的地址
self.r_item = r_item # 指向下面右节点的地址
树的创建,创建一个树的类,并给一个root根节点,一开始为空,随后添加节点。
# 实现深度为3 广度优先的完全二叉树
class Tree(object):
'''树类'''
#
def __init__(self, root=None): # 初始根节点root为None
self.root = root
1、实现树的添加节点函数
# 添加新节点
def add(self, item):
# 创建一个节点
node = Node(item)
# 空树
if self.root == None:
self.root = node
else:
queue = [] # 创建新列表 不是空树的情况下
queue.append(self.root) # 根节点添加进新列表
while queue: # 不断循环遍历所有列表,当queue的元素弹空为止,跳出循环
cur_node = queue.pop(0) # 弹出当前节点的值 类似于队列中的弹出首元素的值用pop(0) 这句得在循环内,否则不会循环弹出值
if cur_node.l_item == None: # 如果左节点的指向地址为空,使左节点地址指向新添加节点
cur_node.l_item = node
return
elif cur_node.r_item == None: # 如果右边节点的指向地址为空,使右节点地址指向新添加节点
cur_node.r_item = node
return
else:
queue.append(cur_node.l_item) # 如果左边和右边节点的指向地址都不为空,直接添加新节点
queue.append(cur_node.r_item)
2、广度优先遍历树的节点
# 广度优先遍历节点
def tree_node_travel(self):
if self.root == None: # 空树,直接返回
return None
else:
queue = [] # 创建新列表 不是空树的情况下
queue.append(self.root) # 根节点添加进新列表
while queue: # 不断循环遍历所有列表,当queue的元素弹空为止,跳出循环
node = queue.pop(0) # 弹出当前节点的值 类似于队列中的弹出首元素的值用pop(0)
print("当前节点数值:", node.item) # 打印输出当前节点数据
if node.l_item != None:
queue.append(node.l_item)
if node.r_item != None:
queue.append(node.r_item)
深度优先遍历
对于一颗二叉树,深度优先搜索(Depth First Search)是沿着树的深度遍历树的节点,尽可能深的搜索树的分支。
那么深度遍历有重要的三种方法,分别叫做先序遍历(preorder),中序遍历(inorder)和后序遍历(postorder)。
在先序遍历中,我们先访问根节点,然后递归使用先序遍历访问左子树,再递归使用先序遍历访问右子树
根节点->左子树->右子树
3、实现深度优先中的先序遍历
# 深度优先中的先序遍历
'''
先序遍历 在先序遍历中,我们先访问根节点,然后递归使用先序遍历访问左子树,再递归使用先序遍历访问右子树
根节点->左子树->右子树
'''
def preorder(self, node): # 先传的是根节点
if node == None: # 空树情况
return None
print(node.item, end=" ") # 非空树情况直接打印
self.preorder(node.l_item) # 递归执行打印节点左边指向地址值
self.preorder(node.r_item) # 递归执行打印节点右边指向地址值
4、实现深度优先中的中序遍历
中序遍历 在中序遍历中,我们递归使用中序遍历访问左子树,然后访问根节点,最后再递归使用中序遍历访问右子树
左子树->根节点->右子树
# 深度优先中的中序遍历
'''
在中序遍历中,我们递归使用中序遍历访问左子树,然后访问根节点,最后再递归使用中序遍历访问右子树
左子树->根节点->右子树
'''
def inorder(self, node):
"""递归中序遍历"""
if node == None:
return
self.inorder(node.litem)
print(node.item, end=" ")
self.inorder(node.ritem)
5、实现深度优先中的后序遍历
# 深度优先中的后序遍历
'''
后序遍历 在后序遍历中,我们先递归使用后序遍历访问左子树和右子树,最后访问根节点
左子树->右子树->根节点
'''
def postorder(self, node):
"""递归实现后序遍历"""
if node == None:
return
self.postorder(node.litem)
self.postorder(node.ritem)
print(node.item, end=" ")
问题:哪两种遍历方式能够唯一的确定一颗树?
答:包含中序遍历的能够唯一确定一棵树,因为中序遍历中的顺序是 左子树->根节点->右子树,可以根据另一个遍历方式先确定根节点是哪些,然后拆分中序遍历中的左右两个非根节点的部分,能够确定剩余的左右子树的节点值。
常见的树的应用场景
- xml,html等,那么编写这些东西的解析器的时候,不可避免用到树
- 路由协议就是使用了树的算法
- mysql数据库索引 (面试重点:B+树实现)
- 文件系统的目录结构(Linux)
- 很多经典的AI算法其实都是树搜索,此外机器学习中的decision tree也是树结构