数据结构--树及相关特性

1.  树及相关特性

1.1. 树的概念

树形结构是一类重要的非线性结构。树形结构是结点之间有分支,并具有层次关系的结构。它非常类似于自然界中的树。

树结构在客观世界中是大量存在的,例如家谱、行政组织机构都可用树形象地表示。

树在计算机领域中也有着广泛的应用,例如在编译程序中,用树来表示源程序的语法结构;在数据库系统中,可用树来组织信息;在分析算法的行为时,可用树来描述其执行过程。

在计算机领域中被大量应用的树结构主要有:二叉查找树(Binary Search Tree),平衡二叉查找树(Balanced Binary Search Tree),红黑树(Red-Black Tree ),B-tree/B+-tree/ B*-tree。文件系统和数据库系统中常常使用B/B+ 树,他通过对每个节点存储个数的扩展,使得对连续的数据能够进行较快的定位和访问,能够有效减少查找时间,提高存储的空间局部性从而减少IO操作。他广泛用于文件系统及数据库中,如:

  • Windows:HPFS文件系统
  • Mac:HFS,HFS+文件系统
  • Linux:ResiserFS,XFS,Ext3FS,JFS文件系统
  • 数据库:ORACLE,MYSQL,SQLSERVER等中

 通过本文将记录本人最近复习算法及数据结构中相关树及常见的树结构的存储表示及其各种运算,文中的观点及结论均来自互联网和相关的书籍,并通过本人自己的实践及调试。

1.1.1.  家族树

在现实生活中,有入如下血统关系的家族可用树形图表示:

  • 张源有三个孩子张明、张亮和张丽;
  • 张明有两个孩子张林和张维;
  • 张亮有三个孩子张平、张华和张群;
  • 张平有两个孩子张晶和张磊。


以上表示很像一棵倒画的树。其中"树根"是张源,树的"分支点"是张明、张亮和张平,该家族的其余成员均是"树叶",而树枝(即图中的线段)则描述了家族 成员之间的关系。显然,以张源为根的树是一个大家庭。它可以分成张明、张亮和张丽为根的三个小家庭;每个小家庭又都是一个树形结构。

1.1.2.  树的定义

树的递归定义:

树(Tree)是n(n≥0)个结点的有限集T,T为空时称为空树,否则它满足如下两个条件:

1)  有且仅有一个特定的称为根(Root)的结点;

2)  其余的结点可分为m(m≥0)个互不相交的子集Tl,T2,…,Tm,其中每个子集本身又是一棵树,并称其为根的子树(Subree)。

 

如上图所示,A点称为根节点,它有两棵子树,分别以B、C为根,而以C为根的子树又可以分成两棵子树。

  注意:

   树的递归定义刻画了树的固有特性:一棵非空树是由若干棵子树构成的,而子树又可由若干棵更小的子树构成。

1.2. 树的表示

1)   树形图表示

树形图表示是树结构的主要表示方法。

树的树形图表示中:结点用圆圈表示,结点的名字写在圆圈旁边(有时亦可写在圆圈内)。

用该定义来分析上图(a)所示的树:

图中的树由结点的有限集T={A,B,C,D,E,F,C,H,I,J}所构成,其中A是根结点,T中其余结点可分成三个互不相交的子集:

         T1={B,E,F,I,J},

         T2={C},

         T3={D,G,H}。

T1、T2和T3是根A的三棵子树,且本身又都是一棵树。例如T1,其根为B,其余结点可分为两个互不相交的的子集T11={E}和T12={F,I,J},它们都是B的子树。显然T11是只含一个根结点E的树,而T12的根F又有两棵互不相交的子树{I}和{J},其本身又都是只含一个根结点的树。

  

2)   树的其他表示法

①嵌套集合表示法

是用集合的包含关系来描述树结构。

上图(a)树的嵌套集合表示法如图(b)

②凹入表表示法

 类似于书的目录,上图(a)树的凹入表示法如图(c)

 

③广义表表示法

用广义表的形式表示的。上图(a)树的广义表表示法如图(d)

  (A(B(E,F(I,J)),C,D(G,H)))

1.3. 树结构的基本术语 

1)   不同的节点:根节点、内部节点、叶子节点以及节点的度(Degree)

  • 树中的一个结点拥有的子树数称为该结点的度(Degree)。
  • 一棵树的度是指该树中结点的最大度数。
  • 度为零的结点称为叶子(Leaf)或终端结点。
  • 度不为零的结点称分支结点或非终端结点。
  • 除根结点之外的分支结点统称为内部结点。
  • 根结点又称为开始结点。

2)   节点的关系:孩子(Child)和双亲(Parents)

  • 树中某个结点的子树之根称为该结点的孩子(Child)或儿子,相应地,该结点称为孩子的双亲(Parents)或父亲。
  • 同一个双亲的孩子称为兄弟(Sibling)。

3)   祖先(Ancestor)和子孙(Descendant)

A.   路径(path)

  • 若树中存在一个结点序列k1,k2,…,ki,使得ki是ki+1双亲(1≤i<j),则称该结点序列是从kl到kj的一条路径(Path)或道路
  • 路径的长度指路径所经过的边(即连接两个结点的线段)的数目,等于j-1。

  注意:

若一个结点序列是路径,则在树的树形图表示中,该结点序列"自上而下"地通过路径上的每条边。

从树的根结点到树中其余结点均存在一条惟一的路径。

B.  祖先(Ancestor)和子孙(Descendant)

  • 若树中结点k到ks存在一条路径,则称k是ks的祖先(Ancestor),ks是k的子孙(Descendant)。
  • 一个结点的祖先是从根结点到该结点路径上所经过的所有结点,而一个结点的子孙则是以该结点为根的子树中的所有结点。

约定:

结点k的祖先和子孙不包含结点k本身。

4)   结点的层数(Level)和树的高度(Height)

     

结点的层数(Level)从根起算:

  • 根的层数为1
  • 其余结点的层数等于其双亲结点的层数加1。
  • 双亲在同一层的结点互为堂兄弟
  • 树中结点的最大层数称为树的高度(Height)或深度(Depth)。

  注意:

很多文献中将树根的层数定义为0。

5)   有序树(OrderedTree)和无序树(UnoderedTree)

若将树中每个结点的各子树看成是从左到右有次序的(即不能互换),则称该树为有序树(OrderedTree);否则称为无序树(UnoderedTree)。

  注意:

若不特别指明,一般讨论的树都是有序树。

6)   森林(Forest)

森林(Forest)是m(m≥0)棵互不相交的树的集合。

树和森林的概念相近。删去一棵树的根,就得到一个森林;反之,加上一个结点作树根,森林就变为一棵树。

1.4. 树形结构的逻辑特征

树形结构的逻辑特征可用树中结点之间的父子关系来描述:

1)   树中任一结点都可以有零个或多个直接后继(即孩子)结点,但至多只能有一个直接前趋(即双亲)结点。

2)   树中只有根结点无前趋,它是开始结点;叶结点无后继,它们是终端结点。

3)   祖先与子孙的关系是对父子关系的延拓,它定义了树中结点之间的纵向次序。

4)   有序树中,同一组兄弟结点从左到右有长幼之分。

对这一关系加以延拓,规定若k1和k2是兄弟,且k1在k2的左边,则kl的任一子孙都在k2的任一子孙的左边,那么就定义了树中结点之间的横向次序。

猜你喜欢

转载自blog.csdn.net/liuyez123/article/details/50614241