广东省汕头市高中信息技术信息学竞赛班数据结构专项培训教程07树.docx
《广东省汕头市高中信息技术信息学竞赛班数据结构专项培训教程07树.docx》由会员分享,可在线阅读,更多相关《广东省汕头市高中信息技术信息学竞赛班数据结构专项培训教程07树.docx(20页珍藏版)》请在冰豆网上搜索。
广东省汕头市高中信息技术信息学竞赛班数据结构专项培训教程07树
树
§7.1树的概念
【定义】树(Tree)是n(n>0)个结点的有限集合T,它满足如下两个条件:
(1)有且仅有一个特定的称为根(Root)的结点;
(2)其余的结点可分为m(m≥0)个互不相交的有限集合,其中每一个集合又都是一颗树,并称为根的子树(SubTree)。
【基本术语】k
树的结点包含一个数据元素及若干指向其子树的分支。
结点拥有的子树数称为结点的度(degree)。
如图7.1,A的度为3,C的度为1,F的度为0。
度为0的结点称为叶子(leaf)或终端结点。
例如K、L、F、G、M、I、J。
度不为0的结点称为分支结点或非终端结点。
除根结点外,分支结点也称为内部结点。
树的度是树内各结点的度的最大值,如图7.1中树的度为3。
结点的子树的根称为该结点的孩子(Child),该结点称为孩子的双亲(parent)。
如图7.1.1,B为A的子树的根,则B是A的孩子,而A则是B的双亲。
同一个双亲的孩子之间互称为兄弟(sibling),例如B、C、D互为兄弟。
将这些关系进一步推广,可认为D是M的祖父。
结点的祖先是从根到该结点所经分支上的所有结点。
例如,M的祖先为A、D、H。
反之,结点的子树中的任一结点都称为该结点的子孙,如B的为E、F、K、L。
5.结点的层次(level)是从根开始定义起,根为第一层,根的孩子为第二层。
若某结点在第x层,则其子树的根就在x+1层。
树中结点的最大层次称为树的高度或深度(depth)。
如图7.1的树的深度为4。
6.如果将树中的结点的各子树看成从左到右是有次序的(即不能互换),则称该树为有序树,否则称为无序树。
如图7.1.2。
7.森林(forest)是m(m≥0)棵互不相交的树的集合。
§7.2二叉树
§7.2.1二叉树的定义
二叉树(binarytree)是一种树型结构,它的每个结点至多只有二棵子树(即二叉树中不存在度大于2结点),并且,二叉树的子树有左右之分,其次序不能任意颠倒。
(如图7.2.1)
满二叉树和完全二叉树是两种特殊形态的二叉树。
满二叉树是指深度为k,且有2k-1个结点的二叉树。
完全二叉树是指深度为k,有n个结点,当且仅当每一个结点都与深度为k的满二叉树中编号从1到n的结点一一对应时。
§7.2.2二叉树的性质
性质1:
在二叉树的第i层上至多有①个结点(i≥1)。
性质2:
深度为k的二叉树至多有②个结点(k≥1)。
性质3:
对任意一棵二叉树,如果度为2的结点数为n2,则其叶子结点数为③。
性质4:
具有n个结点的完全二叉树的深度为
性质5:
如果对一棵有n个结点的完全二叉树的结点按层序编号(每层从左到右),则对任一结点i(1≤i≤n),有:
①如果i=1,则结点i是二叉树的根;如果i>1,则其双亲结点是idiv2
②如果2*i>n,则结点i无左孩子(结点i为叶子结点);否则其左孩子为2*i
③如果2*i+1>n,则结点i无右孩子,否则其右孩子为2*i+1
[参考答案及证明]:
①2i-1
证明:
利用归纳法
当i=1时,只有一个根结点,显然,2i-1=20=1正确;
假设对所有的j,1≤j
由假设,第i-1层上至多有2i-1个结点,由于二叉树中的每个结点的度至多为2,故在第i层上的最大结点数为第i-1层上最大结点数的2倍,即2*2i-2=2i-1
②2k-1
证明:
深度为K的二叉树的最大结点数为
③n2+1
证明:
设叶子结点数为n0,度为1的结点数为n1,则该数结点的总数为:
n=n0+n1+n2
(1)
树中结点之间的连线称为分支。
树中除根结点外,其余每个结点都有一个分支进入,设B为二叉树分支的总数,则有:
B=n–1
另一方面,这些分支是由度为1或2的结点射出的,所以:
B=n1+2n2
所以:
n–1=n1+2n2
(2)
由式
(1)和
(2)得:
n0+n1+n2–1=n1+2n2
即:
n0=n2+1
④
证明:
假设深度为K的完全二叉树的结点数为n,则根据性质2和完全二叉树定义有:
或
于是
∵k是整数∴
⑤证明略
§7.2.2二叉树的存储结构
1.顺序存储结构
将二叉树的所有结点按一定的次序,存储到一片连续的存储单元中。
这种结构,较适用于满二叉树或近似满二叉树。
如图7.2.5中完全二叉树的存储结构如下:
A
B
C
D
E
F
G
H
I
J
K
L
M
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
图7.2.6中的二叉树的存储结构如下:
A
B
C
D
F
G
I
M
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
可以看出,当二叉树较稀疏时,采用顺序存储将造成浪费。
[练习]
如果完全二叉树最多有n层,那么存储该树的数组最少设________个单元;
某结点存储于S[i],则存在双亲结点的条件:
if______________________
其双亲结点位于S[____],其左孩子结点位于S[____];
2.链式存储结构
设计不同的结点结构可以构成不同形式的链式存储结构。
由二叉树的定义可知,二叉树的结点由一个数据元素和分别指向其左右子树的两个分支构成,则表示二叉树的链表中的结点至少包含三个域:
数据域和左、右指针域,如图7.2.7。
有时为了便于找到结点的双亲,则还可以在结点的结构中增加一个指向其双亲结点的指针域。
用这两种结点结构所得的二叉树的存储结构分别称为二叉链表和三叉链表,如图7.2.8。
在具体应用中采用什么存储结构,除根据二叉树的形态之外,还应考虑需进行何种操作。
如找结点的双亲,在三叉链表中容易实现,而在二叉链表中则需从根中指针出发巡查。
§7.3遍历二叉树
遍历二叉树(traversingbinarytree)是指按某种搜索路径巡访树中每个结点,使得每个结点均被访问一次,且仅访问一次。
根据二叉树的定义知,二叉树由三个基本单元组成:
根结点、左子树和右子树。
因此,若能依次遍历这三个部分,则遍历了整棵二叉树。
假设以D、L、R分别表示访问根结点、遍历左子树、遍历右子树,则可有DLR、LDR、LRD、DRL、RDL、RLD六种遍历方案。
前三种分别称为先(根)序、中(根)序、后(根)序,后三种称为逆先序、逆中序、逆后序。
通常只使用前三种。
先序遍历二叉树的操作定义为:
(1)访问根结点;
(2)先序遍历左子树;
(3)先序遍历右子树;
中序遍历二叉树的操作定义为:
(1)中序遍历左子树;
(2)访问根结点;
(3)中序遍历右子树;
后序遍历二叉树的操作定义为:
(1)后序遍历左子树;
(2)后序遍历右子树;
(3)访问根结点;
遍历算法的描述形式随存储结构的不同而不同,若定义二叉树的存储结构如下:
TYPE
Pointer=^node;
node=RECORD
data:
char;
lchild,rchild:
pointer;
END;
先序遍历二叉树的递归算法如下:
procedurepreorder(p:
pointer);
begin
ifp<>nilthenbegin
write(p^.data);
preorder(p^.lchild);
preorder(p^.rchild);
end;
end;
请完成中序遍历二叉树的递归算法:
procedureinorder(p:
pointer);
begin
end;
请完成后序遍历二叉树的递归算法:
procedurepostorder(p:
pointer);
begin
end;
二叉树的三种遍历递归算法写得非常精妙,只要对它稍加修改(主要在process语句处),就可的各种不同功能、用途的算法。
如建立二叉树、查找结点、求每个结点所处的层次、求二叉树的高度、结点个数、复制二叉树等。
§7.4二叉树的建立
二叉树的建立可分先序、中序、后序三种方法。
先序建立二叉树即输入结点数据的顺序按先序遍历所得的序列输入,输入“*”,表示该子树为空,如输入abc**d**e**,得到的二叉树如图7.4.1。
中序、后序类推。
【练习】:
请将前面遍历二叉树的算法稍加改动,分别写出先序、中序、后序建立二叉树的算法。
§7.5树的存储结构
【思考】请先不要看下面内容,如果对一棵树(不定支数),你如何设计它的存储结构?
多重链表表示法
每个结点的设m个指针域指向该结点的子数,m为树的度,结点结构如下:
很容易看出,多重链表的缺点是,当树中结点的子树数相差较大,许多结点的度小于m时,链表中有很多空指针域,空间较浪费。
双亲表示法
这种存储结构利用每个结点(除根外)只有唯一的双亲的性质,以一组连续空间存储树的结点,同时在每个结点中附设一个指示器指示其双亲结点在链表中的位置。
data
A
B
C
D
E
F
G
H
I
parent
0
1
1
2
2
3
5
5
5
1
2
3
4
5
6
7
8
9
其存储结构说明如下:
TYPEtnode=record
Data:
char;
Parent:
integer;
end;
VARtree:
array[1..maxnode]oftnode;
孩子表示法
将每个结点的孩子结点用单链表链接起来,树中n个结点就有n条孩子链(叶子的孩子链为空),而将这n条链的头结点按顺序排列起来,组成一个线性表。
如图7.5.1(a)孩子链表的存储结构说明如下:
TYPEtlink=^tnode;
Tnode=RECORD
Data:
char;
Next:
tlink;
End;
Vartree:
array[1..n]oftlink;
这种方法较适用于涉及孩子的操作,但不适用于涉及双亲的操作。
我们可以采取改进的存储方法,在每一个孩子链的头结点中加一个域,存储其双亲结点的位置,如图7.5.1(b)。
孩子兄弟表示法
又称二叉链表表示法,链表中结点的两个链接域分别指向该结点的第一个孩子结点和下一个兄弟结点。
结点结构说明如下:
TYPEtlink=^tnode;
Tnode=RECORD
Data:
char;
fch,nsib:
tlink;
END
§7.6森林与二叉树的转换
从上面树的孩子兄弟表示法可以看出,二叉树和树都可用二叉链表作为存储结构,则以二叉链表作为媒介可导出树与二叉树之间的一个对应关系。
也就是说,给定一棵树,可以找出唯一的一棵二叉树与之对应。
将一般树或森林转换成二叉树表示,其目的是为了节省存储空间。
§7.6.1树或森林转换成二叉树
树转换成二叉树的步骤如下:
①将