(3)二分查找的平均查找长度
设内部结点的总数为n=2h-1,则判定树是深度为h=lg(n+1)的满二叉树(深度h不计外部结点)。
树中第k层上的结点个数为2k-1,查找它们所需的比较次数是k。
因此在等概率假设下,二分查找成功时的平均查找长度为:
ASLbn≈lg(n+1)-1
二分查找在查找失败时所需比较的关键字个数不超过判定树的深度,在最坏情况下查找成功的比较次数也不超过判定树的深度。
即为:
二分查找的最坏性能和平均性能相当接近。
6、二分查找的优点和缺点
虽然二分查找的效率高,但是要将表按关键字排序。
而排序本身是一种很费时的运算。
既使采用高效率的排序方法也要花费O(nlgn)的时间。
二分查找只适用顺序存储结构。
为保持表的有序性,在顺序结构里插入和删除都必须移动大量的结点。
因此,二分查找特别适用于那种一经建立就很少改动、而又经常需要查找的线性表。
对那些查找少而又经常需要改动的线性表,可采用链表作存储结构,进行顺序查找。
链表上无法实现二分查找。
第八章查找(四)顺序表的分块查找
4.分块查找
分块查找(BlockingSearch)又称索引顺序查找。
它是一种性能介于顺序查找和二分查找之间的查找方法。
1、二分查找表存储结构
二分查找表由"分块有序"的线性表和索引表组成。
(1)"分块有序"的线性表
表R[1..n]均分为b块,前b-1块中结点个数为
,第b块的结点数小于等于s;每一块中的关键字不一定有序,但前一块中的最大关键字必须小于后一块中的最小关键字,即表是"分块有序"的。
(2)索引表
抽取各块中的最大关键字及其起始位置构成一个索引表ID[l..b],即:
ID[i](1≤i≤b)中存放第i块的最大关键字及该块在表R中的起始位置。
由于表R是分块有序的,所以索引表是一个递增有序表。
【例】下图就是满足上述要求的存储结构,其中R只有18个结点,被分成3块,每块中有6个结点,第一块中最大关键字22小于第二块中最小关键字24,第二块中最大关键字48小于第三块中最小关键字49。
2、分块查找的基本思想
分块查找的基本思想是:
(1)首先查找索引表
索引表是有序表,可采用二分查找或顺序查找,以确定待查的结点在哪一块。
(2)然后在已确定的块中进行顺序查找
由于块内无序,只能用顺序查找。
3、分块查找示例
【例】对于上例的存储结构:
(1)查找关键字等于给定值K=24的结点
因为索引表小,不妨用顺序查找方法查找索引表。
即首先将K依次和索引表中各关键字比较,直到找到第1个关键宇大小等于K的结点,由于K<48,所以关键字为24的结点若存在的话,则必定在第二块中;然后,由ID[2].addr找到第二块的起始地址7,从该地址开始在R[7..12]中进行顺序查找,直到R[11].key=K为止。
(2)查找关键字等于给定值K=30的结点
先确定第二块,然后在该块中查找。
因该块中查找不成功,故说明表中不存在关键字为30的结点。
具体过程【参见动画演示】
4、算法分析
(1)平均查找长度ASL
分块查找是两次查找过程。
整个查找过程的平均查找长度是两次查找的平均查找长度之和。
①以二分查找来确定块,分块查找成功时的平均查找长度
ASLblk=ASLbn+ASLsq≈lg(b+1)-1+(s+1)/2≈lg(n/s+1)+s/2
②以顺序查找确定块,分块查找成功时的平均查找长度
ASL'blk=(b+1)/2+(s+1)/2=(s2+2s+n)/(2s)
注意:
当s=
时ASL'blk取极小值
+1,即当采用顺序查找确定块时,应将各块中的结点数选定为
。
【例】若表中有10000个结点,则应把它分成100个块,每块中含100个结点。
用顺序查找确定块,分块查找平均需要做100次比较,而顺序查找平均需做5000次比较,二分查找最多需14次比较。
注意:
分块查找算法的效率介于顺序查找和二分查找之间。
(2)块的大小
在实际应用中,分块查找不一定要将线性表分成大小相等的若干块,可根据表的特征进行分块。
【例】一个学校的学生登记表,可按系号或班号分块。
(3)结点的存储结构
各块可放在不同的向量中,也可将每一块存放在一个单链表中。
(4)分块查找的优点
分块查找的优点是:
①在表中插入或删除一个记录时,只要找到该记录所属的块,就在该块内进行插入和删除运算。
②因块内记录的存放是任意的,所以插入或删除比较容易,无须移动大量记录。
分块查找的主要代价是增加一个辅助数组的存储空间和将初始表分块排序的运算。
第八章查找(五)二叉排序树和它的建立当用线性表作为表的组织形式时,可以有三种查找法。
其中以二分查找效率最高。
但由于二分查找要求表中结点按关键字有序,且不能用链表作存储结构,因此,当表的插入或删除操作频繁时,为维护表的有序性,势必要移动表中很多结点。
这种由移动结点引起的额外时间开销,就会抵消二分查找的优点。
也就是说,二分查找只适用于静态查找表。
若要对动态查找表进行高效率的查找,可采用下面介绍的几种特殊的二叉树或树作为表的组织形式。
不妨将它们统称为树表。
下面将分别讨论在这些树表上进行查找和修改操作的方法。
5.二叉排序树
1、二叉排序树的定义
二叉排序树(BinarySortTree)又称二叉查找(搜索)树(BinarySearchTree)。
其定义为:
二叉排序树或者是空树,或者是满足如下性质的二叉树:
①若它的左子树非空,则左子树上所有结点的值均小于根结点的值;
②若它的右子树非空,则右子树上所有结点的值均大于根结点的值;
③左、右子树本身又各是一棵二叉排序树。
上述性质简称二叉排序树性质(BST性质),故二叉排序树实际上是满足BST性质的二叉树。
2、二叉排序树的特点
由BST性质可得:
(1)二叉排序树中任一结点x,其左(右)子树中任一结点y(若存在)的关键字必小(大)于x的关键字。
(2)二叉排序树中,各结点关键字是惟一的。
注意:
实际应用中,不能保证被查找的数据集中各元素的关键字互不相同,所以可将二叉排序树定义中BST性质
(1)里的"小于"改为"大于等于",或将BST性质
(2)里的"大于"改为"小于等于",甚至可同时修改这两个性质。
(3)按中序遍历该树所得到的中序序列是一个递增有序序列。
【例】下图所示的两棵树均是二叉排序树,它们的中序序列均为有序序列:
2,3,4,5,7,8。
3、二叉排序树的存储结构
typedefintKeyType;//假定关键字类型为整数
typedefstructnode{//结点类型
KeyTypekey;//关键字项
InfoTypeotherinfo;//其它数据域,InfoType视应用情况而定,下面不处理它
structnode*lchild,*rchild;//左右孩子指针
}BSTNode;
typedefBSTNode*BSTree;//BSTree是二叉排序树的类型
4、二叉排序树上的运算
(1)二叉排序树的插入和生成
①二叉排序树插入新结点的过程
在二叉排序树中插入新结点,要保证插入后仍满足BST性质。
其插入过程是:
(a)若二叉排序树T为空,则为待插入的关键字key申请一个新结点,并令其为根;
(b)若二叉排序树T不为空,则将key和根的关键字比较:
(i)若二者相等,则说明树中已有此关键字key,无须插入。
(ii)若key (iii)若key>T→key,则将它插入根的右子树中。
子树中的插入过程与上述的树中插入过程相同。
如此进行下去,直到将key作为一个新的叶结点的关键字插入到二叉排序树中,或者直到发现树中已有此关键字为止。
②二叉排序树插入新结点的递归算法
【参见参考书目】
③二叉排序树插入新结点的非递归算法
voidInsertBST(BSTree*Tptr,KeyTypekey)
{//若二叉排序树*Tptr中没有关键字为key,则插入,否则直接返回
BSTNode*f,*p=*TPtr;//p的初值指向根结点
while(p){//查找插入位置
if(p->key==key)return;//树中已有key,无须插入
f=p;//f保存当前查找的结点
p=(keykey)?
p->lchild:
p->rchild;
//若keykey,则在左子树中查找,否则在右子树中查找
}//endwhile
p=(BSTNode*)malloc(sizeof(BSTNode));
p->key=key;p->lchild=p->rchild=NULL;//生成新结点
if(*TPtr==NULL)//原树为空
*Tptr=p;//新插入的结点为新的根
else//原树非空时将新结点关p作为关f的左孩子或右孩子插入
if(keykey)
f->lchild=p;
elsef->rchild=p;
}//InsertBST
④二叉排序树的生成
二叉排序树的生成,是从空的二叉排序树开始,每输入一个结点数据,就调用一次插入算法将它插入到当前已生成的二叉排序树中。
生成二叉排序树的算法如下:
BSTreeCreateBST(void)
{//输入一个结点序列,建立一棵二叉排序树,将根结点指针返回
BSTreeT=NULL;//初始时T为空树
KeyTypekey;
scanf("%d",&key);//读人一个关键字
while(key){//假设key=0是输人结束标志
InsertBST(&T,key);//将key插入二叉排序树T
scanf("%d",&key);//读人下一关键字
}
returnT;//返回建立的二叉排序树的根指针
}//BSTree
⑤二叉排序树的生成过程
由输入实例(5,3,7,2,4,8),根据生成二叉排序树算法生成二叉排序树的过程【参见动画演示】
注意:
输入序列决定了二叉排序树的形态。
二叉排序树的中序序列是一个有序序列。
所以对于一个任意的关键字序列构造一棵二叉排序树,其实质是对此关键字序列进行排序,使其变为有序序列。
"排序树"的名称也由此而来。
通常将这种排序称为树排序(TreeSort),可以证明这种排序的平均执行时间亦为O(nlgn)。
对相同的输入实例,树排序的执行时间约为堆排序的2至3倍。
因此在一般情况下,构造二叉排序树的目的并非为了排序,而是用它来加速查找,这是因为在一个有序的集合上查找通常比在无序集合上查找更快。
因此,人们又常常将二叉排序树称为二叉查找树。
第五章查找(六)二叉排序树的删除
(2)二叉排序树的删除
从二叉排序树中删除一个结点,不能把以该结点为根的子树都删去,并且还要保证删除后所得的二叉树仍然满足BST性质。
①删除操作的一般步骤
(1)进行查找
查找时,令p指向当前访问到的结点,parent指向其双亲(其初值为N