数据结构查找方法及原理文档格式.docx

资源描述

数据结构查找方法及原理文档格式.docx

《数据结构查找方法及原理文档格式.docx》由会员分享，可在线阅读，更多相关《数据结构查找方法及原理文档格式.docx（7页珍藏版）》请在冰豆网上搜索。

数据结构查找方法及原理文档格式.docx

（1）动态查找表和静态查找表

　若在查找的同时对表做修改操作（如插入和删除），则相应的表称之为动态查找表。

否则称之为静态查找表。

（2）内查找和外查找

　和排序类似，查找也有内查找和外查找之分。

若整个查找过程都在内存进行，则称之为内查找；

反之，若查找过程中需要访问外存，则称之为外查找。

3、平均查找长度ASL

　查找运算的主要操作是关键字的比较，所以通常把查找过程中对关键字需要执行的平均比较次数（也称为平均查找长度）作为衡量一个查找算法效率优劣的标准。

平均查找长度ASL（AverageSearchLength）定义为：

其中：

　①n是结点的个数；

　②Pi是查找第i个结点的概率。

若不特别声明，认为每个结点的查找概率相等，即

pl=p2…=pn=1/n

　③ci是找到第i个结点所需进行的比较次数。

注意：

　为了简单起见，假定表中关键字的类型为整数：

typedefintKeyType；

//KeyType应由用户定义

顺序查找（SequentialSearch）

　在表的组织方式中，线性表是最简单的一种。

顺序查找是一种最简单的查找方法。

1、顺序查找的基本思想

　基本思想是：

从表的一端开始，顺序扫描线性表，依次将扫描到的结点关键宇和给定值K相比较。

若当前扫描到的结点关键字与K相等，则查找成功；

若扫描结束后，仍未找到关键字等于K的结点，则查找失败。

2、顺序查找的存储结构要求

　　顺序查找方法既适用于线性表的顺序存储结构，也适用于线性表的链式存储结构（使用单链表作存储结构时，扫描必须从第一个结点开始）。

3、基于顺序结构的顺序查找算法

（1）类型说明

typedefstruct{

KeyTypekey；

InfoTypeotherinfo；

//此类型依赖于应用

}NodeType；

typedefNodeTypeSeqList[n+1]；

//0号单元用作哨兵

（2）具体算法

intSeqSearch（SeqlistR，KeyTypeK）

{//在顺序表R[1..n]中顺序查找关键字为K的结点，

//成功时返回找到的结点位置，失败时返回0

inti；

R[0].key=K；

//设置哨兵

for（i=n；

R[i].key!

=K;

i--）；

//从表后往前找

returni；

//若i为0，表示查找失败，否则R[i]是要找的结点

}//SeqSearch

　监视哨设在高端的顺序查找【参见练习】

（3）算法分析

①算法中监视哨R[0]的作用

为了在for循环中省去判定防止下标越界的条件i≥1，从而节省比较的时间。

②成功时的顺序查找的平均查找长度：

　在等概率情况下，pi=1/n（1≤i≤n），故成功的平均查找长度为

（n+…+2+1）/n=（n+1）/2

即查找成功时的平均比较次数约为表长的一半。

　若K值不在表中，则须进行n+1次比较之后才能确定查找失败。

③表中各结点的查找概率并不相等的ASL

顺序查找演示过程【动画演示】

　【例】在由全校学生的病历档案组成的线性表中，体弱多病同学的病历的查找概率必然高于健康同学的病历，由于上式的ASLsq在pn≥pn-1≥…≥p2≥p1时达到最小值。

若事先知道表中各结点的查找概率不相等和它们的分布情况，则应将表中结点按查找概率由小到大地存放，以便提高顺序查找的效率。

　为了提高查找效率，对算法SeqSearch做如下修改：

每当查找成功，就将找到的结点和其后继（若存在）结点交换。

这样，使得查找概率大的结点在查找过程中不断往后移，便于在以后的查找中减少比较次数。

④顺序查找的优点

　算法简单，且对表的结构无任何要求，无论是用向量还是用链表来存放结点，也无论结点之间是否按关键字有序，它都同样适用。

⑤顺序查找的缺点

　　查找效率低，因此，当n较大时不宜采用顺序查找。

二分查找

1、二分查找（BinarySearch）

　二分查找又称折半查找，它是一种效率较高的查找方法。

　二分查找要求：

线性表是有序表，即表中结点按关键字有序，并且要用向量作为表的存储结构。

不妨设有序表是递增有序的。

2、二分查找的基本思想

　二分查找的基本思想是：

（设R[low..high]是当前的查找区间）

（1）首先确定该区间的中点位置：

（2）然后将待查的K值与R[mid].key比较：

若相等，则查找成功并返回此位置，否则须确定新的查找区间，继续二分查找，具体方法如下：

　①若R[mid].key>

K，则由表的有序性可知R[mid..n].keys均大于K，因此若表中存在关键字等于K的结点，则该结点必定是在位置mid左边的子表R[1..mid-1]中，故新的查找区间是左子表R[1..mid-1]。

　②类似地，若R[mid].key<

K，则要查找的K必在mid的右子表R[mid+1..n]中，即新的查找区间是右子表R[mid+1..n]。

下一次查找是针对新的查找区间进行的。

　因此，从初始的查找区间R[1..n]开始，每经过一次与当前查找区间的中点位置上的结点关键字的比较，就可确定查找是否成功，不成功则当前的查找区间就缩小一半。

这一过程重复直至找到关键字为K的结点，或者直至当前的查找区间为空（即查找失败）时为止。

3、二分查找算法

intBinSearch（SeqListR，KeyTypeK）

{//在有序表R[1..n]中进行二分查找，成功时返回结点的位置，失败时返回零

intlow=1，high=n，mid；

//置当前查找区间上、下界的初值

while（low<

=high）{//当前查找区间R[low..high]非空

mid=（low+high）/2；

if（R[mid].key==K）returnmid；

//查找成功返回

if（R[mid].kdy>

K）

high=mid-1;

//继续在R[low..mid-1]中查找

else

low=mid+1；

//继续在R[mid+1..high]中查找

}

return0；

//当low>

high时表示查找区间为空，查找失败

}//BinSeareh

二分查找算法亦很容易给出其递归程序【参见练习】

4、二分查找算法的执行过程

　　设算法的输入实例中有序的关键字序列为

（05，13，19，21，37，56，64，75，80，88，92）

要查找的关键字K分别是21和85。

具体查找过程【参见动画演示】

5、二分查找判定树

　二分查找过程可用二叉树来描述：

把当前查找区间的中间位置上的结点作为根，左子表和右子表中的结点分别作为根的左子树和右子树。

由此得到的二叉树，称为描述二分查找的判定树（DecisionTree）或比较树（ComparisonTree）。

　判定树的形态只与表结点个数n相关，而与输入实例中R[1..n].keys的取值无关。

　【例】具有11个结点的有序表可用下图所示的判定树来表示。

（1）二分查找判定树的组成

　　①圆结点即树中的内部结点。

树中圆结点内的数字表示该结点在有序表中的位置。

　　②外部结点：

圆结点中的所有空指针均用一个虚拟的方形结点来取代，即外部结点。

　　③树中某结点i与其左（右）孩子连接的左（右）分支上的标记"

、"

（"

）"

表示：

当待查关键字K<

R[i].key（K>

R[i].key）时，应走左（右）分支到达i的左（右）孩子，将该孩子的关键字进一步和K比较。

若相等，则查找过程结束返回，否则继续将K与树中更下一层的结点比较。

（2）二分查找判定树的查找

　　二分查找就是将给定值K与二分查找判定树的根结点的关键字进行比较。

若相等，成功。

否则若小于根结点的关键字，到左子树中查找。

若大于根结点的关键字，则到右子树中查找。

　　【例】对于有11个结点的表，若查找的结点是表中第6个结点，则只需进行一次比较；

若查找的结点是表中第3或第9个结点，则需进行二次比较；

找第1，4，7，10个结点需要比较三次；

找到第2，5，8，11个结点需要比较四次。

　由此可见，成功的二分查找过程恰好是走了一条从判定树的根到被查结点的路径，经历比较的关键字次数恰为该结点在树中的层数。

若查找失败，则其比较过程是经历了一条从判定树根到某个外部结点的路径，所需的关键字比较次数是该路径上内部结点的总数。

【例】待查表的关键字序列为：

（05，13，19，21，37，56，64，75，80，88，92），若要查找K=85的记录，所经过的内部结点为6、9、10，最后到达方形结点"

9-10"

，其比较次数为3。

　实际上方形结点中"

i-i+1"

的含意为被查找值K是介于R[i].key和R[i+1].key之间的，即R[i].key<

R[i+1].key。

（3）二分查找的平均查找长度

　设内部结点的总数为n=2h-1，则判定树是深度为h=lg（n+1）的满二叉树（深度h不计外部结点）。

树中第k层上的结点个数为2k-1，查找它们所需的比较次数是k。

因此在等概率假设下，二分查找成功时的平均查找长度为：

ASLbn≈lg（n+1）-1

　　二分查找在查找失败时所需比较的关键字个数不超过判定树的深度，在最坏情况下查找成功的比较次数也不超过判定树的深度。

即为：

　　二分查找的最坏性能和平均性能相当接近。

6、二分查找的优点和缺点

　　虽然二分查找的效率高，但是要将表按关键字排序。

而排序本身是一种很费时的运算。

既使采用高效率的排序方法也要花费O（nlgn）的时间。

　　二分查找只适用顺序存储结构。

为保持表的有序性，在顺序结构里插入和删除都必须移动大量的结点。

因此，二分查找特别适用于那种一经建立就很少改动、而又经常需要查找的线性表。

　　对那些查找少而又经常需要改动的线性表，可采用链表作存储结构，进行顺序查找。

链表上无法实现二分查找。

分块查找

　分块查找（BlockingSearch）又称索引顺序查找。

它是一种性能介于顺序查找和二分查找之间的查找方法。

1、二分查找表存储结构

　二分查找表由"

分块有序"

的线性表和索引表组成。

（1）"

的线性表

　表R[1..n]均分为b块，前b-1块中结点个数为，第b块的结点数小于等于s；

每一块中的关键字不一定有序，但前一块中的最大关键字必须小于后一块中的最小关键字，即表是"

的。

（2）索引表

　抽取各块中的最大关键字及其起始位置构成一个索引表ID[l

展开阅读全文