全国计算机二级第1章数据结构与算法.docx

资源描述

全国计算机二级第1章数据结构与算法.docx

《全国计算机二级第1章数据结构与算法.docx》由会员分享，可在线阅读，更多相关《全国计算机二级第1章数据结构与算法.docx（10页珍藏版）》请在冰豆网上搜索。

全国计算机二级第1章数据结构与算法.docx

全国计算机二级第1章数据结构与算法

考点1算法的复杂度

【考点精讲】

1．算法的基本概念

计算机算法为计算机解题的过程实际上是在实施某种算法。

算法的基本特征：

可行性、确定性、有穷性、拥有足够的情报。

2．算法复杂度

算法复杂度包括时间复杂度和空间复杂度。

名称

描述

时间复杂度

是指执行算法所需要的计算工作量

空间复杂度

是指执行这个算法所需要的内存空间

考点2逻辑结构和存储结构

【考点精讲】

1．逻辑结构

数据的逻辑结构是对数据元素之间的逻辑关系的描述，它可以用一个数据元素的集合和定义在此集合中的若干关系来表示。

数据的逻辑结构有两个要素：

一是数据元素的集合，通常记为D；二是D上的关系，它反映了数据元素之间的前后件关系，通常记为R。

一个数据结构可以表示成

B=（D，R）

其中B表示数据结构。

为了反映D中各数据元素之间的前后件关系，一般用二元组来表示。

例如，如果把一年四季看作一个数据结构，则可表示成

B=（D,R）

D={春季，夏季，秋季，冬季}

R={（春季，夏季）,（夏季，秋季），（秋季，冬季）}

复杂程度，一般将数据结构分为两大类型：

线性结构与非线性结构。

如果一个非空的数据结构满足下列两个条件：

（1）有且只有一个根结点；

（2）每一个结点最多有一个前件，也最多有一个后件。

则称该数据结构为线性结构。

线性结构又称线性表。

在一个线性结构中插入或删除任何一个结点后还应是线性结构。

栈、队列、串等都线性结构。

如果一个数据结构不是线性结构，则称之为非线性结构。

数组、广义表、树和图等数据结构都是非线性结构。

考点4栈

【考点精讲】

1．栈的基本概念

栈（stack）是一种特殊的线性表，是限定只在一端进行插入与删除的线性表。

在栈中，一端是封闭的，既不允许进行插入元素，也不允许删除元素；另一端是开口的，允许插入和删除元素。

通常称插入、删除的这一端为栈顶，另一端为栈底。

当表中没有元素时称为空栈。

栈顶元素总是后被插入的元素，从而也是最先被删除的元素；栈底元素总是最先被插入的元素，从而也是最后才能被删除的元素。

栈是按照“先进后出”或“后进先出”的原则组织数据的。

例如，枪械的子弹匣就可以用来形象的表示栈结构。

子弹匣的一端是完全封闭的，最后被压入弹匣的子弹总是最先被弹出，而最先被压入的子弹最后才能被弹出。

2．栈的顺序存储及其运算

栈的基本运算有三种：

入栈、退栈与读栈顶元素。

（1）入栈运算：

入栈运算是指在栈顶位置插入一个新元素。

（2）退栈运算：

退栈是指取出栈顶元素并赋给一个指定的变量。

（3）读栈顶元素：

读栈顶元素是指将栈顶元素赋给一个指定的变量。

考点5队列

【考点精讲】

1．队列的基本概念

队列是只允许在一端进行删除，在另一端进行插入的顺序表，通常将允许删除的这一端称为队头，允许插入的这一端称为队尾。

当表中没有元素时称为空队列。

队列的修改是依照先进先出的原则进行的，因此队列也称为先进先出的线性表，或者后进后出的线性表。

例如：

火车进遂道，最先进遂道的是火车头，最后是火车尾，而火车出遂道的时候也是火车头先出，最后出的是火车尾。

若有队列：

Q=（q1，q2，…，qn）

那么，q1为队头元素（排头元素），qn为队尾元素。

队列中的元素是按照q1，q2，…，qn的顺序进入的，退出队列也只能按照这个次序依次退出，即只有在q1，q2，…，qn-1都退队之后，qn才能退出队列。

因最先进入队列的元素将最先出队，所以队列具有先进先出的特性，体现“先来先服务”的原则。

队头元素q1是最先被插入的元素，也是最先被删除的元素。

队尾元素qn是最后被插入的元素，也是最后被删除的元素。

因此，与栈相反，队列又称为“先进先出”（FirstInFirstOut，简称FIFO）或“后进后出”（LastInLastOut，简称LILO）的线性表。

入队运算为往队列队尾插入一个数据元素，退队运算为从队列的队头删除一个数据元素。

考点6链表

【考点精讲】

在链式存储方式中，要求每个结点由两部分组成：

一部分用于存放数据元素值，称为数据域，另一部分用于存放指针，称为指针域。

其中指针用于指向该结点的前一个或后一个结点（即前件或后件）。

链式存储方式既可用于表示线性结构，也可用于表示非线性结构。

（1）线性链表

线性表的链式存储结构称为线性链表。

在某些应用中，对线性链表中的每个结点设置两个指针，一个称为左指针，用以指向其前件结点；另一个称为右指针，用以指向其后件结点。

这样的表称为双向链表。

在线性链表中，各数据元素结点的存储空间可以是不连续的，且各数据元素的存储顺序与逻辑顺序可以不一致。

在线性链表中进行插入与删除，不需要移动链表中的元素。

（2）带链的栈

栈也是线性表，也可以采用链式存储结构。

带链的栈可以用来收集计算机存储空间中所有空闲的存储结点，这种带链的栈称为可利用栈。

考点7二叉树及其基本性质

【考点精讲】

1、二叉树及其基本概念

二叉树是一种很有用的非线性结构，具有以下两个特点：

①非空二叉树只有一个根结点；

②每一个结点最多有两棵子树，且分别称为该结点的左子树和右子树。

在二叉树中，每一个结点的度最大为2，即所有子树（左子树或右子树）也均为二叉树。

另外，二叉树中的每个结点的子树被明显地分为左子树和右子树。

在二叉树中，一个结点可以只有左子树而没有右子树，也可以只有右子树而没有左子树。

当一个结点既没有左子树也没有右子树时，该结点即为叶子结点。

例如，一个家族中的族谱关系如图1-1所示：

A有后代B，C；

B有后代D，E；C有后代F；

典型的二叉树如图1-1所示：

下面就图1-1详细讲解二叉树的一些基本概念。

图1-1族谱二叉树

父结点（根）

在树结构中，每一个结点只有一个前件，称为父结点，没有前件的结点只有一个，称为树的根结点，简称树的根。

例如，在图1-1中，结点A是树的根结点。

子结点和

叶子结点

在树结构中，每一个结点可以有多个后件，称为该结点的子结点。

没有后件的结点称为叶子结点。

例如，在图1-1中，结点D，E，F均为叶子结点。

度

在树结构中，一个结点所拥有的后件的个数称为该结点的度，所有结点中最大的度称为树的度。

例如，在图1-1中，根结点A和结点B的度为2，结点C的度为1，叶子结点D，E，F的度为0。

所以，该树的度为2。

深度

定义一棵树的根结点所在的层次为1，其他结点所在的层次等于它的父结点所在的层次加1。

树的最大层次称为树的深度。

例如，在图1-1中，根结点A在第1层，结点B，C在第2层，结点D，E，F在第3层。

该树的深度为3。

子树

在树中，以某结点的一个子结点为根构成的树称为该结点的一棵子树。

2、二叉树基本性质

二叉树具有以下几个性质：

性质1：

在二叉树的第k层上，最多有2k-1（k≥1）个结点；

性质2：

深度为m的二叉树最多有2m-1个结点；

性质3：

在任意一棵二叉树中，度为0的结点（即叶子结点）总是比度为2的结点多一个。

性质4：

具有n个结点的二叉树，其深度至少为［log2n］+1，其中［log2n］表示取log2n的整数部分。

3、满二叉树与完全二叉树

满二叉树是指这样的一种二叉树：

除最后一层外，每一层上的所有结点都有两个子结点。

在满二叉树中，每一层上的结点数都达到最大值，即在满二叉树的第k层上有2k-1个结点，且深度为m的满二叉树有2m－1个结点。

完全二叉树是指这样的二叉树：

除最后一层外，每一层上的结点数均达到最大值；在最后一层上只缺少右边的若干结点。

对于完全二叉树来说，叶子结点只可能在层次最大的两层上出现：

对于任何一个结点，若其右分支下的子孙结点的最大层次为p，则其左分支下的子孙结点的最大层次或为p，或为p+1。

完全二叉树具有以下两个性质：

性质5：

具有n个结点的完全二叉树的深度为［log2n］+1。

性质6：

设完全二叉树共有n个结点。

如果从根结点开始，按层次（每一层从左到右）用自然数1，2，……，n给结点进行编号，则对于编号为k（k=1，2，……，n）的结点有以下结论：

①若k=1，则该结点为根结点，它没有父结点；若k>1，则该结点的父结点编号为INT（k/2）。

②若2k≤n，则编号为k的结点的左子结点编号为2k；否则该结点无左子结点（显然也没有右子结点）。

③若2k+1≤n，则编号为k的结点的右子结点编号为2k+1；否则该结点无右子结点。

考点8二叉树的遍历

【考点精讲】

在遍历二叉树的过程中，一般先遍历左子树，再遍历右子树。

在先左后右的原则下，根据访问根结点的次序，二叉树的遍历分为三类：

前序遍历、中序遍历和后序遍历。

（1）前序遍历：

先访问根结点、然后遍历左子树，最后遍历右子树；并且，在遍历左、右子树时，仍然先访问根结点，然后遍历左子树，最后遍历右子树。

例如，对图1-1中的二叉树进行前序遍历的结果（或称为该二叉树的前序序列）为：

A，B，D，E，C，F。

（2）中序遍历：

先遍历左子树、然后访问根结点，最后遍历右子树；并且，在遍历左、右子树时，仍然先遍历左子树，然后访问根结点，最后遍历右子树。

例如，对图1-1中的二叉树进行中序遍历的结果（或称为该二叉树的中序序列）为：

D，B，E，A，C，F。

（3）后序遍历：

先遍历左子树、然后遍历右子树，最后访问根结点；并且，在遍历左、右子树时，仍然先遍历左子树，然后遍历右子树，最后访问根结点。

例如，对图1-1中的二叉树进行后序遍历的结果（或称为该二叉树的后序序列）为：

D，E，B，F，C，A。

考点9顺序查找

【考点精讲】

查找是指在一个给定的数据结构中查找某个指定的元素。

从线性表的第一个元素开始，依次将线性表中的元素与被查找的元素相比较，若相等则表示查找成功；若线性表中所有的元素都与被查找元素进行了比较但都不相等，则表示查找失败。

例如，在一维数组[21，46，24，99，57，77，86]中，查找数据元素98，首先从第1个元素21开始进行比较，与要查找的数据不相等，接着与第2个元素46进行比较，以此类推，当进行到与第4个元素比较时，它们相等，所以查找成功。

如果查找数据元素100，则整个线性表扫描完毕，仍未找到与100相等的元素，表示线性表中没有要查找的元素。

在下列两种情况下也只能采用顺序查找：

（1）如果线性表为无序表，则不管是顺序存储结构还是链式存储结构，只能用顺序查找。

（2）即使是有序线性表，如果采用链式存储结构，也只能用顺序查找。

考点10二分法查找

【考点精讲】

二分法查找，也称拆半查找，是一种高效的查找方法。

能使用二分法查找的线性表必须满足两个条件：

用顺序存储结构；

线性表是有序表。

在本书中，为了简化问题，而更方便讨论，“有序”是特指元素按非递减排列，即从小到大排列，但允许相邻元素相等。

下一节排序中，有序的含义也是如此。

对于长度为n的有序线性表，利用二分法查找元素X的过程如下。

步骤1：

将X与线性表的中间项比较：

步骤2：

如果X的值与中间项的值相等，则查找成功，结束查找；

步骤3：

如果X小于中间项的值，则在线性表的前半部分以二分法继续查找；

步骤4：

如果X大于中间项的值，则在线性表的后半部分以二分法继续查找。

例如，长度为8的线性表关键码序列为：

[6，13，27，30，38，46，47，70]，被查元素为38，首先将与线性表的中间项比较，即与第4个数据元素30相比较，38大于中间项30的值，则在线性表[38，46，47，70]继续查找；接着与中间项比较，即与第2个元素46相比较，38小于46，则在线性表[38]继续查找，最后一次比较相等，查找成功。

顺序查找法每一次比较，只将查找范围减少1，而二分法查找，每比较一次，可将查找范围减少为原来的一半，效率大大提高。

对于长度为n的有序线性表，在最坏情况下，二分法查找只需比较log2n次，而顺序查找需要比较n次。

考点11排序

【考点精讲】

冒泡排序法和快速排序法都属于交换类排序法。

（1）冒泡排序法

首先，从表头开始往后扫描线性表，逐次比较相邻两个元素的大小，若前面的元素大于后面的元素，则将它们互换，不断地将两个相邻元素中的大者往后移动，最后最大者到了线性表的最后。

然后，从后到前扫描剩下的线性表，逐次比较相邻两个元素的大小，若后面的元素小于前面的元素，则将它们互换，不断地将两个相邻元素中的小者往前移动，最后最小者到了线性表的最前面。

对剩下的线性表重复上述过程，直到剩下的线性表变空为止，此时已经排好序。

在最坏的情况下，冒泡排序需要比较次数为n（n－1）/2。

（2）快速排序法

任取待排序序列中的某个元素作为基准（一般取第一个元素），通过一趟排序，将待排元素分为左右两个子序列，左子序列元素的排序码均小于或等于基准元素的排序码，右子序列的排序码则大于基准元素的排序码，然后分别对两个子序列继续进行排序，直至整个序列有序。

展开阅读全文