全国计算机等级考试二级教程自我整理版公共基础知识大纲.docx
《全国计算机等级考试二级教程自我整理版公共基础知识大纲.docx》由会员分享,可在线阅读,更多相关《全国计算机等级考试二级教程自我整理版公共基础知识大纲.docx(37页珍藏版)》请在冰豆网上搜索。
全国计算机等级考试二级教程自我整理版公共基础知识大纲
全国计算机等级考试二级教程——公共基础知识考试大纲
◆基本要求
1.掌握算法的基本概念。
2.掌握基本数据结构及其操作。
3.掌握基本排序和查找算法。
4.掌握逐步求精的结构化程序设计方法。
5.掌握软件工程的基本方法,具有初步应用相关技术进行软件开发的能力。
6.掌握数据库的基本知识,了解关系数据库的设计。
◆考试内容
一、基本数据结构与算法
1.算法的基本概念;算法复杂度的概念和意义(时间复杂度与空间复杂度)。
2.数据结构的定义;数据的逻辑结构与存储结构;数据结构的图形表示;线性结构与非线性结构的概念。
3.线性表的定义;线性表的顺序存储结构及其插入与删除运算。
4.栈和队列的定义;栈和队列的顺序存储结构及其基本运算。
5.线性单链表、双向链表与循环链表的结构及其基本运算。
6.树的基本概念;二叉树的定义及其存储结构;二叉树的前序、中序和后序遍历。
7.顺序查找与二分法查找算法;基本排序算法(交换类排序,选择类排序,插入类排序)。
二、程序设计基础
1.程序设计方法与风格。
2.结构化程序设计。
3.面向对象的程序设计方法,对象,方法,属性及继承与多态性。
三、软件工程基础
1.软件工程基本概念,软件生命周期概念,软件工具与软件开发环境。
2.结构化分析方法,数据流图,数据字典,软件需求规格说明书。
3.结构化设计方法,总体设计与详细设计。
4.软件测试的方法,白盒测试与黑盒测试,测试用例设计,软件测试的实施,单元测试、集成测试和系统测试。
5.程序的调试,静态调试与动态调试。
四、数据库设计基础
1.数据库的基本概念:
数据库,数据库管理系统,数据库系统。
2.数据模型,实体联系模型及E-R图,从E-R图导出关系数据模型。
3.关系代数运算,包括集合运算及选择、投影、连接运算,数据库规范化理论。
4.数据库设计方法和步骤:
需求分析、概念设计、逻辑设计和物理设计的相关策略。
◆考试方式
公共基础知识有10道选择题和5道填空题共三十分
第一章数据结构与算法
1.1算法
1、算法是一组有穷指令集,是解题方案的准确而完整的描述。
换句话说,算法是对特定问题求解步骤的一种描述。
*:
算法不等于程序,也不等于计算方法。
程序的编制不可能优于算法的设计(注释1)。
2、算法的基本特征
(1)可行性。
针对实际问题而设计的算法,执行后能够得到满意的结果。
(2)确定性。
每一条指令的含义明确,无二义性。
并且在任何条件下,算法只有唯一的一条执行路径,即相同的输入只能得出相同的输出。
(3)有穷性。
算法必须在有限的时间内完成。
有两重含义,一是算法中的操作步骤为有限个,二是每个步骤都能在有限时间内完成。
(4)拥有足够的情报。
算法中各种运算总是要施加到各个运算对象上,而这些运算对象又可能具有某种初始状态,这就是算法执行的起点或依据。
因此,一个算法执行的结果总是与输入的初始数据有关,不同的输入将会有不同的结果输出。
当输入不够或输入错误时,算法将无法执行或执行有错。
一般说来,当算法拥有足够的情报时,此算法才是有效的;而当提供的情报不够时,算法可能无效。
*:
综上所述,所谓算法,是一组严谨地定义运算顺序的规则,并且每一个规则都是有效的,且是明确的,此顺序将在有限的次数下终止。
3、算法的基本要素:
一是对数据对象的运算和操作;二是算法的控制结构。
指令系统:
一个计算机系统能执行的所有指令的集合。
基本运算和操作包括:
算术运算、逻辑运算、关系运算、数据传输。
算法的三种基本控制结构:
顺序结构、选择结构、循环结构。
算法基本设计方法:
列举法、归纳法、递推、递归、减半递推技术、回溯法。
4、算法效率的度量—算法复杂度。
算法复杂度主要包括时间复杂度和空间复杂度。
(1)算法时间复杂度是指执行算法所需要的计算工作量,可以用执行算法的过程中所需基本运算的执行次数来度量。
通常,一个算法所用的时间包括编译时间和运行时间。
(2)算法空间复杂度是指执行这个算法所需要的内存空间。
(注释1)这是因为:
在编写程序时要受到计算机系统运行环境的限制,程序通常还要考虑很多与方法和分析无关的细节问题。
1.2数据结构的基本概念
1、数据结构是指相互有关联的数据元素的集合。
2、数据结构主要研究和讨论以下三个方面的问题:
(1)数据集合中各数据元素之间所固有的逻辑关系,即数据的逻辑结构。
数据的逻辑结构包含:
1)表示数据元素的信息;
2)表示各数据元素之间的前后件关系(指逻辑关系,与存储位置无关)。
(2)在对数据进行处理时,各数据元素在计算机中的存储关系,即数据的存储结构,也称数据物理结构。
数据的存储结构有顺序、链接、索引等。
1)顺序存储。
它是把逻辑上相邻的结点存储在物理位置相邻的存储单元里,结点间的逻辑关系由存储单元的邻接关系来体现。
由此得到的存储表示称为顺序存储结构。
2)链接存储。
它不要求逻辑上相邻的结点在物理位置上亦相邻,结点间的逻辑关系是由附加的指针字段表示的。
由此得到的存储表示称为链式存储结构。
3)索引存储:
除建立存储结点信息外,还建立附加的索引表来标识结点的地址。
*:
数据的逻辑结构反映数据元素之间的逻辑关系,数据的存储结构(也称数据的物理结构)是数据的逻辑结构在计算机存储空间中的存放形式。
同一种逻辑结构的数据可以采用不同的存储结构,但影响数据处理效率。
(3)对各种数据结构进行的运算。
3、数据结构的图形表示
一个数据结构除了用二元关系表示外,还可以直观地用图形表示。
在数据结构的图形表示中,对于数据集合D中的每一个数据元素用中间标有元素值的方框表示,一般称之为数据结点,并简称为结点;为了进一步表示各数据元素之间的前后件关系,对于关系R中的每一个二元组,用一条有向线段从前件结点指向后件结点。
4、数据结构分为两大类型:
线性结构和非线性结构。
(1)线性结构(非空的数据结构)条件:
1)有且只有一个根结点(注释2);2)每一个结点最多有一个前驱,也最多有一个后继。
*:
常见的线性结构有线性表、栈、队列和线性链表等。
线性表包括栈、队列,其存储方式为顺序存储。
链式型有:
线性链表、带链的栈,带链的队列、循环链表等。
(2)非线性结构:
不满足线性结构条件的数据结构。
*:
常见的非线性结构有树(包括二叉树,其存储方式为链式存储)和图等。
(注释1)前后件关系:
一般情况下,在具有相同特征的数据元素集合中,各个数据元素之间存在某种关系(即联系),这种关系反映了该集合中的数据元素所固有的一种结构。
在数据处理领域中,通常把数据元素之间这种固有的关系简单地用前后件关系(即直接前驱与直接后继关系)来描述。
(注释2)在数据结构中,没有前驱的结点称为根结点。
1.3线性表及其顺序存储结构
1、线性表由一组数据元素构成,数据元素的位置只取决于自己的序号,元素之间的相对位置是线性的。
在复杂线性表中,由若干项数据元素组成的数据元素称为记录;由多个记录构成的线性表称为文件。
非空线性表的结构特征:
(1)有且只有一个根结点a1,它无前件;
(2)有且只有一个终端结点an,它无后件;(3)除根结点与终端结点外,其他所有结点有且只有一个前件,也有且只有一个后件。
结点(线性表中数据元素)的个数n称为线性表的长度,当n=0时,称为空表。
*:
线性表是一种存储结构,它的存储方式:
顺序和链式。
2、线性表的顺序存储结构具有两个基本特点:
(1)线性表中所有元素所占的存储空间是连续的;
(2)线性表中各数据元素在存储空间中是按逻辑顺序依次存放的。
*:
由此可以看出,在线性表的顺序存储结构中,其前后件两个元素在存储空间中是紧邻的,且前件元素一定存储在后件元素的前面,可以通过计算机直接确定第i个结点的存储地址。
元素ai的存储地址为:
ADR(ai)=ADR(a1)+(i-1)k,ADR(a1)为第一个元素的地址,k代表每个元素占的字节数。
顺序表的运算:
查找、插入、删除
3、顺序表的插入、删除运算
(1)顺序表的插入运算:
在一般情况下,要在第i(1≤i≤n)个元素之前插入一个新元素时,首先要从最后一个(即第n个)元素开始,直到第i个元素之间共n-i+1个元素依次向后移动一个位置,移动结束后,第i个位置就被空出,然后将新元素插入到第i项。
插入结束后,线性表的长度就增加了1。
*:
顺性表的插入运算时需要移动元素,在等概率情况下,平均需要移动n/2个元素。
(2)顺序表的删除运算:
在一般情况下,要删除第i(1≤i≤n)个元素时,则要从第i+1个元素开始,直到第n个元素之间共n-i个元素依次向前移动一个位置。
删除结束后,线性表的长度就减小了1。
*:
进行顺性表的删除运算时也需要移动元素,在等概率情况下,平均需要移动(n-1)/2个元素。
插入、删除运算不方便。
1.4栈和队列
1、栈及其基本运算
栈是限定在一端进行插入与删除运算的线性表。
在栈中,允许插入与删除的一端称为栈顶,用指针top表示栈顶位置。
不允许插入与删除的另一端称为栈底,用指针bottom表示栈底。
栈顶元素总是最后被插入的元素,栈底元素总是最先被插入的元素。
即栈是按照“先进后出(FILO)”或“后进先出(LIFO)”的原则组织数据的。
栈具有记忆作用。
栈的基本运算:
1)插入元素称为入栈运算;2)删除元素称为退栈运算(取出栈顶元素并赋给一个指定的变量);3)读栈顶元素是将栈顶元素赋给一个指定的变量,此时指针无变化。
栈的存储方式和线性表类似,也有两种,即顺序栈和链式栈。
2、队列及其基本运算
队列是指允许在一端(队尾)进入插入,而在另一端(队头)进行删除的线性表。
尾指针(Rear)指向队尾元素,头指针(front)指向排头元素的前一个位置(队头)。
队列是“先进先出(FIFO)”或“后进后出(LILO)”的线性表。
队列运算包括:
1)入队运算:
从队尾插入一个元素;2)退队运算:
从队头删除一个元素。
队列的顺序存储结构一般采用队列循环的形式。
循环队列s=0表示队列空,s=1且front=rear表示队列满。
循环队列及其运算:
所谓循环队列,就是将队列存储空间的最后一个位置绕到第一个位置,形成逻辑上的环状空间,供队列循环使用。
在循环队列中,用队尾指针rear指向队列中的队尾元素,用排头指针front指向排头元素的前一个位置,因此,从头指针front指向的后一个位置直到队尾指针rear指向的位置之间,所有的元素均为队列中的元素。
*:
循环队列中元素的个数=rear-front,若为负数,再加其容量即可。
也即队列元素个数=(尾指针-头指针+队列容量)%队列容量,(注%为求余运算符)
1.5线性链表
1、线性表顺序存储的缺点:
(1)插入或删除的运算效率很低。
在顺序存储的线性表中,插入或删除数据元素时需要移动大量的数据元素;
(2)线性表的顺序存储结构下,线性表的存储空间不便于扩充;(3)线性表的顺序存储结构不便于对存储空间的动态分配。
2、线性链表:
线性表的链式存储结构称为线性链表,是一种物理存储单元上非连续、非顺序的存储结构,数据元素的逻辑顺序是通过链表中的指针链接来实现的。
因此,在链式存储方式中,每个结点(数据结构中的每一个结点对应于一个存储单元,这种存储单元称为存储结点,简称结点)由两部分组成:
一部分用于存放数据元素的值,称为数据域;另一部分用于存放指针,称为指针域,用于指向该结点的前一个或后一个结点(即前件或后件),如下图所示:
在链式存储结构中,存储数据结构的存储空间可以不连续,各数据结点的存储顺序与数据元素之间的逻辑关系可以不一致,而数据元素之间的逻辑关系是由指针域来确定的。
链式存储方式即可用于表示线性结构,也可用于表示非线性结构。
线性链表的基本运算:
查找、插入、删除
线性链表分为单链表、双向链表和循环链表三种类型。
在单链表中,每一个结点只有一个指针域,由这个指针只能找到其后件结点,而不能找到其前件结点,HEAD称为头指针,HEAD=NULL(或0)称为空表。
因此,在某些应用中,对于线性链表中的每个结点设置两个指针,一个称为左指针,指向其前件结点;另一个称为右指针,指向其后件结点,这种链表称为双向链表,如下图所示:
3、线性链表的基本运算
(1)在线性链表中包含指定元素的结点之前插入一个新元素。
*:
在线性链表中插入元素时,不需要移动数据元素,只需要修改相关结点指针即可,也不会出现“上溢(注释1)”现象。
(2)在线性链表中删除包含指定元素的结点。
*:
在线性链表中删除元素时,也不需要移动数据元素,只需要修改相关结点指针即可。
(3)将两个线性链表按要求合并成一个线性链表。
(4)将一个线性链表按要求进行分解。
(5)逆转线性链表。
(6)复制线性链表。
(7)线性链表的排序。
(8)线性链表的查找。
*:
线性链表不能随机存取(注释2)。
4、循环链表及其基本运算
在线性链表中,其插入与删除的运算虽然比较方便,但还存在一个问题,在运算过程中对于空表和对第一个结点的处理必须单独考虑,使空表与非空表的运算不统一。
为了克服线性链表的这个缺点,可以采用另一种链接方式,即循环链表。
与前面所讨论的线性链表相比,循环链表具有以下两个特点:
1)在链表中增加了一个表头结点,其数据域为任意或者根据需要来设置,指针域指向线性表的第一个元素的结点,而循环链表的头指针指向表头结点;2)循环链表中最后一个结点的指针域不是空,而是指向表头结点。
即在循环链表中,所有结点的指针构成了一个环状链。
下图a是一个非空的循环链表,图b是一个空的循环链表:
循环链表的优点主要体现在两个方面:
一是在循环链表中,只要指出表中任何一个结点的位置,就可以从它出发访问到表中其他所有的结点,而线性单链表做不到这一点;二是由于在循环链表中设置了一个表头结点,在任何情况下,循环链表中至少有一个结点存在,从而使空表与非空表的运算统一。
*:
循环链表是在单链表的基础上增加了一个表头结点,其插入和删除运算与单链表相同。
但它可以从任一结点出发来访问表中其他所有结点,并实现空表与非空表的运算的统一。
注释1:
当为一个线性表分配顺序存储结构后,如果出现线性表的存储空间已满,但还需要插入新的元素时,就会发生“上溢”现象。
注释2:
在链表中,即使知道被访问结点的序号i,也不能像顺序表中那样直接按序号i访问结点,而只能从链表的头指针出发,顺着链域逐个结点往下搜索,直至搜索到第i个结点为止。
因此,链表不是随机存储结构。
1.6树与二叉树
1、树的基本概念
树是一种简单的非线性结构。
在树这种数据结构中,所有数据元素之间的关系具有明显的层次特性。
在树结构中,每一个结点只有一个前件,称为父结点。
没有前件的结点只有一个,称为树的根结点,简称树的根。
每一个结点可以有多个后件,称为该结点的子结点。
没有后件的结点称为叶子结点。
在树结构中,一个结点所拥有的后件的个数称为该结点的度,所有结点中最大的度称为树的度。
树的最大层次称为树的深度。
2、二叉树及其基本性质
(1)什么是二叉树
二叉树是一种很有用的非线性结构,它具有以下两个特点:
1)非空二叉树只有一个根结点:
(2)每一个结点最多有两颗字数,且分别称为该结点的左子树与右子树。
根据二叉树的概念可知,二叉树的度可以为0(叶结点)、1(只有一棵子树)或2(有2棵子树)。
(2)二叉树的基本性质
性质1在二叉树的第k层上,最多有2k-1(k≥1)个结点。
性质2深度为m的二叉树最多有个2m-1个结点。
性质3在任意一棵二叉树中,度数为0的结点(即叶子结点)总比度为2的结点多一个。
性质4具有n个结点的二叉树,其深度至少为[log2n]+1,其中[log2n]表示取log2n的整数部分。
3、满二叉树与完全二叉树
满二叉树:
除最后一层外,每一层上的所有结点都有两个子结点,即k层上有2k-1(k≥1)个结点,深度为m的二叉树最多有个2m-1个结点。
。
完全二叉树:
除最后一层外,每一层上的结点数均达到最大值;在最后一层上只缺少右边的若干结点。
*:
根据完全二叉树的定义可得出:
度为1的结点的个数为0或1。
下图a表示的是满二叉树,下图b表示的是完全二叉树:
完全二叉树还具有如下两个特性:
性质5具有n个结点的完全二叉树深度为[log2n]+1。
性质6设完全二叉树共有n个结点,如果从根结点开始,按层序(每一层从左到右)用自然数1,2,…,n给结点进行编号,则对于编号为k(k=1,2,…,n)的结点有以下结论:
①若k=1,则该结点为根结点,它没有父结点;若k>1,则该结点的父结点的编号为INT(k/2)。
②若2k≤n,则编号为k的左子结点编号为2k;否则该结点无左子结点(显然也没有右子结点)。
③若2k+1≤n,则编号为k的右子结点编号为2k+1;否则该结点无右子结点。
补充:
增加度为1的结点不会影响二叉树的叶子结点数,每增加一个度为2的结点便会增加一个叶子结点,没有度为2的结点时叶子结点数为1。
4、二叉树的存储结构
在计算机中,二叉树通常采用链式存储结构。
与线性链表类似,用于存储二叉树中各元素的存储结点也由两部分组成:
数据域和指针域。
但在二叉树中,由于每一个元素可以有两个后件(即两个子结点),因此,用于存储二叉树的存储结点的指针域有两个:
一个用于指向该结点的左子结点的存储地址,称为左指针域;另一个用于指向该结点的右子结点的存储地址,称为右指针域。
*:
一般二叉树通常采用链式存储结构,对于满二叉树与完全二叉树来说,可以按层序进行顺序存储(注释1)。
5、二叉树的遍历
二叉树的遍历是指不重复地访问二叉树中的所有结点。
二叉树的遍历可以分为以下三种:
(1)前序遍历(DLR):
若二叉树为空,则结束返回。
否则:
首先访问根结点,然后遍历左子树,最后遍历右子树;并且,在遍历左右子树时,仍然先访问根结点,然后遍历左子树,最后遍历右子树。
(2)中序遍历(LDR):
若二叉树为空,则结束返回。
否则:
首先遍历左子树,然后访问根结点,最后遍历右子树;并且,在遍历左、右子树时,仍然先遍历左子树,然后访问根结点,最后遍历右子树。
(3)后序遍历(LRD):
若二叉树为空,则结束返回。
否则:
首先遍历左子树,然后遍历右子树,最后访问根结点,并且,在遍历左、右子树时,仍然先遍历左子树,然后遍历右子树,最后访问根结点。
(1)前序遍历结果为0137849256
(2)中序遍历结果为7381940526
(3)后序遍历结果为7839415620
注释1:
这样,不仅节省了存储空间,又能方便地确定每一个结点的父结点与左右子结点的位置,但顺序存储结构对于一般的二叉树不适用。
1.7查找技术
查找:
根据给定的某个值,在查找表中确定一个其关键字等于给定值的数据元素。
查找结果:
(查找成功:
找到;查找不成功:
没找到。
)
平均查找长度:
查找过程中关键字和给定值比较的平均次数。
1、顺序查找
基本思想:
从表中的第一个元素开始,将给定的值与表中逐个元素的关键字进行比较,直到两者相符,查到所要找的元素为止。
否则就是表中没有要找的元素,查找不成功。
在平均情况下,利用顺序查找法在线性表中查找一个元素,大约要与线性表中一半的元素进行比较,最坏情况下需要比较n次。
顺序查找一个具有n个元素的线性表,其平均复杂度为O(n)。
下列两种情况下只能采用顺序查找:
1)如果线性表是无序表(即表中的元素是无序的),则不管是顺序存储结构还是链式存储结构,都只能用顺序查找。
2)即使是有序线性表,如果采用链式存储结构,也只能用顺序查找。
2、二分法查找
思想:
先确定待查找记录所在的范围,然后逐步缩小范围,直到找到或确认找不到该记录为止。
前提:
必须在具有顺序存储结构的有序表中进行。
查找过程:
1)若中间项(中间项mid=(n-1)/2,mid的值四舍五入取整)的值等于x,则说明已查到;
2)若x小于中间项的值,则在线性表的前半部分查找;
3)若x大于中间项的值,则在线性表的后半部分查找。
特点:
比顺序查找方法效率高。
最坏的情况下,需要比较log2n次。
*:
二分法查找只适用于顺序存储的线性表,且表中元素必须按关键字有序(升序)排列(注释1)。
对于无序线性表和线性表的链式存储结构只能用顺序查找。
在长度为n的有序线性表中进行二分法查找,其时间复杂度为O(log2n)。
注释1:
允许相邻元素值相等。
1.8排序技术
排序是指将一个无序序列整理成按值非递减顺序排列的有序序列,即是将无序的记录序列调整为有序记录序列的一种操作。
交换类排序法(方法:
冒泡排序,快速排序),需要比较的次数为n(n-1)/2;
插入类排序法:
(1)简单插入排序法,最坏情况需要n(n-1)/2次比较;
(2) 希尔排序法,最坏情况需要O(n1.5)次比较。
选择类排序法:
(1)简单选择排序法, 最坏情况需要n(n-1)/2次比较;
(2) 堆排序法,最坏情况需要O(nlog2n)次比较。
(注:
O()代表不超过括号内数值的最大整数值,通常用来表示某算法的复杂度,亦即最多需要多少次计算,多少存储空间等等)
总结:
各种排序法比较:
相比以上几种(除希尔排序法外),堆排序法的时间复杂度更小。
本章应考点拨:
本章内容在笔试中会出现5-6个题目,是公共基础知识部分出题量比较多的一章,所占分值也比较大,约10分。
2.1程序设计风格
程序设计的风格主要强调:
“清晰第一,效率第二”(注释1)。
主要应注重和考虑下述一些因素:
(1)源程序文档化。
1)符号名的命名。
符号名能反映它所代表的实际东西,应有一定的实际含义。
2)程序的注释。
分为序言性注释和功能性注释。
序言性注释:
位于程序开头部分,包括程序标题、程序功能说明、主要算法、接口说明、程序位置、开发简历、程序设计者、复审者、复审日期及修改日期等。
功能性注释:
嵌在源程序体之中,用于描述其后的语句或程序的主要功能。
3)视觉组织。
利用空格、空行、缩进等技巧使程序层次清晰。
(2)数据说明。
1)数据说明的次序规范化;
2)说明语句中变量安排有序化;
3)使用注释来说明复杂数据的结构。
(3)语句的结构。
1)在一行内只写一条语句;
2)程序编写应优先考虑清晰性;
3)程序编写要做到清晰第一,效率第二;
4)在保证程序正确的基础上再要求提高效率;
5)避免使用临时变量而使程序的可读性下降;
6)避免不必要的转移;
7)尽量使用库函数;
8)避免采用复杂的条件语句;
9)尽量减少使用“否定”条件语句;
10)数据结构要有利于程序的简化;
11)要模块化,使模块功能尽可能单一化;
12)利用信息隐蔽(注释2),
确保每一个模块的独立性;
13)从数据出发去构造程序;
14)不要修补