数据结构复习笔记.docx

上传人:b****6 文档编号:6682007 上传时间:2023-01-08 格式:DOCX 页数:15 大小:29.52KB
下载 相关 举报
数据结构复习笔记.docx_第1页
第1页 / 共15页
数据结构复习笔记.docx_第2页
第2页 / 共15页
数据结构复习笔记.docx_第3页
第3页 / 共15页
数据结构复习笔记.docx_第4页
第4页 / 共15页
数据结构复习笔记.docx_第5页
第5页 / 共15页
点击查看更多>>
下载资源
资源描述

数据结构复习笔记.docx

《数据结构复习笔记.docx》由会员分享,可在线阅读,更多相关《数据结构复习笔记.docx(15页珍藏版)》请在冰豆网上搜索。

数据结构复习笔记.docx

数据结构复习笔记

数据结构复习笔记

数据就是指能够被计算机识别、存储和加工处理的信息的载体。

  数据元素是数据的基本单位,有时一个数据元素可以由若干个数据项组成。

数据项是具有独立含义的最小标识单位。

如整数这个集合中,10这个数就可称是一个数据元素.又比如在一个数据库(关系式数据库)中,一个记录可称为一个数据元素,而这个元素中的某一字段就是一个数据项。

  数据结构的定义虽然没有标准,但是它包括以下三方面内容:

逻辑结构、存储结构、和对数据的操作。

这一段比较重要,我用自己的语言来说明一下,大家看看是不是这样。

 

 比如一个表(数据库),我们就称它为一个数据结构,它由很多记录(数据元素)组成,每个元素又包括很多字段(数据项)组成。

那么这张表的逻辑结构是怎么样的呢?

 我们分析数据结构都是从结点(其实也就是元素、记录、顶点,虽然在各种情况下所用名字不同,但说的是同一个东东)之间的关系来分析的,对于这个表中的任一个记录(结点),它只有一个直接前趋,只有一个直接后继(前趋后继就是前相邻后相邻的意思),整个表只有一个开始结点和一个终端结点,那我们知道了这些关系就能明白这个表的逻辑结构了。

 

  而存储结构则是指用计算机语言如何表示结点之间的这种关系。

如上面的表,在计算机语言中描述为连续存放在一片内存单元中,还是随机的存放在内存中再用指针把它们链接在一起,这两种表示法就成为两种不同的存储结构。

(注意,在本课程里,我们只在高级语言的层次上讨论存储结构。

) 

  第三个概念就是对数据的运算,比如一张表格,我们需要进行查找,增加,修改,删除记录等工作,而怎么样才能进行这样的操作呢?

 这也就是数据的运算,它不仅仅是加减乘除这些算术运算了,在数据结构中,这些运算常常涉及算法问题。

  弄清了以上三个问题,就可以弄清数据结构这个概念。

数据就是指能够被计算机识别、存储和加工处理的信息的载体。

  数据元素是数据的基本单位,有时一个数据元素可以由若干个数据项组成。

数据项是具有独立含义的最小标识单位。

如整数这个集合中,10这个数就可称是一个数据元素.又比如在一个数据库(关系式数据库)中,一个记录可称为一个数据元素,而这个元素中的某一字段就是一个数据项。

  数据结构的定义虽然没有标准,但是它包括以下三方面内容:

逻辑结构、存储结构、和对数据的操作。

这一段比较重要,我用自己的语言来说明一下,大家看看是不是这样。

 

 比如一个表(数据库),我们就称它为一个数据结构,它由很多记录(数据元素)组成,每个元素又包括很多字段(数据项)组成。

那么这张表的逻辑结构是怎么样的呢?

 我们分析数据结构都是从结点(其实也就是元素、记录、顶点,虽然在各种情况下所用名字不同,但说的是同一个东东)之间的关系来分析的,对于这个表中的任一个记录(结点),它只有一个直接前趋,只有一个直接后继(前趋后继就是前相邻后相邻的意思),整个表只有一个开始结点和一个终端结点,那我们知道了这些关系就能明白这个表的逻辑结构了。

 

  而存储结构则是指用计算机语言如何表示结点之间的这种关系。

如上面的表,在计算机语言中描述为连续存放在一片内存单元中,还是随机的存放在内存中再用指针把它们链接在一起,这两种表示法就成为两种不同的存储结构。

(注意,在本课程里,我们只在高级语言的层次上讨论存储结构。

) 

  第三个概念就是对数据的运算,比如一张表格,我们需要进行查找,增加,修改,删除记录等工作,而怎么样才能进行这样的操作呢?

 这也就是数据的运算,它不仅仅是加减乘除这些算术运算了,在数据结构中,这些运算常常涉及算法问题。

  弄清了以上三个问题,就可以弄清数据结构这个概念。

--------------------------------------------------------------------------------

  通常我们就将数据的逻辑结构简称为数据结构,数据的逻辑结构分两大类:

线性结构和非线性结构 (这两个很容易理解)

  数据的存储方法有四种:

顺序存储方法、链接存储方法、索引存储方法和散列存储方法。

--------------------------------------------------------------------------------

  下一个是难点问题,就是算法的描述和分析,主要是算法复杂度的分析方法及其运用。

 首先了解一下几个概念。

一个是时间复杂度,一个是渐近时间复杂度。

前者是某个算法的时间耗费,它是该算法所求解问题规模n的函数,而后者是指当问题规模趋向无穷大时,该算法时间复杂度的数量级。

 

  当我们评价一个算法的时间性能时,主要标准就是算法的渐近时间复杂度,因此,在算法分析时,往往对两者不予区分,经常是将渐近时间复杂度T(n)=O(f(n)简称为时间复杂度,其中的f(n)一般是算法中频度最大的语句频度。

  此外,算法中语句的频度不仅与问题规模有关,还与输入实例中各元素的取值相关。

但是我们总是考虑在最坏的情况下的时间复杂度。

以保证算法的运行时间不会比它更长。

  常见的时间复杂度,按数量级递增排列依次为:

常数阶O

(1)、对数阶O(log2n)、线性阶O(n)、线性对数阶O(nlog2n)、平方阶O(n^2)、立方阶O(n^3)、k次方阶O(n^k)、指数阶O(2^n)。

  时间复杂度的分析计算请看书本上的例子,然后我们通过做练习加以领会和巩固。

数据结构习题一 

--------------------------------------------------------------------------------

1.1 简述下列概念:

数据、数据元素、数据类型、数据结构、逻辑结构、存储结构、线性结构、非线性结构。

◆ 数据:

指能够被计算机识别、存储和加工处理的信息载体。

◆ 数据元素:

就是数据的基本单位,在某些情况下,数据元素也称为元素、结点、顶点、记录。

数据元素有时可以由若干数据项组成。

◆ 数据类型:

是一个值的集合以及在这些值上定义的一组操作的总称。

◆ 数据结构:

指的是数据之间的相互关系,即数据的组织形式。

一般包括三个方面的内容:

数据的逻辑结构、存储结构和数据的运算。

◆ 逻辑结构:

指各数据元素之间的逻辑关系。

◆ 存储结构:

就是数据的逻辑结构用计算机语言的实现。

◆ 线性结构:

数据逻辑结构中的一类,它的特征是若结构为非空集,则该结构有且只有一个开始结点和一个终端结点,并且所有结点都最多只有一个直接前趋和一个直接后继。

线性表就是一个典型的线性结构。

◆ 非线性结构:

数据逻辑结构中的另一大类,它的逻辑特征是一个结点可能有多个直接前趋和直接后继。

1.2 试举一个数据结构的例子、叙述其逻辑结构、存储结构、运算三个方面的内容。

◆ 例如有一张学生成绩表,记录了一个班的学生各门课的成绩。

按学生的姓名为一行记成的表。

这个表就是一个数据结构。

每个记录(有姓名,学号,成绩等字段)就是一个结点,对于整个表来说,只有一个开始结点(它的前面无记录)和一个终端结点(它的后面无记录),其他的结点则各有一个也只有一个直接前趋和直接后继(它的前面和后面均有且只有一个记录)。

这几个关系就确定了这个表的逻辑结构。

那么我们怎样把这个表中的数据存储到计算机里呢?

 用高级语言如何表示各结点之间的关系呢?

 是用一片连续的内存单元来存放这些记录(如用数组表示)还是随机存放各结点数据再用指针进行链接呢?

 这就是存储结构的问题,我们都是从高级语言的层次来讨论这个问题的。

(所以各位赶快学C语言吧)。

  最后,我们有了这个表(数据结构),肯定要用它,那么就是要对这张表中的记录进行查询,修改,删除等操作,对这个表可以进行哪些操作以及如何实现这些操作就是数据的运算问题了。

--------------------------------------------------------------------------------

1.3 常用的存储表示方法有哪几种?

常用的存储表示方法有四种:

◆ 顺序存储方法:

它是把逻辑上相邻的结点存储在物理位置相邻的存储单元里,结点间的逻辑关系由存储单元的邻接关系来体现。

由此得到的存储表示称为顺序存储结构。

◆ 链接存储方法:

它不要求逻辑上相邻的结点在物理位置上亦相邻,结点间的逻辑关系是由附加的指针字段表示的。

由此得到的存储表示称为链式存储结构。

◆ 索引存储方法:

除建立存储结点信息外,还建立附加的索引表来标识结点的地址。

◆ 散列存储方法:

就是根据结点的关键字直接计算出该结点的存储地址。

--------------------------------------------------------------------------------

1.4 设三个函数f,g,h分别为 f(n)=100n^3+n^2+1000 , g(n)=25n^3+5000n^2 , h(n)=n^1.5+5000nlgn 请判断下列关系是否成立:

(1) f(n)=O(g(n)) 

(2) g(n)=O(f(n)) 

(3) h(n)=O(n^1.5)

(4) h(n)=O(nlgn)

◆ 

(1)成立。

 

◇ 这里我们复习一下渐近时间复杂度的表示法T(n)=O(f(n)),这里的"O"是数学符号,它的严格定义是"若T(n)和f(n)是定义在正整数集合上的两个函数,则T(n)=O(f(n))表示存在正的常数C和n0 ,使得当n≥n0时都满足0≤T(n)≤C·f(n)。

"用容易理解的话说就是这两个函数当整型自变量n趋向于无穷大时,两者的比值是一个不等于0的常数。

这么一来,就好计算了吧。

(1)题中两个函数的最高次项都是n^3,因此当n→∞时,两个函数的比值是一个常数,所以这个关系式是成立的。

 

◆ 

(2)成立。

◆ (3)成立。

◆ (4)不成立。

--------------------------------------------------------------------------------

1.5 设有两个算法在同一机器上运行,其执行时间分别为100n^2和2^n,要使前者快于后者,n至少要多大?

◆ 15

◇ 最简单最笨的办法就是拿自然数去代呗。

假定n取为10,则前者的值是10000,后者的值是1024,小于前者,那我们就加个5,用15代入得前者为22500,后者为32768,已经比前者大但相差不多,那我们再减个1,用14代入得,前者为19600,后者为16384,又比前者小了,所以结果得出来就是n至少要是15. 

--------------------------------------------------------------------------------

1.6 设n为正整数,利用大"O"记号,将下列程序段的执行时间表示为n的函数。

1.6 设n为正整数,利用大"O"记号,将下列程序段的执行时间表示为n的函数。

(1) i=1; k=0 

while(i { k=k+10*i;i++;

}  ◆ T(n)=n-1 

∴ T(n)=O(n)

◇ 这个函数是按线性阶递增的 

(2) i=0; k=0;

do{

k=k+10*i; i++; 

}

while(i  ◆ T(n)=n 

∴ T(n)=O(n)

◇ 这也是线性阶递增的 

(3) i=1; j=0; 

while(i+j<=n) 

{

if (i else i++;

}  ◆ T(n)=n/2 

∴ T(n)=O(n)

◇ 虽然时间函数是n/2,但其数量级仍是按线性阶递增的。

 

(4)x=n; // n>1 

while (x>=(y+1)*(y+1))

y++;  ◆ T(n)=n1/2

∴ T(n)=O(n1/2)

◇ 最坏的情况是y=0,那么循环的次数是n1/2次,这是一个按平方根阶递增的函数。

 

(5) x=91; y=100; 

while(y>0)

if(x>100)

{x=x-10;y--;}

else x++; ◆ T(n)=O

(1)

◇ 这个程序看起来有点吓人,总共循环运行了1000次,但是我们看到n没有?

 没。

这段程序的运行是和n无关的,就算它再循环一万年,我们也不管他,只是一个常数阶的函数。

 

--------------------------------------------------------------------------------

1.7 算法的时间复杂度仅与问题的规模相关吗?

◆ No,事实上,算法的时间复杂度不仅与问题的规模相关,还与输入实例中的元素取值等相关,但在最坏的情况下,其时间复杂度就是只与求解问题的规模相关的。

我们在讨论时间复杂度时,一般就是以最坏情况下的时间复杂度为准的。

1.8 按增长率由小至大的顺序排列下列各函数:

 2^100, (2/3)^n,(3/2)^n, n^n , , n!

 ,2^n ,lgn ,n^lgn, n^(3/2)

◇ 分析如下:

2^100 是常数阶; (2/3)^n和 (3/2)^n是指数阶,其中前者是随n的增大而减小的; n^n是指数方阶; √n 是方根阶, n!

 就是n(n-1)(n-2)... 就相当于n次方阶;2^n 是指数阶,lgn是对数阶 ,n^lgn是对数方阶, n^(3/2)是3/2次方阶。

根据以上分析按增长率由小至大的顺序可排列如下:

◆ (2/3)^n < 2^100 < lgn < √n < n^(3/2) < n^lgn < (3/2)^n < 2^n < n!

 < n^n 

--------------------------------------------------------------------------------

1.9 有时为了比较两个同数量级算法的优劣,须突出主项的常数因子,而将低次项用大"O"记号表示。

例如,设T1(n)=1.39nlgn+100n+256=1.39nlgn+O(n), T2(n)=2.0nlgn-2n=2.0lgn+O(n), 这两个式子表示,当n足够大时T1(n)优于T2(n),因为前者的常数因子小于后者。

请用此方法表示下列函数,并指出当n足够大时,哪一个较优,哪一个较劣?

函 数  大"O"表示  优劣  

(1) T1(n)=5n^2-3n+60lgn  ◆ 5n^2+O(n) ◆ 较差 

(2) T2(n)=3n^2+1000n+3lgn  ◆ 3n^2+O(n) ◆ 其次  

(3) T3(n)=8n^2+3lgn  ◆ 8n^2+O(lgn) ◆ 最差 

(4) T4(n)=1.5n^2+6000nlgn  ◆ 1.5n^2+O(nlgn) ◆ 最优  

第一章 概论 复习要点 

本章的复习要点是:

 

数据、数据元素、数据结构(包括逻辑结构、存储结构)以及数据类型的概念、数据的逻辑结构分为哪两大类,及其逻辑特征、数据的存储结构可用的四种基本存储方法。

时间复杂度与渐近时间复杂度的概念,如何求算法的时间复杂度。

可能出的题目有选择题、填空题或简答题。

如:

.........是数据的基本单位,.........是具有独立含义的最小标识单位。

什么是数据结构?

什么是数据类型?

数据的............与数据的存储无关,它是独立于计算机的。

数据的存储结构包括顺序存储结构、链式存储结构.......................、...........................

设n为正整数,利用大O记号,将该程序段的执行时间表示为n的函数,则下列程序段的时间复杂度可表示为:

(....)

x=91;y=100;

while(y>10)

if(x>100){x=x-10;y--;} 

else x++;

A. O

(1) B.O(x) C.O(y) D.O(n) 

等等。

顺便一提,基本概念和基本理论的掌握是得分的基本手段。

第二章:

线性表(包括习题与答案及要点)

转摘www.E

--------------------------------------------------------------------------------

  

本章的重点是掌握顺序表和单链表上实现的各种基本算法及相关的时间性能分析,难点是使用本章所学的基本知识设计有效算法解决与线性表相关的应用问题。

要求达到<识记>层次的内容有:

线性表的逻辑结构特征;线性表上定义的基本运算,并利用基本运算构造出较复杂的运算。

要求达到<综合应用>层次的内容有:

顺序表的含义及特点,顺序表上的插入、删除操作及其平均时间性能分析,解决简单应用问题。

链表如何表示线性表中元素之间的逻辑关系;单链表、双链表、循环链表链接方式上的区别;单链表上实现的建表、查找、插入和删除等基本算法及其时间复杂度。

循环链表上尾指针取代头指针的作用,以及单循环链表上的算法与单链表上相应算法的异同点。

双链表的定义和相关算法。

利用链表设计算法解决简单应用问题。

要求达到<领会>层次的内容就是顺序表和链表的比较,以及如何选择其一作为其存储结构才能取得较优的时空性能。

--------------------------------------------------------------------------------

线性表的逻辑结构特征是很容易理解的,如其名,它的逻辑结构特征就好象是一条线,上面打了一个个结,很形象的,如果这条线上面有结,那么它就是非空表,只能有一个开始结点,有且只能有一个终端结点,其它的结前后所相邻的也只能是一个结点(直接前趋和直接后继)。

关于线性表上定义的基本运算,主要有构造空表、求表长、取结点、查找、插入、删除等。

--------------------------------------------------------------------------------

线性表的逻辑结构和存储结构之间的关系。

在计算机中,如何把线性表的结点存放到存储单元中,就有许多方法,最简单的方法就是按顺序存储。

就是按线性表的逻辑结构次序依次存放在一组地址连续的存储单元中。

在存储单元中的各元素的物理位置和逻辑结构中各结点相邻关系是一致的。

在顺序表中实现的基本运算主要讨论了插入和删除两种运算。

相关的算法我们通过练习掌握。

对于顺序表的插入和删除运算,其平均时间复杂度均为O(n)。

--------------------------------------------------------------------------------

线性表的链式存储结构。

它与顺序表不同,链表是用一组任意的存储单元来存放线性表的结点,这组存储单元可以分布在内存中任何位置上。

因此,链表中结点的逻辑次序和物理次序不一定相同。

所以为了能正确表示结点间的逻辑关系,在存储每个结点值的同时,还存储了其后继结点的地址信息(即指针或链)。

这两部分信息组成链表中的结点结构。

 

一个单链表由头指针的名字来命名。

对于单链表,其操作运算主要有建立单链表(头插法、尾插法和在链表开始结点前附加一个头结点的算法)、查找(按序号和按值)、插入运算、删除运算等。

以上各运算的平均时间复杂度均为O(n).其主要时间是耗费在查找操作上。

--------------------------------------------------------------------------------

循环链表是一种首尾相接的链表。

也就是终端结点的指针域不是指向NULL空而是指向开始结点(也可设置一个头结点),形成一个环。

采用循环链表在实用中多采用尾指针表示单循环链表。

这样做的好处是查找头指针和尾指针的时间都是O

(1),不用遍历整个链表了。

判别链表终止的条件也不同于单链表,它是以指针是否等于某一指定指针如头指针或尾指针来确定。

 

--------------------------------------------------------------------------------

双链表就是双向链表,就是在单链表的每个结点里再增加一个指向其直接前趋的指针域prior,这样形成的链表就有两条不同方向的链。

使得从已知结点查找其直接前趋结点可以和查找其直接后继结点的时间一样缩短为O

(1)。

双链表一般也由头指针head惟一确定。

双链表也可以头尾相链接构成双(向)循环链表。

--------------------------------------------------------------------------------

关于顺序表和链表的比较,请看下表:

具体要求 顺序表 链表 

基于空间 适于线性表长度变化不大,易于事先确定其大小时采用。

 适于当线性表长度变化大,难以估计其存储规模时采用。

 

基于时间 由于顺序表是一种随机存储结构,当线性表的操作主要是查找时,宜采用。

 链表中对任何位置进行插入和删除都只需修改指针,所以这类操作为主的线性表宜采用链表做存储结构。

若插入和删除主要发生在表的首尾两端,则宜采用尾指针表示的单循环链表。

 

第二章 线性表习题及答案 

--------------------------------------------------------------------------------

一、基础知识题

(答案及点评) 2.1 试描述头指针、头结点、开始结点的区别、并说明头指针和头结点的作用。

一、基础知识题

2.1 答:

开始结点是指链表中的第一个结点,也就是没有直接前趋的那个结点。

链表的头指针是一指向链表开始结点的指针(没有头结点时),单链表由头指针唯一确定,因此单链表可以用头指针的名字来命名。

头结点是我们人为地在链表的开始结点之前附加的一个结点。

有了头结点之后,头指针指向头结点,不论链表否为空,头指针总是非空。

而且头指针的设置使得对链表的第一个位置上的操作与在表其他位置上的操作一致(都是在某一结点之后)。

--------------------------------------------------------------------------------

(答案及点评) 2.2 何时选用顺序表、何时选用链表作为线性表的存储结构为宜?

2.2 答:

在实际应用中,应根据具体问题的要求和性质来选择顺序表或链表作为线性表的存储结构,通常有以下几方面的考虑:

1.基于空间的考虑。

当要求存储的线性表长度变化不大,易于事先确定其大小时,为了节约存储空间,宜采用顺序表;反之,当线性表长度变化大,难以估计其存储规模时,采用动态链表作为存储结构为好。

2.基于时间的考虑。

若线性表的操作主要是进行查找,很少做插入和删除操作时,采用顺序表做存储结构为宜;反之, 若需要对线性表进行频繁地插入或删除等的操作时,宜采用链表做存储结构。

并且,若链表的插入和删除主要发生在表的首尾两端,则采用尾指针表示的单循环链表为宜。

--------------------------------------------------------------------------------

(答案及点评) 2.3 在

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 考试认证 > IT认证

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1