数学对于计算科学的意义.docx

资源描述

数学对于计算科学的意义.docx

《数学对于计算科学的意义.docx》由会员分享，可在线阅读，更多相关《数学对于计算科学的意义.docx（25页珍藏版）》请在冰豆网上搜索。

数学对于计算科学的意义.docx

数学对于计算科学的意义

数学对于计算科学的意义：

1.将现实问题抽象成数学中的图论问题

2.从特例到一般规律

计算机如何完成计算任务􀃆（IPSO）

计算机硬件系统

计算机程序就是指示计算机如何解决问题或完成任务的一组详细的、逐步执行的指令。

软件=程序+数据+文档+动态链接库。

源程序（在硬盘中）

可执行程序（在硬盘中）

发出一条执行命令（点击图标）

或者直接写文件名

程序被调用内存

操作系统分配空间，并逐条执行（进程）

进程结束，从内存中消失

软件的分类

􀂾系统软件（协助计算机完成一项任务）

􀂄程序设计语言，汇编程序，编译系统，实用工具，开发工具，诊断工具

􀂄充当硬件与应用程序之间媒介，维护整个计算机硬件和软件系统（操作系统）

􀂄平滑用户思维方式、操作习惯与计算机硬件之间的差异（用户操作界面）

􀂾应用软件（协助人们完成一项任务）

􀂄用户在为解决特定问题而开发的一类专用程序的总称。

软件包

􀂾具有某些共同特点,但是又完成不同功能的程序的组合.

操作系统的主要功能：

􀂾协助计算机完成它的基本的硬件操作。

􀂾和应用软件通讯，完成应用任务。

􀂾操作系统是用户和计算机之间的桥梁。

操作系统的外部服务和内部服务

􀂾外部服务：

协助用户启动程序，管理存储数据，维护安全，由用户控制。

􀂾用户通过用户界面与计算机打交道

􀂾内部服务：

保证计算机的有效运行，进行资源管理，受操作系统的控制，不受用户控制。

操作系统的功能：

􀂾资源管理

􀂄CPU管理时间片优先级

􀂄存储管理实现内存的保护实现内存的扩充

􀂄输入输出设备管理查询方式中断方式

􀂄文件管理（信息管理）

外存储空间的管理

文件目录空间管理

为文件分配存储空间

查找文件

清理硬盘碎片

􀂾任务管理与监控

进程：

某一个程序处在执行状态时称作进程，包括程序代码、相关的数据、所需的环境信息。

􀂇操作系统管理按照时间片给进程分配CPU，导致进程有三种状态、活跃、挂起、结束

􀂄进程及其调度

􀂄系统监控设备故障安全

􀂾用户界面

分类

􀂇单用户操作系统

􀂾目前大多是桌面计算机的操作系统

􀂇多用户操作系统

􀂾功能强的机器，安装服务器程序，叫做服务器

（WinNT或UNIX系统），允许多个终端一起使用，

机房的机器是winNT系统。

􀂇多任务操作系统

􀂾可以同时操作多个项目,目前大多数都是。

桌面操作系统和服务器操作系统

一些与internet有关术语的理解

–URL,http,DNS,超链,超文本,IP地址,流媒体,ISP,NSP,ICP

Internet上的服务类型

–BBS,WWW,email,telnet,ftp,Ipphone

IP地址的规则，网络协议、路由器、域名解析器的的作用

中国的主要骨干网

–CHINANETCERNETCSTNETGBNETUNINETCNCNET

网络的类型

􀀗局域网（LAN:

LocalAreaNetwork）

–有限的区域、在广播范围内、自治区域

􀀗广域网（WAN：

WideAreaNetwork）

–跨越主干网传输数据，因特网是广域网

􀀗城域网（MAN：

MetropolitanAreaNetwork）

–在地域上覆盖城市及其郊区范围、

–为城域多业务提供综合传送平台的网络

–主要应用于大中型城市地区。

TCP/IP（传输控制协议/因特网协议）

拆包并建立清单（分解）

依据清单打包（还原）

􀀗路由器是用于多个网络之间提供网络互连能力。

路由器可以具有选

择进入或途经哪个网络的能力，称为路由选择。

IP地址

Internet地址在概念上分为三层，即Internet层、物理层、主机层。

因此说，IP地址带有位置信息。

A类地址1.x.y.z-126.x.y.z范围内的IP地址

B类地址128.0.y.z-191.255.y.z范围内的IP地址。

C类地址192.1.1.z-223.254.254.z范围内的IP地址

域名：

有的主机具有一个和其IP地址相对应的以字母表示的名字叫域名

站点：

拥有域名的计算机通常被称为站点。

URL:

访问一个站点的资源要通过文件的URL（统一资源定位器）

主机名.组名.网点名.顶级域名

域名的书写规范与IP的书写规范正好相反，域名是自左向右由低级表示到高级，既由机器表示到机构，而IP地址则是由左到右由网络号表示到机器。

域名的解析由域名服务器DNS来完成

1991:

瑞士日内瓦欧洲物理粒子研究中心。

（CERN）公布了WorldWideWeb技术

􀀗WWW是一种分布式多媒体超文本系统

􀀗URL（统一资源定位）：

唯一指定所要访问的文件

􀀗超链：

从一个位置指向另一个位置的链接指针

􀀗非授权服务——无条件响应他方的请求

WorldWideWeb技术

􀀗用下列词汇将访问WEB页面的过程叙述出来（TCP/IP,

URL,webpage,html,hypertext,DNS,IP,http,server,browser,mime）

􀀗1、打开browser

􀀗2、输入URL（统一资源定位器）

–

􀀗3、Browser通过访问DNS（域名服务器）,得到资源的所在server（服务器）的IP地址。

–162.105.203.105（一部分是网络地址，一部分是主机地址）

􀀗4、浏览器用这个IP地址和Web服务器建立一次TCP/IP连接.

􀀗4、浏览器通过该连接向服务器发一HTTP请求

􀀗5、服务器返回给客户端两部分信息：

要浏览的内容：

–1、用html（超文本注记语言）编写的webpage

–2、如何显示这些信息的描述（文件的扩展名给出文档类型的宏观描述,这种类型借用了mime标准.）

􀀗6、浏览器根据不同的mime类型对文件进行显示。

Web2.0技术主要包括

–博客（BLOG）

–RSS

–百科全书（Wiki）

–网摘

–社会网络（SNS）

–P2P

–即时信息（IM）

计算机接入的几种模式

通过局域网接入

企事业单位使用LAN将PC接入因特网

专线接入因特网

以太网是基于共享资源的思路，各节点共享一个信道

电话拨号接入因特网

一台电脑，一条电话线

一个调制解调器，一个ISP帐号

ADSL：

非对称用户数据线

一条ADSL通道可同时提供三条信道

–高速下行通道

–中速全双工通道

–低速POTS话路通道

物理安全、系统安全、数据安全、内容安全

病毒、特洛伊木马、蠕虫、逻辑炸弹、时间炸弹

计算机恶意程序——对系统的威胁

􀂙控制系统类

–特洛伊木马——代码隐藏

–入侵——口令猜测、欺骗系统

–逻辑炸弹----有害代码潜伏，伺机发作

传染类

源码类病毒——宏病毒

操作系统类病毒——引导类病毒

文件类病毒——繁殖类病毒

数据加密，数字签名，防火墙，入侵检测，备份

数据就是描述人、事件、事务和思想的词语、数字和图表。

􀂃当你使用数据作为行动或决策的依据时，数据就成为信息。

文件是存储在存储介质中的指令或数据的有名集合，分为可执行文件和数据文件。

可执行文件

存储在计算机中的包含了控制计算机执行特定任务的指令，是编译后的计算机程序（机器语言）。

􀂙数据文件

􀂃存储的数据、图片、声音、影像等。

数据文件不可以执行，供计算机处理。

源文件

􀂃直接用程序设计语言写的计算机程序叫源文件，它必须经过编译才能变成可执行文件。

合法的文件名遵循特定的规则，叫命名约定。

􀂃长度限制：

255（windows，unix）,8（dos）

􀂃不能用保留字：

COM1,LPT1

􀂃字符的限制，有的系统不允许文件名包含空格，有的系统则允许。

（反斜杠）

􀂃通用扩展名：

bmp（允许多种图形处理软件对其进行处理）

􀂃特定应用文件扩展名:

doc,xls,mdb,wps

􀂙逻辑的文件组织形式

􀂃以树型文件目录方式存储，由用户建立并维护.

􀂃文件在存储器中并不是按照目录结构存放的，具体位置对用户是透明的。

􀂃文件目录和存储设备的映射是有操作系统来完成的

数据的符号位占一位，八个二进制位能表示的有符号数范围是x～x（-128～127）

正数的符号位为0，负数的符号位为1。

􀂃不作为负0处理，而是-2n-1

􀂙磁存储技术

􀂃目前软盘和硬盘采用的都是磁技术：

使存储介质表面的磁粉发生磁化。

根据磁化的方向不同，表示0，1。

􀂃写磁盘就是根据数据把磁粉磁化成不同的方向。

􀂃读磁盘就是根据判断磁盘的磁化方向生成数据。

􀂙光存储技术

􀂃利用激光在存储介质表面上烧灼出凸凹模式代表0，1数据。

􀂃光盘的存储介质是在一张塑料盘上涂上一层铝制的反射层和一层保护。

􀂃光盘的保存期高达500年。

存储以区段为单位成批进行。

区段地址：

编号+扇区号决定。

物理的文件存储形式

􀂃一个文件被分成若干个簇，分别存放在存储器的不同区段中。

物理文件存储

􀂙一个文件通常放在一组连续的扇区内，这一组扇区成为簇。

􀂙操作系统通过目录文件和文件分配表FAT来管理文件。

􀂙存文件是将数据写到空簇中，并将首簇号写入FAT.

􀂙大的文件需要分成若干簇来存储，簇和簇之间用指针连结。

􀂙FAT文件非常重要，一旦损坏，所有文件都将丢失。

删除文件时，并没有真正从此盘上抹掉记录，而是将文件所在的簇号在FAT中置为0。

􀂙RAID（RedundantArrayofIndependentDisks）:

冗余磁盘阵列.

􀂃为提高性能和可靠性将数据和用于纠错的信息分别存放于两个或多个硬盘驱动器的一种数据存储方式。

RAID通常用于网络服务器。

cachememory（磁盘高速缓存）

􀂃cache的速度比RAM快，因此将一些经常用到的信息存在cache中。

􀂃cache策略：

经常使用、预测下一次用到的部分：

程序的局部性原理。

􀂙由于删除文件形成了许多文件碎片，文件存储的不连续，利用文件碎片整理工具可以将碎片整合到一起。

使用文件是针对逻辑文件而言，系统提供给用户使用文件的功能包括：

􀂃建立目录

􀂃删除目录

􀂃复制目录

􀂃移动目录

􀂃建立文件

􀂃复制文件

􀂃删除文件

􀂃移动文件

衡量存储设备的指标：

容量和速度

磁道，扇区，柱面

总线：

总线是计算机中数据传送的通路，它决定了计算机一次能够处理的数的位数。

一共有三种总线:

数据总线、控制总线、地址总线

􀂄计算机

􀂄使用电信号表示数据

􀂄使用总线传输数据

􀂄使用内存保存数据

􀂄使用CPU处理数据

计算机能执行哪些指令是由硬件决定，并且决定了指令的代码集。

芯片上的集成电路中充满了微小的电路器件，它们构成不同的功能模块，如加法器，存储器、计数器等。

􀂄硬件执行指令的过程是机械的---对于同一个指令,动作永远是一样，我们称其为硬件逻辑。

MOS晶体管有三个极:

􀂄源极（S）、栅极（G）和漏极（D）

◎复杂的硬件由最基本的门逻辑组成

CPU的结构

􀂄CPU由运算器和控制器组成，它们被集成在一个芯片上，也称微处理器.

􀂄运算器

􀂄对各种数据或信息进行算术运算或逻辑运算的主要部件。

􀂄运算器包含寄存器（暂存等待处理的数据）和累加器（暂存计算结果）

控制器

􀂄每条指令有操作数和操作码部分

􀂄c=a+b;（操作码是加法，操作数是a和b中的内容）

􀂄指令周期

􀂄取指令、分析指令，执行指令。

􀂄指令计数器加1

控制器对其它部分进行协调控制，对输入输出设备的运行进行监控

1、从指令计数器中读出指令在哪里

2、从内存中取出指令，放到指令寄存器

3、分析指令寄存器中的指令得知数据在那里

4、从内存中取出数据送计算器

影响处理器的因素：

时钟频率、字长、高速缓冲存储器（Cache）、指令集合。

􀂄时钟频率

􀂄主频:

时钟每秒发出脉冲信号的个数

􀂄主频越快,CPU的速度越快.

􀂄执行一条指令的时间包括：

取指令、分析指令、执行指令（包括存储）。

字长

􀂄字长就是中央处理器可以同时处理多少位数据，通常可以认为是寄存器的长度。

􀂄例如：

􀂄一个8位字长的处理器如果要处理32为字长的数据，则需要用4个加法周期来完成。

􀂄Cache

􀂄减少访问存储器的次数，提高CPU的效率

指令集合的复杂性

􀂄CISC---复杂指令集计算机

􀂄ComplexInstructionSetComputer

􀂄包含大量的指令以及相应的硬件逻辑，程序员使用方便

􀂄RISC---精简指令集计算机

􀂄ReducedInstructionSetComputer

􀂄只包含最基本的功能，其它复杂的功能由简单的执行组合而成。

存储的层次结构

􀂄寄存器

􀂄Cache

􀂄内存（主存）

局部性原理

􀂄程序在一定时间段内通常只会访问一个局部内存空间

􀂄时间局部性

􀂄如果一个内存地址正在被使用，那么在近期他很可能还会再次被访问

􀂄空间局部性

􀂄在最近的将来可能用到的信息很可能是与当前使用的信息相邻的

存储器指存储数据或信息的存储部件。

􀂄存储器分为内存储器和外存储器。

􀂄直接和处理器相连，存放处理器正在处理的数据的存储器是内存，它是暂时性，关掉电源后，数据消失。

􀂄内存大致有四种类型：

􀂄随机存储器RAM

􀂄虚拟存储器

􀂄CMOS

􀂄只读存储器ROM。

RAM（RAM--RandomAccessMemory），

􀂄随机存储器，因为访问时间与地址无关。

􀂄随机存储器的主要元器件是电容，充电时表示1，放电时表示0

􀂄机器工作时，操作系统程序、用户的程序，数据等均在RAM中运行，关掉电源，RAM中内容将消失。

􀂄一种新的的存储器叫做FlashRAM，具有永久性存储信息的能力。

内存编址（线性编址）

􀂄一个存储单元由一个字节组成，每个单元都有编号，称为存储地址。

􀂄存储单元的内容可读可写，给出地址，计算机可以对相应的内容进行读或写，这样的操作成为访问。

两个指标：

容量和速度

实现虚拟内存的功能是操作系统完成的

ROM（ReadOnlyMemory）

􀂄ROM在出厂时，就将中断服务程序、启动程序固化在其中，因此也称固件，其中的内容是永久保存的，不能写信息。

􀂄为什么需要永久保留在机器中指令？

􀂄没有操作系统计算机不工作，计算机不工作不能将操作系统读如计算机---死锁。

􀂄ROM中的启动程序（小型的指令集合）将外存的操作系统读入内存。

􀂄也有一些可写的只读存储器

CMOS（互补金属氧化物半导体存储器）

􀂄保存计算机启动时的基本信息：

硬盘容量、内存大小、软盘类型、鼠标、键盘、显示器属性等。

􀂄CMOS的信息是由电池能量保持，断电不会丢失。

􀂄内容可以由用户改写.

􀂄CMOS的作用是什么？

􀂄为计算机启动提供配置信息

I/O输入输出设备

1.轮询方式（做好了么？

）

2.中断方式（做好了，告诉我！

）

3.DMA方式（你来帮我做）

硬件的基本构成是什么？

电子器件（数字电路，硬件逻辑）

程序变量是什么？

内存单元

冯·诺依曼结构如何工作？

􀂄运算器

􀂄控制器

􀂄存储器

存储程序的思想：

用程序控制计算机的工作

1.鼠标双击该程序图标

2.操作系统根据文件名找到存放该文件的第一个磁盘块

3.操作系统在内存中创建进程结构，并将代码从磁盘copy到内存

4.操作系统让CPU的PC指针指向该程序的第一条指令，并执行

5.操作系统向显示器设备输出字符串”c=9”

6.显示输出c=9

操作系统管理文件

通过程序文件名，找到程序在磁盘上的位置，并控制磁盘旋转，开始读取程序

操作系统控制显示设备

将”c=9”传给显示器，并控制器显示

什么是信息？

􀂃数据按照一种约定被赋予特定意义就构成信息。

􀂃用数据对信息进行表示和编码，使其能够最有效，占最小的空间以最快的速度的传送。

􀂃信息的表示实际上是定义一个协议。

信息论是美国数学家香农创立的。

‘陆地’和‘大海’代表信息单元。

􀂇在计算机中信息编码的方法叫文件格式。

􀂇信息单元越多，用来编码的数据就越多。

每个字符需要一个字节（8bits）来编码（ASCII码）

加密是对已经编码的信息进行变换，掩盖信息的原来所代表的意义。

非数值型数据，则采用编码技术。

􀂇是在众多编码标准中，EBCDIC和ASCII码应用最广。

􀂇ASCII码（扩展）由一个字节中的7位表示一个字母或符号，共有128种编码。

􀂇为了能够发现数据传送中的错误，通常增加一个奇偶校验位。

汉字编码：

16位编码。

国标码包括7445个字符。

只是用两个字节的后7位。

Unicode:

使用16位编码，65536个字符。

能够表示所有的字符和象形文字。

位图图像（bitmap）

􀂃通过独立的像素在屏幕上的位置来存储和表示一幅图形。

􀂇真彩色图像

􀂃每个像素用三原色组成，每个原色有256个级别，因此表示一个像素的颜色需要3*8=24个bit=3个字节。

1024*1024的显示器需要1M个像素*3字节=3M字节的显示存储区

􀂃图形工作站：

每个颜色有65536个级别，需要6M的显示存储区

位图图像可以修改和编辑单个象素进行局部变化或放大。

矢量图像更确切的说是图形。

由一系列可重构的指令构成，计算机存储的是画图的指令而不是像素本身。

􀂇缺点：

矢量图像看起来没有位图图像真实。

􀂇矢量图像的优点：

􀂃存储空间远远小于位图图像,它依赖于图像的复杂性，位图的空间是固定的。

绘图方便,修改方便。

矢量图形在三维造型方面有广泛的应用

􀂇通过一种叫光栅的技术可以将矢量图像转换成位图图像。

将位图图像转换成矢量图像则比较困难。

边缘提取

波形音频是声音的数字形式表示，必须将音频信号变成数字信号。

声音的采样

􀂃每秒钟对声音测量的次数，叫采样速度。

􀂃采样速度越高，声音效果越好。

􀂃采样以Hz单位，例如：

•每秒中采样1000次，则为1KHz.

􀂇声音的存储

􀂃存储1秒钟的声音大约需要88200字节（88k），立体声则需要双倍的空间。

􀂃在采样速度为44.1KHz时，一张软盘只能存储8秒钟的音乐。

􀂃声音文件的扩展名:

*.wav,.mod,.au,.voc

数据压缩

􀂇将原始数据重新编码，达到减少文件大小的目的，便于存储和传输。

􀂇压缩比：

演示文件的大小和压缩后文件大小之比。

􀂉文本文件通常可以压缩到原来的60%

􀂇两种数据压缩技术：

磁盘压缩和文件压缩。

􀂇磁盘压缩是一个有唯一名字的磁盘或区域，当作一个分离的磁盘。

􀂇文件压缩把一个或多个文件压缩成一个单独的较小文件。

􀂇压缩文件通常带有自展开可执行文件，当时用这个文件时，自动执行可执行文件。

文本压缩文件：

自适应的模式替换，指针压缩。

压缩文件必须解压缩才能使用。

图形压缩文件

􀂇游程编码—寻找相同的字节模式并对其进行替换。

视频文件压缩

􀂃减少播放的帧数。

􀂃减小视频窗口大小。

􀂇MPEG（运动图像专家组）

􀂃帧内压缩：

将每一帧用标准的图像压缩技

术进行压缩。

􀂃运动补偿：

只存储图像变化的部分。

所有的信息在计算机中都是以0，1代码的形式存储的

􀂇不同的信息类型有不同的文件格式。

􀂇要表示的信息元素越多，需要的编码数据就越大

􀂇为了减少元文件的存储空间、提高传输速度，压缩

技术是一种有想的手段。

可计算指的是存在算法可解

不可计算指的是不存在算法可解

什么是形式系统？

形式系统就是外在的形式的一种抽象。

两个梨加两个梨，两个桔子加两个桔子

2+2=4

用数学的方法、也就是用符号和公式、公理的方法去研究人的思维过程、思维规律。

只有形式化的问题，才可以用算法的方法加以

解决。

一个问题是可计算,它应该具有以下条件:

确定的，由相同的初始条件必然得到相同的结果。

在有限的时间内在有限的设备上执行

可用数值术语编写（形式化）

计算模型中对计算科学贡献最大的是图灵机模型,对目前的计算机科学仍然具有深刻的影响.

在计算机诞生之前,可计算理论及其计算模型的研究为计算机的产生建立非常重要的理论环境。

用现代术语定义图灵机：

一个是处理器、一个是内存、一个是程序。

图灵（AlanTuring，1912～1954）:

英国科学家,现代计算机历史上最重要的两个人物之一。

他对现代计算机的贡献有两个：

建立图灵机理论模型:

图灵机模型回答了怎样判断一类数学问题是否是机械可解的问题.所有计算机能解决的问题均能用图灵机模型进行定义

提出定义机器智能的图灵测试。

如果一台计算机对于质问的响应与人类做出的响应完全无法区别，那么这台计算机就具有智能。

冯.诺依曼（nn,1903～1957）:

美国数学教授

在EDVAC设计中提出的计算机结构奠定了现代计算机体系结构框架,被称为冯.诺依曼结构.

在EDVAC的设计中提出了（采用了）存储程序的思想

现代计算机之父

第一台电子计算机---ENIAC的诞生（电子数值积分和计算机ElectronicNumericalIntegratorAndComputer）

ENIAC的性能

世界上第一台电子数字计算机,1946年在美国研制成功.

占地170平方米、重30吨、耗电140千瓦

18000个电子管、70000个电阻、10000个电容

10位数的乘法时间3毫秒（10-3毫秒，10-6微秒，10-9纳秒），目前最快的计算机可以做万亿次的计算。

二十世纪重大的科技事件,表示人类计算工具的历史变革.

ENIAC的缺陷

它的存储容量太小。

它的程序是用线路连接的方式实现的，不便于使用。

为了进行几分钟或几小时的数字计算，要花费几小时甚至1～2天的时间做准备。

由于它耗电量大，工作起来常常会因烧坏电子管而被迫停机检修。

冯.诺依曼与EDVAC

首次设计的存储程序计算机

采用二进制

速度比ENIAC快240倍

EDVAC奠定了现代计算机体系结构的基础。

存储程序原理的基本思想

电子元件的机器不应该使用十进制，而应该使用二进制。

程序应当存储在机器的一个部件中，既存储器中。

不论是程序还是数据都以二进制代码表示，指令和数据的形式一致。

线性组织的定长存储单元

使用低级机器语言，其指令完成基本操作码的简单操作

计算机年代划分的原则是：

按照计算机采用的电子器件来划分,虽然片面,但是是权威的

第一代计算机（1946～1957）---电子管（1906）

第二代计算机（1958～1964）---晶体管（1948）

第三代计算机（1965～1971）---集成电路（1960）

第四代计算机（1972～至今）---超大规模集成电路（VLSI）或微处理器等四代。

第五代计算机（人工智能计算机）

日本在1982提出第五代计算机计划，但是失败了。

基础理论研究不够

没有计算模型

并行计算机、网络计算机

集成电路的发展可预见的极限

摩尔定律

如果价钱不变的话，电脑芯片的性能每隔18个月至两年就会翻一番。

（20

展开阅读全文