网络的分布式系统设计.docx

上传人:b****8 文档编号:23566421 上传时间:2023-05-18 格式:DOCX 页数:14 大小:25.42KB
下载 相关 举报
网络的分布式系统设计.docx_第1页
第1页 / 共14页
网络的分布式系统设计.docx_第2页
第2页 / 共14页
网络的分布式系统设计.docx_第3页
第3页 / 共14页
网络的分布式系统设计.docx_第4页
第4页 / 共14页
网络的分布式系统设计.docx_第5页
第5页 / 共14页
点击查看更多>>
下载资源
资源描述

网络的分布式系统设计.docx

《网络的分布式系统设计.docx》由会员分享,可在线阅读,更多相关《网络的分布式系统设计.docx(14页珍藏版)》请在冰豆网上搜索。

网络的分布式系统设计.docx

网络的分布式系统设计

分布式系统(distributedsystem)是建立在网络之上的软件系统。

正是因为软件的特性,所以分布式系统具有高度的内聚性和透明性。

因此,网络和分布式系统之间的区别更多的在于高层软件(特别是操作系统),而不是硬件。

内聚性是指每一个数据库分布节点高度自治,有本地的数据库管理系统。

透明性是指每一个数据库分布节点对用户的应用来说都是透明的,看不出是本地还是远程。

在分布式数据库系统中,用户感觉不到数据是分布的,即用户不须知道关系是否分割、有无副本、数据存于哪个站点以及事务在哪个站点上执行等。

1详细信息

2专业测评

▪分布式操作系统

▪分布式程序设计语言

▪分布式文件系统

▪分布式数据库系统

▪分布式邮件系统

3应用和标准

4分布式系统的优点

▪分布式系统与集中式系统相比较而言的优点

▪分布式系统与独立PC机相比较的优点

5分布式系统的缺点

6分布式系统的应用

▪并行和高性能应用

▪容错应用

▪固有的分布式应用

7分布式系统的测试

▪分布式系统压力测试与性能测试

▪分布式系统自动化测试

8分布式系统目标

1详细信息编辑

在一个分布式系统中,一组独立的计算机展现给用户的是一个统一的整体,就好像是一个系统似的。

系统拥有多种通用的物理和逻辑资源,可以动态的分配任务,分散的物理和逻辑资源通过计算机网络实现信息交换。

系统中存在一个以全局的方式管理计算机资源的分布式操作系统。

通常,对用户来说,分布式系统只有一个模型或范型。

在操作系统之上有一层软件中间件(middleware)负责实现这个模型。

一个著名的分布式系统的例子是万维网(WorldWideWeb),在万维网中,所有的一切看起来就好像是一个文档(Web页面)一样。

在计算机网络中,这种统一性、模型以及其中的软件都不存在。

用户看到的是实际的机器,计算机网络并没有使这些机器看起来是统一的。

如果这些机器有不同的硬件或者不同的操作系统,那么,这些差异对于用户来说都是完全可见的。

如果一个用户希望在一台远程机器上运行一个程序,那么,他必须登陆到远程机器上,然后在那台机器上运行该程序。

分布式系统和计算机网络系统的共同点是:

多数分布式系统是建立在计算机网络之上的,所以分布式系统与计算机网络在物理结构上是基本相同的。

他们的区别在于:

分布式操作系统的设计思想和网络操作系统是不同的,这决定了他们在结构、工作方式和功能上也不同。

网络操作系统要求网络用户在使用网络资源时首先必须了解网络资源,网络用户必须知道网络中各个计算机的功能与配置、软件资源、网络文件结构等情况,在网络中如果用户要读一个共享文件时,用户必须知道这个文件放在哪一台计算机的哪一个目录下;分布式操作系统是以全局方式管理系统资源的,它可以为用户任意调度网络资源,并且调度过程是“透明”的。

当用户提交一个作业时,分布式操作系统能够根据需要在系统中选择最合适的处理器,将用户的作业提交到该处理程序,在处理器完成作业后,将结果传给用户。

在这个过程中,用户并不会意识到有多个处理器的存在,这个系统就像是一个处理器一样。

2专业测评编辑

分布式软件系统(DistributedSoftwareSystems)是支持分布式处理的软件系统,是在由通信网络互联的多处理机体系结构上执行任务的系统。

它包括分布式操作系统、分布式程序设计语言及其编译(解释)系统、分布式文件系统和分布式数据库系统等。

分布式操作系统

负责管理分布式处理系统资源和控制分布式程序运行。

它和集中式操作系统的区别在于资源管理、进程通信和系统结构等方面。

分布式程序设计语言

用于编写运行于分布式计算机系统上的分布式程序。

一个分布式程序由若干个可以独立执行的程序模块组成,它们分布于一个分布式处理系统的多台计算机上被同时执行。

它与集中式的程序设计语言相比有三个特点:

分布性、通信性和稳健性。

分布式文件系统

具有执行远程文件存取的能力,并以透明方式对分布在网络上的文件进行管理和存取。

分布式数据库系统

由分布于多个计算机结点上的若干个数据库系统组成,它提供有效的存取手段来操纵这些结点上的子数据库。

分布式数据库在使用上可视为一个完整的数据库,而实际上它是分布在地理分散的各个结点上。

当然,分布在各个结点上的子数据库在逻辑上是相关的。

分布式邮件系统

分布式邮件系统的部署设计,即同一域名下,跨地域部署的邮件系统。

适用于在各地设有分部的政府机构或者大型集团,有效管理各地的人员结构,同时提高了邮件服务器应用效率。

[1]

分布式邮件系统由多个数据中心组成,大量分支机构或较小的分散站点与数据中心的连接。

分支机构需要建立自己的邮件服务器,来加快处理当地分支机构的邮件。

承载相应的数据处理量。

以提高邮件处理能力,邮件收发速度,邮件功能模块化。

分布式部署方案适合以下情况

1、公司有不同分支机构或较小的分散站点与公司总部的网络连接通常是低带宽、高滞后或不可靠的。

2、公司总部网络无法处理中心位置的服务流量。

3、分支机构有自己的服务器、企业网络、域控制器和系统管理员,包含数目不定的用户。

4、用户要求有更快的邮箱访问速度、更佳的用户体验和可用性。

5、邮箱用户数量大,并发线程多

6、对于安全要求高,需要把邮件服务器不同的功能分开部署。

分布式邮件系统方案情况

1、异地同域名分布式

此方案适用于集团邮件系统,各个下属子公司为了提高邮件收发速度,降低邮件负载而提出的方案。

分为同域名不同用户数分布式和同域名同用户数分布式

2、功能分布式

邮件负载比较重,对于某一些功能要求比较高,需要邮件服务器功能分开部署的客户。

3、用户分布式

邮箱用户数巨大,单机邮件服务器无法承载,服务器做集群。

-----------------------------------------------------------------------------------------------------------------------------------

分布式系统,最简单的例子是Browser--Server结构,这两者结合起来就成了最简单的分布式系统,或者可以这样理解:

基于网络的软件系统大多都是分布式系统,只不过在系统的复杂程度上有所区别而已。

3应用和标准编辑

分布式系统被用在许多不同类型的应用中。

以下我们列出了一些应用。

对这些应用而言,使用分布式系统要比其他体系结构如处理机和共享存储器多处理机更优越:

并行和高性能应用

原则上,并行应用也可以在共享存储器多处理机上运行,但共享存储器系统不能很好地扩大规模以包括大量的处理机。

HPCC(高性能计算和通信)应用一般需要一个可伸缩的设计,这种设计取决于分布式处理。

容错应用

因为每个PE是自治的,所以分布式系统更加可靠。

一个单元或资源(软件或硬件)的故障不影响其他资源的正常功能。

固有的分布式应用

许多应用是固有分布式的。

这些应用是突发模式(burstmode)而非批量模式(bulkmode)。

这方面的实例有事务处理和InternetJavad,程序。

这些应用的性能取决于吞吐量(事务响应时间或每秒完成的事务数)而不是一般多处理机所用的执行时间。

对于一组用户而言,分布式系统有一个特别的应用称为计算机支持的协同工作(ComputerSupportedCooperativeWorking,CSCW)或群件(groupware),支持用户协同工作。

另一个应用是分布式会议,即通过物理的分布式网络进行电子会议。

同样,多媒体远程教学也是一个类似的应用。

由于在不同的平台上如:

Pc、工作站、局域网和广域网上可获得非常多样的应用,用户希望能超出他fliPc的限制以获得更广泛的特实用、功能和性能。

不同网络和环境(包括分布式系统环境)下的q操作性变得越来越重要。

为了达到互操作性,用户需要一个标准的分布式计算环境,在这个环境里,所有系统和资源都可用。

DCE(分布式计算环境)是OSF(开放系统基金会)开发的分布式计算技术的工业标准集。

它提供保护和控制对数据访问的安全服务、容易寻找分布式资源的名字服务、以及高度可伸缩的模型用于组织极为分散的用户、服务和数据。

DCE可在所有主要的计算平台上运行,并设计成支持异型硬件和软件环境下的分布式应用。

DCE已经被包括TRANSVARL在内的一些r一商实现。

TRANSVARL是最早的多厂商组(multivendorteam)的成员之一,它提出的建议已成为DCE体系结构的基础。

在中可以找到利用DCE开发分布式应用的指南。

具有标准接口和协议的系统也叫做开放系统。

一些其它标准基于一个特别的模型,比如CORBA(公用对象请求代理程序体系结构),它是由OMG(对象管理组)和多计算机厂商联盟开发的一个标准。

CORBA使用面向对象模型实现分布式系统中的透明服务请求。

工业界有自己的标准,比如微软的分布式构件对象模型(DCOM)和SunMicrosystem公司的JavaBeans。

4分布式系统的优点编辑

分布式系统与集中式系统相比较而言的优点

系统倾向于分布式发展潮流的真正驱动力是经济。

25年前,计算机权威和评论家HerbGrosch指出CPU的计算能力与它的价格的平方成正比,后来成为Grosch定理。

也就是说如果你付出两倍的价钱,就能获得四倍的性能。

这一论断与当时的大型机技术非常吻合,因而使得许多机构都尽其所能购买最大的单个大型机。

随着微处理机技术的发展,Grosch定理不再适用了。

现在人们只需花几百美元就能买到一个CPU芯片,这个芯片每秒钟执行的指令比80年代最大的大型机的处理机每秒钟所执行的指令还多。

如果你愿意付出两倍的价钱,将得到同样的CPU,但它却以更高的时钟速率运行。

因此,最节约成本的办法通常是在一个系统中使用集中在一起的大量的廉价CPU。

所以,倾向于分布式系统的主要原因是它可以潜在地得到比单个的大型集中式系统好得多的性价比。

实际上,分布式系统是通过较低廉的价格来实现相似的性能的。

与这一观点稍有不同的是,我们发现微处理机的集合不仅能产生比单个大型主机更好的性能价格比,而且还能产生单个大型主机无论如何都不能达到的绝对性能。

例如,按目前的技术,我们能够用10,000个现代CPU芯片组成一个系统,每个CPU芯片以50MIPS(每秒百万指令)的速率运行,那么整个系统的性能就是500,000MIPS。

而如果单个处理机(即CPU)要达到这一性能,就必需在2×10-12秒(2微微秒,0.002纳秒)的时间内执行一条指令,然而没有一个现存的计算机能接近这个速度,从理论上和工程上考虑都认为能达到这一要求的计算机都是不可能存在的。

理论上,爱因斯坦的相对论指出光的传播速度最快,它能在2微微秒内传播0.6毫米。

实际上,一个包含于边长为0.6毫米大小的立方体内的具有上面所说的计算速度的计算机产生大量的热量就能将它自己立即熔掉。

所以,无论是要以低价格获得普通的性能还是要以较高的价格获得极高的性能,分布式系统都能够满足。

另一方面,一些作者对分布式系统和并行系统进行了区分。

他们认为分布式系统是设计用来允许众多用户一起工作的,而并行系统的唯一目标就是以最快的速度完成一个任务,就像我们的速度为500,000MIPS的计算机那样。

我们认为,上述的区别是难以成立的,因为实际上这两个设计领域是统一的。

我们更愿意在最广泛的意义上使用“分布式系统”一词来表示任何一个有多个互连的CPU协同工作的系统。

建立分布式系统的另一原因在于一些应用本身是分布式的。

一个超级市场连锁店可能有许多分店,每个商店都需要采购当地生产的商品(可能来自本地的农场)、进行本地销售,或者要对本地的哪些蔬菜因时间太长或已经腐烂而必须扔掉作出决定。

因此,每个商店的本地计算机能明了存货清单是有意义的,而不是集中于公司总部。

毕竟,大多数查询和更新都是在本地进行的。

然而,连锁超级市场的高层管理者也会不时地想要了解他们目前还有多少甘蓝。

实现这一目标的一种途径就是将整个系统建设成对于应用程序来说就像一台计算机一样,但是在实现上它是分布的,像我们前面所描述的一个商店有一台机器。

这就是一个商业分布式系统。

另一种固有的分布式系统是通常被称为计算机支持下的协同工作系统(CSCW,ComputerSupportedCooperativeWork)。

在这个系统中,一组相互之间在物理上距离较远的人员可以一起进行工作,例如,写出同一份报告。

就计算机工业的长期发展趋势来说,人们可以很容易的想像出一个全新领域--计算机支持的协同游戏(CSCG:

ComputerSupportedCooperativeGames)。

在这个游戏中,不在同一地方的游戏者可以实时的玩游戏。

你可以想像,在一个多维迷宫中玩电子捉迷藏,甚至是一起玩一场电子空战,每个人操纵自己的本地飞行模拟器去试着击落别的游戏者,每个游戏者的屏幕上都显示出其飞机外的情况,包括其它飞入它的视野的飞机。

同集中式系统相比较,分布式系统的另一个潜在的优势在于它的高可靠性。

通过把工作负载分散到众多的机器上,单个芯片故障最多只会使一台机器停机,而其它机器不会受任何影响。

理想条件下,某一时刻如果有5%的计算机出现故障,系统将仍能继续工作,只不过损失5%的性能。

对于关键性的应用,如核反应堆或飞机的控制系统,采用分布式系统来实现主要是考虑到它可以获得高可靠性。

最后,渐增式的增长方式也是分布式系统优于集中式系统的一个潜在的重要的原因。

通常,一个公司会买一台大型主机来完成所有的工作。

而当公司繁荣扩充、工作量就会增大,当其增大到某一程度时,这个主机就不能再胜任了。

仅有的解决办法是要么用更大型的机器(如果有的话)代替现有的大型主机,要么再增加一台大型主机。

这两种作法都会引起公司运转混乱。

相比较之下,如果采用分布式系统,仅给系统增加一些处理机就可能解决这个问题,而且这也允许系统在需求增长的时候逐渐进行扩充。

表1-1中总结了以上这些优点。

项目

描述

经济

微处理机提供了比大型主机更好的性能价格比

速度

分布式系统总的计算能力比单个大型主机更强

固有的分布性

一些应用涉及到空间上分散的机器

可靠性

如果一个机器崩溃,整个系统还可以运转

渐增

计算能力可以逐渐有所增加

从长远的角度来看,主要的驱动力将是大量个人计算机的存在和人们共同工作与信息共享的需要,这种信息共享必需是以一种方便的形式进行的,而不受地理或人员、数据,机器的物理分布的影响。

分布式系统与独立PC机相比较的优点

既然使用微处理机是一种节省开支的办法,那么为什么不给每个人一台个人计算机,让他们各自独立地工作呢?

一则,许多用户需要共享数据。

例如,机票预订处的工作人员需要访问存储航班以及现有座位信息的主数据库。

假如给每个工作人员都备份整个数据库,那么在实际中这是无法工作的,因为没有人知道其他工作人员已经卖出了哪些座位。

共享的数据是上例和许多其它应用的基础,所以计算机间必须互连。

而计算机互连就产生了分布式系统。

共享并不只是仅仅涉及数据。

昂贵的外设,例如彩色激光打印机,照相排版机以及大型存储设备(如自动光盘点唱机)都是共享资源。

把一组孤立的计算机连成一个分布式系统的第三个原因是它可以增强人与人之间的沟通,电子邮件比信件、电话和传真有更多的诱人之处。

它比信件快的多,不像电话需要两人同时都在,也不像传真,它所产生的文件可在计算机中进行编辑、重排和存储,也可以由文本处理程序来处理。

最后,分布式系统可能比给每个用户一个独立的计算机更灵活。

尽管一种可能的模式是给每个人一台个人计算机并把它们通过LAN联在一起,但这种方式并不是唯一的。

另外还存在一种模式是将个人计算机和共享计算机混合连接在一起(这些机器的型号可能并不完全相同),使工作能够在最合适的计算机上完成,而并不总是在自己的计算机上完成。

这种方式可以使工作负荷能更有效地在计算机系统中进行分配。

系统中某些计算机的失效也可以通过使其工作在其它计算机上进行而得到补偿。

表1-2总结了以上所介绍的各点。

项目

描述

数据共享

允许多个用户访问一个公共的数据库

设备共享

允许多个用户共享昂贵的外围设备(如彩色打印机)

通信

使得人们之间的通信更加容易,如通过电子邮件

灵活性

用最有效的方式将工作负荷分配到可用的机器上

5分布式系统的缺点编辑

尽管分布式系统有许多优点,但也有缺点。

本节就将指出其中的一些缺点。

我们前面已经提到了最棘手的问题:

软件。

就目前的最新技术发展水平,我们在设计、实现及使用分布式系统上都没有太多的经验。

什么样的操作系统、程序设计语言和应用适合这一系统呢?

用户对分布式系统中分布式处理又应该了解多少呢?

系统应当做多少而用户又应当做多少呢?

专家们的观点不一(这并不是因为专家们与众不同,而是因为对于分布式系统他们也很少涉及)。

随着更多的研究的进行,这些问题将会逐渐减少。

但是目前我们不应该低估这个问题。

第二个潜在的问题是通信网络。

由于它会损失信息,所以就需要专门的软件进行恢复。

同时,网络还会产生过载。

当网络负载趋于饱和时,必须对它进行改造替换或加入另外一个网络扩容。

在这两种情况下,一个或多个建筑中的某些部分必须花费很高的费用进行重新布线,或者更换网络接口板(例如用光纤)。

一旦系统依赖于网络,那么网络的信息丢失或饱和将会抵消我们通过建立分布式系统所获得的大部分优势。

最后,上面我们作为优点来描述的数据易于共享性也是具有两面性的。

如果人们能够很方便地存取整个系统中的数据,那么他们同样也能很方便地存取与他们无关的数据。

换句话说,我们经常要考虑系统的安全性问题。

通常,对必须绝对保密的数据,使用一个专用的、不与其它任何机器相连的孤立的个人计算机进行存储的方法更可取。

而且这个计算机被保存在一个上锁的十分安全的房间中,与这台计算相配套的所有软盘都存放在这个房间中的一个保险箱中。

分布式系统的缺点如表1-3所示。

项目

描述

软件

目前为分布式系统开发的软件还很少

网络

网络可能饱和和引起其它的问题

安全

容易造成对保密数据的访问

表1-3.分布式系统的缺点

尽管存在这些潜在的问题,许多人还是认为分布式系统的优点多于缺点,并且普遍认为分布式系统在未来几年中会越来越重要。

实际上,在几年之内许多机构会将他们的大多数计算机连接到大型分布式系统中,为用户提供更好、更廉价和更方便的服务。

而在十年之后,中型或大型商业或其它机构中可能将不再存在一台孤立的计算机了。

6分布式系统的应用编辑

· 分布式系统被用在许多不同类型的应用中。

以下我们列出了一些应用。

对这些应用而言,使用分布式系统要比其他体系结构如处理机和共享存储器多处理机更优越:

并行和高性能应用

原则上,并行应用也可以在共享存储器多处理机上运行,但共享存储器系统不能很好地扩大规模以包括大量的处理机。

HPCC(高性能计算和通信)应用一般需要一个可伸缩的设计,这种设计取决于分布式处理。

容错应用

因为每个PE是自治的,所以分布式系统更加可靠。

一个单元或资源(软件或硬件)的故障不影响其他资源的正常功能。

固有的分布式应用

许多应用是固有分布式的。

这些应用是突发模式(burstmode)而非批量模式(bulkmode)。

这方面的实例有事务处理和InternetJavad,程序。

这些应用的性能取决于吞吐量(事务响应时阳J或每秒完成的事务数)而不是一般多处理机所用的执行时间。

对于一组用户而言,分布式系统有一个特别的应用称为计算机支持的协同工作(computersupportedCooperativeworking,CSCW)或群件(groupware),支持用户协同工作。

另一个应用是分布式会议,即通过物理的分布式网络进行电子会议。

同样,多媒体远程教学也是一个类似的应用。

由于在不同的平台上如:

Pc、工作站、局域网和广域网上可获得非常多样的应用,用户希望能超出他fliPc的限制以获得更广泛的特十牛、功能和性能。

不同网络和环境(包括分布式系统环境)下的q操作性变得越来越重要。

为了达到互操作性,用户需要一个标准的分布式计算环境,在这个环境里,所有系统和资源都可用。

DCE(分布式计算环境)是OSF(开放系统基金会)开发的分布式计算技术的工业标准集。

它提供保护和控制对数据访问的安全服务、容易寻找分布式资源的名字服务、以及高度可伸缩的模型用于组织极为分散的用户、服务和数据。

DCE可在所有主要的计算平台上运行,并设计成支持异型硬件和软件环境下的分布式应用。

DCE已经被包括TRANSVARL在内的一些r一商实现。

TRANSVARL是最早的多厂商组(multivendorteam)的成员之一,它提出的建议已成为DCE体系结构的基础。

在中可以找到利用DCE开发分布式应用的指南。

具有标准接口和协议的系统也叫做开放系统。

一些其它标准基于一个特别的模型,比如CORBA(公用对象请求代理程序体系结构),它是由OMG(对象管理组)和多计算机厂商联盟开发的一个标准。

CORBA使用面向对象模型实现分布式系统中的透明服务请求。

工业界有自己的标准,比如微软的分布式构件对象模型(DCOM)和SunMicrosystem公司的JavaBeans。

7分布式系统的测试编辑

· 在测试执行过程中,对测试结果的分析是一个需要进行深入思考的重点问题。

分布式系统测试的重点在于对后端服务器集群的测试,而判定系统中是否存在Bug则是我们需要解决的重要问题。

那么应该如何确定是否存在Bug呢?

对于测试结果的分析,我们通常观察下面几种情况。

观察前端应用的返回结果。

这里需要分两种情况来考虑:

第一,按照前端应用业务功能点及流程进行操作,观察返回结果是否符合业务方的需求预期;第二,操作后端的服务器(通常是重启、宕机、断网等操作),观察前端应用的返回结果是否符合系统的设计需求。

分析服务器日志。

在功能测试过程中,当我们在启动服务器的时候,需要将日志级别定义为Debug级别(最低级别)。

这样做的主要目的是为了能便于测试工程师来分析日志和定位问题。

为了能更好地定位问题,常常需要在服务器程序代码中进行日志打桩,把程序中的一些重要数据通过日志的方式展现出来。

通常情况下,我们需要对日志的格式进行约定,在日志行中增加一些关键字来进行分类,这将便于测试工程师进行日志分析,也有利于开展分布式系统的自动化测试。

另外,值得注意的是,我们尽可能地将打桩代码放在Debug代码中,避免影响系统代码,引入新问题。

分析操作系统的一些重要信息。

我们测试的分布式系统绝大多数是基于Linux操作系统开发的,在测试的过程中,除了详细分析程序日志以外,还需要对操作系统的一些重要数据信息进行分析,从而来诊断服务器程序是否存在异常。

以Linux操作系统为例,我们常常会使用top命令、netstat命令及sar命令来查看操作系统的一些数据信息。

例如,可以通过netstat命令检查服务器程序是否正确地监听了指定的端口等。

借助其他分析工具。

例如,如何判断服务器程序是否产生了内存泄漏?

通常需要借助于内存检测工具来进行分析。

在Linux环境下,我们常用Valgrind来进行内存检测。

这是一款非常好用、功能强大的分析工具,可以帮助测试或者开发工程师快速发现很多隐藏的程序Bug,尤其是在内存检测方面(同时它还具有很多其他优秀的功能,读者可以自己查看官网中的使用手册)。

分布式系统压力测试与性能测试

对于分布式系统而言,压力测试和性能测试非常重要。

在进行压力测试和性能测试的时候,可能会碰到下面一些难点。

数据准备。

如何准备海量的测试数据并保证模拟数据的真实性?

以一个分布式的文件系统为例,预先存入100GB的数据还是存入100TB的数据、存入的文件是大小基本一致差别不大还是各不相同甚至差异很大

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高等教育 > 其它

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1