高性能云计算从科学应用的角度 HighPerformance Cloud Computing翻译.docx

上传人:b****3 文档编号:3521445 上传时间:2022-11-23 格式:DOCX 页数:11 大小:31.29KB
下载 相关 举报
高性能云计算从科学应用的角度 HighPerformance Cloud Computing翻译.docx_第1页
第1页 / 共11页
高性能云计算从科学应用的角度 HighPerformance Cloud Computing翻译.docx_第2页
第2页 / 共11页
高性能云计算从科学应用的角度 HighPerformance Cloud Computing翻译.docx_第3页
第3页 / 共11页
高性能云计算从科学应用的角度 HighPerformance Cloud Computing翻译.docx_第4页
第4页 / 共11页
高性能云计算从科学应用的角度 HighPerformance Cloud Computing翻译.docx_第5页
第5页 / 共11页
点击查看更多>>
下载资源
资源描述

高性能云计算从科学应用的角度 HighPerformance Cloud Computing翻译.docx

《高性能云计算从科学应用的角度 HighPerformance Cloud Computing翻译.docx》由会员分享,可在线阅读,更多相关《高性能云计算从科学应用的角度 HighPerformance Cloud Computing翻译.docx(11页珍藏版)》请在冰豆网上搜索。

高性能云计算从科学应用的角度 HighPerformance Cloud Computing翻译.docx

高性能云计算从科学应用的角度HighPerformanceCloudComputing翻译

2009年第10届普适系统、算法和网络国际研讨会

高性能云计算:

从科学应用的角度

摘要:

科学计算往往需要可用的数量庞大的计算机来执行大规模实验。

传统上,这些需求已通过使用高性能计算机解决方案和安装集群和超级计算机等设施来解决,这些设施很难建立,维护和操作。

云计算为科学家提供了利用计算基础设施的完全新模式。

计算资源,存储资源,以及应用程序,可动态提供的(和现有的基础设施集成)基础上按使用量付费。

他们不需要的时候,这些资源可以被释放。

提供这种服务通常是在保证所需服务质量的服务水平协议范围内。

Aneka,一个企业云计算解决方案,通过利用私有云和公有云的计算资源向用户提供所需的服务质量。

其灵活性和基础设施服务支持多种编程模式,使Aneka适用各种不同的场景:

从财务应用程序到科学计算。

作为在云中进行的科学计算案例,提出了利用Aneka进行基因表达数据分类和脑功能磁共振成像工作流程执行的初步案例研究。

关键字:

科学计算,计算科学,云计算,高性能计算

一、引言

科学计算包括数学模型和数值求解技术来解决科学,社会科学和工程问题。

这些模型往往需要大量的计算资源进行大规模的实验,或计算复杂性削减到一个合理的时间框架。

这些需求已初步具有专用高性能计算(HPC)的基础设施,如集群或同一部门联网的机器群,这些基础设施由“CPU周期清道夫”管理,如秃鹰软件。

随着网格计算的到来,给科学家提供了新的机会:

与电网完全类比,计算网格可以按需提供“马力”从事大型实验,依托机器的网络潜在的延伸到世界各地。

计算网格引入新的功能,动态发现服务,依靠大量属于管理域的资源和发现满足应用要求的最佳机器设置的能力。

科学计算网格已变得如此成功,以至于许多国际项目导致了建立世界范围的基础设施提供给科学计算。

开放科学电网,最初设想使大型强子对撞机数据分析便利,连接25000台主机设备和为不同学科的数据密集型研究提供支持,比如生物,化学,粒子物理,地理信息系统。

欧洲高效电子科学网络起初由欧盟委员会资助,连接亚欧、美国超过91个机构,建立世界最大的各种科学的计算网格基础设施。

TeraGRID是一个国家科学基金会资助的项目,提供科学家大量的建立在9个资源提供商伙伴网站的资源顶部。

它被用于4000个用户,200多所大学的在分子生物学,海洋科学,地球科学,数学,神经科学,设计与制造,以及其他学科的先进研究。

这些仅仅是科学网格计算最具代表性的例子。

尽管网格技术在科学计算上的广泛使用,由大量运用上述计算网格的项目证实,有些问题仍然不像描述的使用这种技术这么容易。

有些问题是官僚的:

这些网格在全球范围内分享,研究团体要提交提案描述他们希望来进行的研究类型。

这种做法导致了竞争地使用科学网格,使小型研究项目无法获得。

其他问题是技术,更重要的是:

在大多数情况下的科学网格功能预包装应用程序将被执行的环境,有时具体的工具和API不得不使用,有可能在宿主操作系统或运行环境所提供的服务有限制。

虽然网格计算有动态发现的服务,以及对各种应用的运行环境,在实践中一组有限的选项供科学家选择,有时它们不能有足够的弹性来应付需求。

一个实际的例子,关于具体软件的使用,可能在程序执行的运行环境中无法使用。

在一般情况下,运行在科学网格中的应用程序以任务包的形式实现,应用程序,工作流程和MPI(消息传递接口)并行过程。

一些科学实验无法适应这些模型,必须进行重组或重新设计来使用科学网格。

鉴于官僚问题可以是一个小问题,技术问题是科学计算的基本障碍。

从这个方面上讲,PlanetLab提出的基于虚拟机的方法很有用。

PlanetLab是用于开发,部署和访问行星规模服务的开放平台。

用户赋予一个接入PlanetLab基础设施节点集虚拟机的刀片机,因此,一个刀片机可按照具体用途完全定制。

目前,PlanetLab是作为一个试验台主要用于计算机网络和分布式系统的研究,它是唯一能够访问隶属于企业和大学的PlanetLab节点的基础设施。

这使得它被用于计算科学相当有限。

云计算,目前提供IT服务出现的新趋势,许多上述问题可以解决。

通过虚拟化技术手段,云计算为最终用户提供一个涵盖整个计算堆栈的各种服务,从硬件到应用级,按每使用收取。

另一个重要的特征,科学家可以从中受益,能够根据应用需求和用户预算来自动伸缩使用计算基础设施的规模大小。

科学家通过使用基于云技术可以很容易获得大型分布式基础设施和完全定制自己的执行环境,从而实现实验中完美的设置。

此外,通过租用的按每使用支付的基础设施上,他们可以在没有任何容量计划立即获得所需的资源,当他们不再需要时,可以自由地释放资源。

云计算为提供IT服务的每级计算堆栈提供灵活的机制:

从硬件级到应用级。

硬件设备和应用解决方案分别由硬件虚拟化和软件即服务提供。

这使得有非常多的选择可供科学家,足以满足他们的任何具体研究需要。

云计算解决方案的热度正在快速增长。

结果,他们已经在很多领域被采用了,如社交网络,商业应用和信息传递网络。

目前,计算科学利用云计算仍然是有限,但实现这一目标的第一步已经完成了。

今年,能源部(DOE)的国家实验室开始探索利用云计算服务进行科学计算。

在2009年4月,雅虎公司宣布,它已经扩展了在美国各大顶尖大学的合作关系,推动云计算的研究和计算科学和工程的应用。

第一个基于云的计算科学基础设施,科学云,已经由芝加哥大学,伊利诺伊,普渡大学和马萨里克大学共同部署。

从研究观点,初步的研究已经进行了可行性的科学计算用云计算。

一些研究通过分析使用的高性能计算科学应用的表现或科学实验在亚马逊云计算基础设施的表现来调查使用云计算技术的好处。

不同的解决方案可从传统的科学网格移动到云计算模式中。

一些厂商,如亚马逊网络服务和VMWare靠硬件级虚拟化和按需提供计算和存储资源来提供服务。

谷歌AppEngine和微软Azure更侧重于通过实施一个具体的应用模式来实现应用程序级的虚拟化,充分利用其巨大的基础设施和按需服务。

其他的解决方案提供最终用户一个云计算应用程序的平台,从而提供用户一个更好的服务质量。

Aneka是一个用于开发应用程序的云计算平台,可以按需利用虚拟资源的CPU周期,桌面台式机和集群。

它支持多种编程模式,提供科学家表达他们的应用程序逻辑的不同选择:

任务包,分布式线程,数据流,或MapReduce。

它的服务导向架构提供用户一个完全定制的基础设施,能够满足应用程序所需的服务质量。

本文的其余部分的组织如下:

第一,我们通过云计算参考模型和范例的关键要素概述云计算。

然后,我们将介绍Aneka,并详细讨论它的特征,强调如何支持计算科学。

作为个案研究,我们将介绍基因表达数据的分类和在亚马逊EC2上执行的科学工作流程。

最后讨论关于作为科学计算有效支持的云计算的未来发展方向的思考和展望。

二、云的发展

云计算这个术语包括许多方面,范围从最终用户在使用这项技术带来新机遇的经验到系统实现使这些机会变成现实。

在本节中,我们将给出云计算的特征,引入云计算参考模型,并确定这项新技术提供的关键服务。

A云的定义

虽然,云计算这个术语过于宽泛,很难给出一个单一的定义,它有可能确定一些这方面趋势特点的关键要素。

阿布鲁斯特等认为,“云计算不仅指通过互联网的应用程序作为服务,而且是数据中心的硬件和软件系统提供这些服务”。

然后,他们定义云是由硬件和软件构成的数据中心。

Buyya等给出一个更具结构化的定义,定义为“并行和分布式的互联和虚拟化的计算机的集合,是动态供应和作为一个或多个统一的计算资源提出了基于服务水平协议组成的系统类型”。

云计算的特征的主要特点之一是提供基础设施和软件作为服务的能力。

更确切地说,它是一种技术,旨在提供随需应变的按每使用支付的IT资源。

先前趋势仅限于特定的用户类,或者特定种类的IT资源。

云计算的目标是成为全球性的:

它提供了上述服务给各行各业,从最终用户在因特网上的个人文件到企业外包其整个IT基础设施到外部数据中心。

B云计算的参考模型

图1给出了一个云计算述设想的方案概述。

它提出了一个分层视图包括IT基础设施,服务和应用程序,即构成云计算堆栈。

它可以区分四个不同的层次,从系统向最终用户逐步过渡。

堆栈的最低级的特点是物理资源部署在基础设施之上这些资源可以是不同的类型:

集群,数据中心,备用台式机。

基础设施支持商业云部署更可能由数百或上千台机器的数据中心构成,而私有云能提供更多的异构环境,即使是备用台式机的的空闲CPU周期用于计算工作量。

这一级提供云的“马力”。

物理基础设施由核心中间件层管理,其目的是为应用程序提供适当的运行环境,并利用最佳的物理资源。

为了提供优质的服务,如应用程序隔离,服务质量,沙盒,核心中间件可以依靠虚拟化技术。

在不同的虚拟化解决方案中,硬件级虚拟化和编程语言级的虚拟化是最流行的。

硬件级虚拟化保证应用程序完全隔离和通过虚拟机的物理资源分割,如内存和CPU。

编程级虚拟化提供沙盒,托管执行应用程序开发一种具体技术或编程语言。

(即Java,.NET,和Python)的。

在此之上,核心中间件提供一系列广泛的服务,可以协助服务提供者给最终用户提供专业的和商业的服务。

这些服务包括:

开票和服务质量协商,接入控制,执行管理和监督,会计和计费。

连同物理基础设施,核心中间件代表部署在云端的应用程序的平台之上。

很少有直接用户级来访问这一层。

更普遍的是,核心中间件提供的服务可通过一个用户级中间件接入。

这提供了环境和工具简化了开发和部署云应用。

它们是:

Web2.0接口,命令行工具,库和编程语言。

用户级中间件构成了到云端的应用程序接入点。

C云计算服务产品

由云计算堆栈公开的服务种类繁多,可分组为三种主要的产品,提供给最终用户,科研机构和企业。

它们是:

基础设施即服务(IaaS),平台即服务(PaaS),和软件即服务(SaaS)。

图2给出了这样的分类。

术语基础设施即服务或硬件即服务指的是基于虚拟化或物理资源的基础设施向商品一样提供给消费者。

这些资源满足对最终用户对内存,CPU类型和能力,存储,并在大多数情况下操作系统的需求。

用户按使用计费的基础上支付,必须建立他们的系统在这些资源之上,被托管和管理在卖方所拥有的数据中心。

亚马逊是提供基础设施即服务解决方案的主要公司之一。

亚马逊弹性计算云(EC2)提供了一个大的计算基础设施和基于硬件虚拟化的服务。

通过使用亚马逊网络服务,用户可以创建亚马逊机器映像(AMIs),并将它们保存为可以运行多个实例的模板。

它可以运行Windows或Linux虚拟机和用户费用按运行每实例每小时收取。

亚马逊还通过亚马逊简单存储服务(S3)提供存储服务,用户可以使用AmazonS3访问来自任何地方接入的大量数据。

平台即服务解决方案提供一个应用程序或开发平台,用户可以开发自己的应用程序在云端运行。

PaaS的实现提供了一个应用程序框架和一组API,可被开发人员用来编程或组成云端的应用程序。

在某些情况下,PaaS的解决方案通常作为一个综合系统交付,同时提供一个开发平台和应用程序在这之上执行的IT基础设施。

采用这一策略的公司主要有谷歌和微软。

谷歌AppEngine是一个用于开发可伸缩的Web应用的平台,运行在谷歌基础设施服务器上。

它提供了一套API和应用程序模型,允许开发者谷歌提供的另外服务,如邮件,数据存储,内存缓存和其它的。

按照所提供的应用模型,开发人员可以用Java,Python和JRuby创建应用程序。

这些应用程序将运行在一个沙箱中,AppEngine会按需自动调整。

谷歌提供了一个免费但有限的服务,同时利用每天和每分钟配额,应用需要专业的服务。

Azure是微软提供为开发云端可扩展应用的解决方案。

这是一个云服务操作系统的平台,作为Azure服务平台的开发,运行时间,控制环境。

通过使用微软Azure的SDK,开发人员可以利用.NET框架创建服务。

这些服务必须通过微软Azure门户上传,为了在WindowsAzure上执行。

附加服务用来构建企业应用程序,如工作流执行和管理,Web服务业务流程,和获得SQL数据。

Aneka是Manjrasoft的产品,是一个纯粹的软件即服务,并提供最终用户和开发者在云端使用.NET技术开发分布式应用程序的一个平台技术。

该Aneka核心价值是一个面向服务的运行环境-Aneka容器-这是部署在物理和虚拟基础设施,并允许由不同的编程模型开发的应用程序的执行。

Aneka提供了一个软件开发工具包(SDK)帮助开发人员开发任何语言支持.NET云应用程序,和在Windows和Linux系统上建立和部署云的工具集。

作为一个纯粹的平台即服务解决方案,Aneka不提供的IT硬件基础设施建立计算云,但系统管理员可以轻松地通过在集群上部署Aneka容器,数据中心,简单的桌面电脑,甚至在亚马逊机器映像上捆绑来建立Aneka云。

软件即服务解决方案是在云计算堆栈的顶端,它们提供最终用户集成的服务,包括硬件,开发平台和应用程序。

用户不能定制服务,但可以访问云端特定的应用程序。

软件即服务实现的历史是谷歌提供的办公自动化,如谷歌文档和谷歌日历,免费提供给因特网用户,而且是专业优质的服务。

S和C的商业解决方案例子是,分别服务提供在线客户关系管理和项目管理服务。

表一给出了一些最具代表性公司在提供云计算基础设施即服务/平台即服务的功能比较。

在论文其余的部分,我们将主要集中在Aneka,以及它如何被用来在云端进行科学计算。

二、ANEKA

Aneka是一个软件平台和在云端开发分布式应用程序的框架。

它按需利用台式机和服务器或数据中心异构网络的计算资源。

Aneka为开发人员提供了丰富的API,以便透明地利用这些资源和通过各种编程抽象来表示应用程序逻辑。

系统管理员可以利用一系列工具监测和控制部署的基础设施。

通过互联网公共云提供给任何人,而企业的私有云由一些访问受限的节点构成。

灵活且面向服务设计的Aneka及其它完全可定制的体系结构使Aneka云能够支持不同的方案。

Aneka云可以提供纯净的财务应用所需的计算能力,可以是一个分布式计算的教学参考模型,也可以构成一个更复杂的网络组件,用来满足大规模科学实验的需要。

这也是由各种应用程序模式通过可扩展的编程模型集来实现。

为开发者上线他们的分布式应用程序定义逻辑和抽象。

作为一个例子,为了运行科学实验,可能依靠一个经典的任务模式包,或者为了实现应用程序作为一个相互作用的线程或MPI进程的集合,相互关联的任务集定义一个工作流程,或一系列MapReduce的任务。

如果可用的选项不符合要求的,是有可能的用新的编程抽象无缝扩展系统。

Aneka云可建立在不同的物理基础设施之上,与其他云计算解决方案集成,如亚马逊EC2,以按需扩展它们的能力。

在这种特殊情况下,Aneka充当中间人,减少用户的应用程序访问公共云。

作为应用服务提供商,通过使用精细和复杂的定价政策,最大限度地利用所租的虚拟资源和分享用户花费。

一个特别重要的是届时,当Aneka集成公共云会计和定价服务如何运作。

图3给出了Aneka架构概述。

为了开发云计算应用程序,给开发者提供了软件开发工具包组成的框架来编程,一个监测和管理Aneka云的管理工具包和一个可配置的基于容器的服务,构成Aneka云的基石。

在本节我们将主要集中于三个主要特点:

Aneka云架构,应用模型和Aneka和公共云整合提供的服务。

AAneka云

Aneka云是一个软件守护进程的集合-所谓容器-可托管在物理或虚拟资源,通过因特网或专用Intranet连接。

Aneka容器是整个系统的基石,并公开一个自定义应用程序运行环境服务的集合。

它为单一节点提供了基本管理功能,并利用托管服务来执行所有的其他操作。

我们可以识别光纤和基础服务。

光纤服务通过平台抽象层与节点直接交互,执行硬件分析和动态资源配置。

基础服务识别Aneka基础设施的核心系统,他们提供基本特征集,每个Aneka容器可专用于执行具体的任务集。

Aneka的主要特点之一是能够通过不同的编程模型来提供多种分布式应用程序上线的方法;执行服务主要是关注提供实现这些模型的中间件。

额外的服务横向到整个堆栈由容器托管的服务,如持久性和安全性。

容器的网络可以是不同部署方案的结果:

它可以代表一个完全由相同管理域的物理机(台式机和集群)构成的私有云,如企业或大学部。

另一方面,一个完全虚拟的基础设施是可能的,整个Aneka云可以托管在公共云,如亚马逊EC2或桉树管理的私人数据中心。

混合系统也允许的,他们也是最常见的。

在这种情况下,当地的基础设施利用额外的虚拟资源扩展,如图4所示。

Aneka云能按需伸缩和提供其他节点或释放时一些不再需要的节点。

这些节点可以是虚拟或物理资源。

物理节点可以通过网络只需关闭节点中的容器就能释放,而在虚拟资源情况下,它还需要终止托管容器的虚拟机。

这个过程可以手动执行或由调度对云状态弹性和自主地管理。

除供应政策,托管在虚拟机或物理资源中的容器没有区别,因为所有的硬件相关的任务都封装在平台抽象层。

如图3所示,供应模块属于光纤服务,并公开其服务给其他操作不同的组件。

一个服务集总是部署在Aneka云端。

除了光纤服务,该容器的执行核心是基础服务,履行管理Aneka云的基本操作。

其中,会员服务在所有云节点跟踪和提供注册表起关键作用,可用于通过特定配置或操作系统动态发现网络或节点服务。

比如,它们可以利用调度服务来定位所有的节点,支持一个给定编程模型执行。

其他组件提供特权基本功能,如支持特权执行的文件传输和资源预留。

Aneka容器定制取代基础服务。

甚至,Aneka容器可在任何层配置和定制,执行服务常用来区分节点。

如图4所示,一个典型的配置功能部署,调度服务安装在有限数量的节点上,大部分容器配置为计算资源。

此方案确定了主从拓扑结构,这是唯一的Aneka的可能选择,这可能只适合一些编程模型。

一个基于调度和元调度的分层拓扑可以为大型基础设施和重负载条件提供更好的解决方案。

这个简短的概述提供了关于Aneka云和它的内部结构的一个总体思路的设计原则。

下面,我们将介绍Aneka应用模型开发的功能如何提供定制的运行环境来支持不同的应用程序编程模式。

BAneka应用模型

Aneka应用模型定义了基本抽象,构成托管在Aneka云端的分布式应用程序。

它确定了每一个具体实施必须满足的要求,为了无缝地集成到Aneka并利用所有托管在云中可用的服务。

应用模型还指定了对运行环境的总体要求,预计来运行是建立在一个特定模型之上的应用程序。

不同于其他中间件的实现Aneka不支持单任务的执行,但任何单位的用户代码在一个分布式应用程序中执行。

Aneka中的应用程序有一系列执行单元构成,其性质取决于具体所用的编程模型。

一个应用程序是在Aneka中部署,配置和在应用级安全操作的联合。

执行单元构成应用程序的逻辑。

单元调度和执行的方法具体到它们属于的编程模型。

通过使用这种通用模式,框架提供了一套跨越所有支持的编程模型的服务:

仓储,持久性,档案管理,监理,会计和安全性。

为了实现具体的编程模型Aneka开发者必须:

•定义将被软件工程师用于架构分布式应用程序的抽象,并确定其执行逻辑;

•提供执行服务的实施,要求管理Aneka云的抽象执行;

•实现一个客户端组件与执行服务协调,管理客户端执行。

这些组件对于任何编程模型的不同实现是普遍的。

当前版本的Aneka支持四种不同的编程模型。

它们是:

任务模型,线程模型,MapReduce模型和参数扫描模型(PSM)。

其他正在开发中,如角色模型,MPI模型和工作流。

表二给出了这些模型的一个功能比较和演示了Aneka应用模型的灵活性。

对于每个模型,其中的应用程序类型或场景,自然适合该模型进行了简要介绍。

表提供了每个模式的简要说明,代表Aneka中应用程序,执行单元以及执行服务。

它还提供了一个用户和系统的观点。

C会计,定价和与公共云整合

Aneka提供了一个基础设施,允许建立私有,公共和混合云。

在云环境中,尤其是在公共云和混合云例子中,重要的是要落实机制,控制资源和使用定价,以便向用户收费,尽可能减少花费最大限度地利用系统。

会计和定价是为Aneka中的应用程序实现定价机制的一项任务。

会计服务负责跟踪系统使用情况统计和分类每个用户和应用程序。

信息是根本,用来估计必须向每个用户收取的花费和决定应用程序如何对用户花费负责。

当前会计服务的实现能够追踪每个应用程序每个执行单元所花的时间,并保存各单位执行历史。

然后这些数据使用被选中的定价策略,以确定向用户收取的金额。

例如,一个简单的政策可以分配到每个资源的价格和确定每个应用程序的产生的费用,通过简单地计算所有应用程序的执行单位的加权总和。

其他政策能够考虑到一个应用程序使用的具体服务。

当Aneka云完全部署或与公共云整合时,这两个组件的作用变得更加重要。

在这种情况下,当确定用户的账单时,利用虚拟公共资源产生的费用要加以考虑。

混合云构成一个具有挑战性的场景:

在这里,置备虚拟资源以满足与用户签订的服务级别协议(SLA)。

为了面对这一挑战,Aneka提供了一个对象模型允许第三方无缝地整合不同的调度算法,可以协调他们的活动和资源配置服务。

当前执行仍处于初期阶段,设计一个模型,其中的调度程序可以访问多个资源池,实时跟踪每个活动实例的花费。

池的基本策略是试图尽可能重用,为了最小化公共虚拟资源的花费,实例已经在运行。

不同的调度算法可以插入到该模型,因此,开发人员可以提供多个策略,决定何时增长或收缩构成Aneka云的节点集。

三、案例分析

在本节中,我们将讨论两个在云端科学计算的实际应用程序。

案例研究都已在亚马逊EC2基础设施上实现。

第一个案例研究是使用Aneka云将基因表达数据集进行分类,而第二个案例是提出一个fMRI脑功能成像工作流的执行,并与传统的网格进行同样试验的性能进行比较。

在两个案例下,提出一个使用云技术的成本分析。

A基因表达数据的分类

基因表达分析是一次性测量活动-表达-成千上万个基因,创造一个细胞功能的全球画面。

剖面分析,这是基因活动的测量,帮助研究人员识别基因和疾病之间的关系,以及细胞是如何应对一个特定的治疗。

其中最有希望的支持基因剖面分析的技术是DNA芯片技术,特别有助于癌症预防。

这种技术的一个缺点是产生大量的数据:

每个病人的DNA纹印就是成千上万的基因组织成一个序列,其状态(或活动)由特定的颜色或序列中的黑点表示。

基于这些原因,癌症的诊断分析的分类不能没有计算机技术的帮助。

在不同的分类方法中,CoXCS分类方法在基因表达数据集的分类上特别有效果。

CoXCS是基于特征空间分区的协同进化学习分类法。

它通过引入协同进化方法扩展了XCS模型。

图5给出了CoXCS内在逻辑的原理图的例子:

独立种群分类器的收集是通过使用训练数据集的特征空间的不同分区。

经过反复的迭代,每个独立种群的选定分类器根据一些遗传策略转化为不同的种群。

然后,进化过程反复进行,直至达到一个特定的阈值。

CoXCS内部架构,基于特征空间分割,不仅优于原有XCS的基因表达数据集分类,也是所有的经典方法。

表三表示当应用两个样品基因表达数据集时,不同的分类方法的性能比较。

从测试阶段所获得的结果可以发现,CoXCS的精度肯定比其他分类方面所取得的结果要好。

使用CoXCS的唯一的缺点是把分类器演化成一个稳定的形式需要很长的计算时间。

CoXCS的内在并行允许分布式和更快的执行。

云CoXCS是基于云的CoXCS实施,利用Aneka计算云为每次迭代分配独立种群分类器进化。

为了迅速拥有的云CoXCS的工作原型,我们把它作为后代工具包的一个策略实施。

后代是一个允许快速成型策略的软件环境。

这是基于客户端的工作流,可以通过Aneka和其它中间件来执行。

云CoXCS中算法实现和CoXCS中一样,因此,我们期望有相同的精度和获得一个在训练期间几乎线性加速。

为了验证假设,我们在亚马逊EC2基础设

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 工作范文 > 演讲主持

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1