移动云计算联盟数据资源识别与获取机制研究Word下载.docx
《移动云计算联盟数据资源识别与获取机制研究Word下载.docx》由会员分享,可在线阅读,更多相关《移动云计算联盟数据资源识别与获取机制研究Word下载.docx(10页珍藏版)》请在冰豆网上搜索。
(3)在移动终端作为基础设施如何组成云方面:
EugeneE.Marinelli等人将移动手机终端作为云平台搭建的基础设施,把开源的云计算系统Hadoop移植到Android系统手机上,并对手机搭建的云平台做了大量的性能测试,将测试结果与用PC搭建的云平台做了比较,指出了用手机做云平台的基础设施存在的一些不足之处[4]。
Canepa等人则针对手机在接入云时遇到困难,或者在连接到云时产生网络带宽费用很昂贵的情况下,手机就不值得去请求云资源,于是在这种情况下手机就会充分地和周围的手机一起组成一个虚拟的云,在虚拟云中的手机一起解决同一个问题。
(4)在移动终端如何将计算迁移到云方面:
Byimg-GonChun等人利用虚拟机迁移技术,无缝地将手机终端的应用程序块迁移至云端执行,在云端始终维持一个手机终端的副本,手机端需要执行的任务被划分成几个不同的部分,有些部分在手机端执行,有些部分在云端执行[5]。
在移动云计算的应用方面:
(1)加拿大RIM公司提供的黑莓企业应服务器方案,黑莓的邮件服务器将企业无线网络和移动终端连接在一起,用户通过黑莓终端便可以访问rm的邮件账户,从而可以轻松地远程同步邮件和日历,查看附件和地址本。
除黑莓终端外,RIM同时也授权其他移动设备平台接入黑莓服务器,享用黑莓服务。
(2)苹果公司的MobileMe服务,该方案基于云存储和计算,可以处理电子邮件、记事本项目、通讯簿、相片以及其档案,用户所做的一切都会自动地更新至iMac、ipod、iphone等苹果公司生产的各式终端界面。
(3)Google公司作为移动云计算的先行者,也积极开发面向移动环境的Android系统平台和终端,不断推出基于移动终端和云计算的新应用,包括:
整合移动搜索、语音搜索服务、定点搜索以及Google手机地图、Android上的Google街景,并取得瞩目成效。
1.1.2国内研究现状
目前在国内对移动云计算的研究较少,主要集中以下几个方面:
在移动云计算服务模型方面:
汪星荷,刘绍华等在移动云计算的基础上,建立了一个基于位置的个性化服务推荐模型.该模型包括移动客户端和云端两部分,并且根据用户兴趣模型库,生成用户感兴趣的文字、图片和视频等资源集合,反馈给客户端,从而实现个性化服务推送[6]。
赵华,王海阔指出移动云计算的服务模型包括“端”、“管”、“云”三个层面,端”指任何能接入“云”并完成信息交互的手机等移动终端设备;
“管”指用于完成用户信息传输的通信网络;
“云”的本质就是业务实现的方式即业务模式[7]。
在移动云计算数据管理方面:
杨智文在论文研究并实现了移动云计算环境下数据传输框架,研究了移动设备端如何选择无线网络连接,移动设备端如何适应数据传输的多样性,云端如何辅助移动设备端进行数据传输[8]。
陆宏亮研究在移动云计算环境下数据安全保护对终端资源和整个事务处理的影响,同时通过对终端状态信息的考虑,引入不同安全保护策略对事务处理以及用户使用体验的考虑,提出基于终端上下文信息的一种自适应的数据保护架构[9]。
殷胜兵在对移动云计算环境中数据获取机制研究分析的基础上,结合国内外研究现状及实际应用,对数据获取中的数据缓存技术、数据预取技术和数据复制技术三个方面进行了深入的研究[10]。
在移动云计算应用方面:
2011年11月联想总裁陈旭东在联想商用技术发展论坛表示,联想将以移动互联网终端和行业解决方案为核心,构建端到端的移动云计算应用模式。
中国移动的云计算平台大云已经启动。
中国移动云计算项目叫做大云。
由三星研究中心的张新文博士等提出的Weblet项目是一种新的弹性应用开发模型,它将应用划分为多个Weblet,并允许根据实际运行时环境需求来执行配置策略,动态决定Weblet是在移动设备端执行还是在云计算端执行[11]。
在移动云计算安全管理方面:
徐光侠,陈蜀宇根据云计算资源建立了资源受限设备弹性应用的安全模型,解决了Weblet之间的安全迁移和授权云Weblet通过外部Web网络去访问敏感用户数据的问题[12]。
毛宁提出新的数据保护方案,对方案中的模块进行详细设计,其中数据混乱采用多种矩阵变换组合的方式,加密部分的选择采用参数动态控制加密位,数据存储格式中采用双重加密保证数据安全[13]。
1.1.3评述
从上述有关对移动云计算的研究来看,对于移动云计算的研究还处于起步阶段,国外的研究主要集中在技术方面,技术上有一定突破,但是很大程度上还是延续云计算的技术,具有移动云计算特点的技术还没有涉及,国内的研究主要还是集中在概念阶段,深入的研究不多,因此进一步的研究移动云计算的概念以及技术具有很大意义。
此外在黑龙江省移动云计算的应用尚未开启,但是随着云谷的建立以及政府的大力支持,实现对移动云计算的高效研究将成为必然趋势。
1.2云计算联盟国内外研究现状
目前已经有多个云计算研究人员和产业界人士提出了云计算联盟(CloudComputingFederation)的概念。
云计算联盟是指整合不同CCSP(云计算服务提供商)提供的云计算服务来共同为用户提供服务,而提交给用户的是一个统一的计算资源[14]。
在云计算联盟机制下,由于不同CCSP的云计算服务共同构成了一个真正意义上的巨大的资源池,从而使用户的应用组件可以在不同平台之间进行互操作和互迁移,将自己应用的组件配置到多个云计算平台中,实现资源配置的优化组合,以获得更大的效益。
云计算联盟是目前云计算研究中的热点问题,其目标是整合分布式的不同云计算平台的资源来为所有用户提供各种普适IT应用。
由于云计算联盟能提供更低的成本和更好的服务质量,必然会成为将来云计算技术发展的重要趋势,进而实现将计算资源作为一种效用来提供的目标。
1.2.1国外研究现状
在国外研究方面由于目前还没有一个通用的云计算标准,不同云计算平台之间的可移植和互操作并没有实质的进展,开放云计算联盟目前还只能停留在概念和模型上。
由于认识到云计算联盟和开放云计算的重要性,目前已经出现了一些旨在推动云计算联盟和开放云计算的组织。
开放云计算联盟(OpenCloudConsortium,OCC)成立于2008年,其目的是设法改善分布在不同地理位置数据中心的云存储和云计算的性能,并推广开放的架构,让由不同组织运营的云计算能够在一起无缝地工作。
开放云计算联盟旨在支持为云计算开发开源软件,并为不同类型的云计算的软件制定标准和接口,使它们能够进行互操作。
开放云计算联盟的成员包括美国伊利诺伊大学、西北大学、约翰霍普金斯大学、芝加哥大学和加州电信和信息技术学院。
思科是第一家公开加入开放云计算联盟的大型IT厂商,其他很多IT厂商也准备加入进来。
英国伦敦按需计算和通信服务提供商Star正式宣布发起成立云计算供应商联盟。
英国云计算联盟主要面向英国本土的技术和服务提供商,主要目的是为用户提供全面的云计算服务,帮助英国企业部署云应用。
他们的初步目标是为中等规模的英国企业提供云计算的系列选择。
英国云计算联盟的首批成员包括15家,覆盖了英国企业IT和通信领域的各个层面,从电话通信到网络安全,从硬件到虚拟应用应有尽有。
2012年2月15日,Atos、EMC和Vmware联合宣布结成开放式云计算战略联盟。
Atos还将组建一家新公司——Canopy,提供多种可加速交付的云计算解决方案和服务,帮助客户更快享受云计算的益处。
得益于来自全球云计算行业领袖企业EMC和VMware的领先技术,此次合作提供的全新服务将包括开放式云计算平台,使客户能针对其企业IT需求,轻松、灵活地选择、访问和部署云服务[15]。
Google致力于将企业自身深入人心。
为了达到这一目标,这个搜索巨人,也是现在的云巨人,已经与VMware合作,一起开发一个能让开发者在不同的云平台上运行Java应用。
通过与虚拟化老大VMware合作,Google向我们展示了云计算是一件非同小可的事情,与各大厂商合作是要走向成功的必经之路。
香港和记电讯、韩国LGCNS、澳大利亚Telstra及AAPT、马来西亚VADS五家电信运营商,与普华永道(PWC)、甲骨文就成立了这样一个联盟——亚太云计算联盟(APCA)。
这一联盟成立的目标性十分明确,形成互通、分享、协作的生态系统——这事实上也正应是云的本质和精髓。
但也正因为这一目标,该联盟在商业层面上需要做的还有很多。
亚太云计算联盟希望能够实现的价值一方面是对于云服务的使用者——众多的商业企业,另一方面则是对于云服务的提供者——运营商。
1.2.2国内研究现状
在国内研究方面2010年l月22日,中国云计算技术与产业联盟(ChinaCloudComputingTechnologyandIndustryFederation,CCCTIA)在北京正式宣布成立。
中国云计算技术与产业联盟是云计算相关企业、科研院所、相关机构自发、自愿组建的开放式、非营利性技术与产业联盟,由40家行业内的主要机构共同倡议成立。
其主要宗旨之一是推动并参与云计算国际、国家或行业标准制定,促进中国云计算相关产业的发展。
中关村云计算产业联盟于2010年7月9日在京成立。
联盟由联想、用友、金山、XX、赛尔网络、神州数码等20家单位发起成立。
联合北京云计算领域重点企业和研究机构,争取政府产业政策支持,汇聚产业链上下游资源,促进云计算领域产学研合作,带动全国云计算产业发展。
力争通过三年的努力,推动建设标志性示范应用工程,建设云计算工程中心,培育行业龙头企业,形成一批自主知识产权产品和集成应用解决方案、主导和参加国际、国家或行业标准制定,使北京中关村成为我国云计算研究中心和产业基地。
在学术方面:
杨新锋,刘克成基于涌现理论和复杂网络理论对云计算联盟的体系结构进行建模,提出了一种基于域和复杂网络理论的云计算联盟体系结构模型,并对该模型中资源的发布和发现机制进行了详细的研究[16]。
张泽华基于复杂系统理论的观点和方法论,以云计算联盟如何更好的实现资源的优化配置和提供优质的计算资源为着眼点,对云计算联盟的体系结构建模、资源管理、实现机制和负载均衡问题展开研究[17]。
谢原,张静鹏,周秀霞.在剖析云计算服务平台构建的深远影响和创新意义的基础上,以吉林省图书馆联盟云服务平台建设为例,进行了图书馆联盟云计算服务平台的架构设计,并详细论述了云计算服务平台中的各子平台的服务功能和技术实现[18]。
倪煜佳对云计算应用于图书馆服务平台的需求研究,进而构建平台,为用户进行服务,避免各类资源的重复建设[19]。
1.2.3评述
从上述有关对云计算联盟的研究来看,虽然国内也有云计算联盟的成立,但是对于云计算联盟的研究大多集中在云联盟的建立,对于云平台及云平台资源优化,随着云计算技术的逐渐完善,云计算联盟将成为云计算的主要发展趋势,通过云计算联盟为用户提供更大的资源池,满足客户的需求,提供更低的成本以及更好的服务质量,进而实现将计算资源作为一种效用来提供的目标。
而同样移动云计算的发展日益完善,移动云计算联盟的成立也将成为主要趋势,进而能够更好的满足人们随时随地需求,更好的为客户服务。
1.3数据识别
在移动云计算联盟背景下,随着移动互联网,移动计算以及云计算的快速发展,网络数据,移动用户数据、基于传感器的数据、射频ID数据等,呈现出爆炸式增长的趋势,如何将这些大数据量的数据去粗取精变得尤为重要。
1.3.1国外研究现状
国外方面,对数据识别的研究相对较少,主要有以下两点:
在网络数据识别方面:
Gummadi等人通过对KaZaA这款P2P软件数据流量的大量分析,最终总结出了该款软件通信的负载特征通过对这些负载签名的匹配,可以实现应用层协议的识别和分类[20]。
Ridoux等人从CDMA2000网络中收集数据并分析3G网络和有线网络的数据流量特征的异同点[21]。
在用户数据识别方面:
在以前的研究中,大多数情境感知的工作主要集中于用户行为识别(ActivityRecognition)上,TuragaPK等根据用户身上的传感器(比如加速度和RFID传感器),获取用户的环境信息,比如位置,压强,噪音,以及用户的行为数据,从而预测用户的行为[22]。
KimDH等提出了一个结合GPS,WiFi和加速度三种传感器的记录用户轨迹的方案,从而能尽可能记录用户轨迹的情况下还能节省移动设备的电量[23]。
美国麻省理工学院的RealityMining项目自2005年开始通过智能手机传感器收集用户的行为数据,研究如何分析用户的行为模式,用户的社交关系,以及用户的情境特征等[24]。
1.3.2国内研究现状
在国内对于数据识别的研究不在少数,但是针对移动云计算联盟背景下的研究比较少,主要集中在以下几个方面:
在移动用户数据方面:
王冲生通过分析移动互联网数据包封装原理、应用层特征字的表示方式、位置规律、协议端口等,提出了一种基于数据流的多引擎多通道识别机制,并引入自适应优先级匹配算法降低数据包模式匹配的次数,提高了数据并发处理能力、业务识别效率[25]。
蒋石浩,林亚平提出基于一维改进的CLIQUE算法的移动用户通话行为分析的数据预处理模型,对移动用户通话数据源进行了分析,并结合具体案例,进行了实证研究[26]。
庞素琳,汪寿阳建立了移动核心网异常数据识别线性判别模型和判别准则,用来对某移动核心网性能数据进行判别分析[27]。
宝腾飞研究了面向移动用户的情境数据挖掘中的用户情境数据建模、用户关键地点挖掘以及用户情境识别等技术。
从而识别出用户的生活、行为等情境模式,为面向情境感知(Context-Aware)和个性化(Personalized)的服务创造了基础条件[28]。
王学建,康小强,李越新首先分析主数据的现状,然后引入业界流行的分析方法理论,提出了基于层次分析法的主数据识别方法。
该方法在中国移动的主数据识别中得到有效应用[29]。
在BT流量识别方面:
李明伟,张大方,曾彬,等通过分析BT协议和BT实际传输数据,找出BT传输过程中必会出现的各种固定字串,以之作为特征字串,从而利用增加特征字串个数来提高识别准确性[30]。
曾燕通过对BitTorrent协议和源代码的研究以及对当前几种典型的P2P应用如Bittorrent、迅雷等的实际传输数据情况进行分析比较,找出BT流传输中更多的有效载荷特征,将BT流从其他数据流中识别出来,增强了BT流量识别的准确性和灵活性[31]。
在多传感器目标识别方面:
徐小琴对目前多传感器数据融合目标识别算法进行了全面综述,包括参数分类算法、基于认识模型的算法、物理模型算法及多类算法综合识别法等,说明了各算法特点及对其的进一步改进[32]。
李旭军将多传感器数据融合技术用于潜艇目标识别,提取出潜艇各方面的特征并采用数据融合识别出目标属性,对几种目标识别方法进行了比较[33]。
赵丹丹充分利用不同时间与空间的多传感器数据资源,采用计算机技术对按时间序列获得的多传感器观测数据,在一定准则下进行分析!
综合!
支配和使用,获得对被测对象的一致性解释与描述,进而实现相应的决策和估计,使系统获得比它的各组成部分更充分的信息[34]。
王金栋,戎晓霞,丁秋林针对分布式数据流应用中,如何在高速、海量的输入数据中识别重要数据单元的问题,给出了有效数据的概念,并提出了1种有效数据识别算法。
以缩略图技术为基础,能够在用户给定的误差范围内,以接近1的概率输出有效数据,占用较少内存[35]。
陈传通提出了对网络协议加权设置优先级的识别方法,并提出了具体的加权分组算法。
该方法根据协议流量在网络上分布比例的不同,通过分组算法对网络协议进行分组、设置不同的优先级[36]。
1.3.3评述
综合以上对数据识别的研究可以看出,对于数据的识别没有统一的方法框架,专门针对云计算、移动云计算或者联盟数据资源的识别几乎没有,大多是基于云计算或移动云计算的环境下,或是基于大数据的环境下,本文要做的就是集合移动云计算、联盟以及大数据这三个方面特点,对数据识别进行针对性研究,识别出移动端产生的用户行为数据,从而提供数据服务。
1.4数据获取
在移动云计算模式中,移动云计算可以随时随地为用户提供服务。
在组成的移动云计算联盟中“云端”是由无数的数据中心组成,而数据中心是由大量的服务器构成。
当移动终端连接到服务器后,服务器与移动终端之间、服务器与服务器之间的数据传输量会比较大,但是无线网络的带宽、数据中心之间的带宽是有限的,数据传输的过程中网络延迟很大,影响了数据传输的性能。
因此在客户端以及服务端的数据获取方面,如何快速的获取数据是一个亟待解决的问题。
1.4.1国外研究现状
国外研究现状主要集中在以下几个方面:
在网络数据获取方法方面:
Klipi等人对国外某GPRS/UMTS中的TCP流数据的往返时间进行了研究[37]。
Lassila等人着重分析了某CDMA2000网络中数据,描述了CDMA2000流量的概况并比较其与传统网络中的流量情况,得到两种网络的异同点[38]。
针对DeepWeb数据获取,SriramRaghavan等提出了HIWE系统,一种半自动的DeepWeb爬虫,结合领域知识生成合理的查询关键词提交给查询接口,获得查询结果。
在用户行为数据获取方面:
Ionut等人研究了用户的移动性和用户的应用程序使用行为的关系[39]。
Falaki等人则是通过观察智能机上的数据特性来区分不同的用户行为[40]。
Xu等人在tier-1网络内部利用IP数据研究各种手机应用中的用户特征和行为[41]。
在数据库数据获取方面:
A.Ntoulas等针对文本数据库,提出了自动生成查询的理论框架及生成查询的策略,并对数据库内容获取问题进行了形式化处理[42]。
BergholzA等提出的DeepWeb爬虫方法只处理单一检索条件,主要对非结构化DeepWeb提供的单一检索条件的表单进行处理。
P.Wu等研究了结构化数据库环境下如何高效的选择输入项。
它用“属性-值”图来描述数据库,并把数据库内容获取问题转变为对“属性-值”图的遍历问题[43]。
1.4.2国内研究现状
在移动互联网数据获取方面:
薛辉,孙如霞,尹春勇论述和分析了目前网络数据获取的主要方法和实现原理[44]。
陈银鹏,郭莉以VisualC++为开发环境,开发了一个这样的用户端系统。
系统制作、封装监测条件并向网络数据获取系统提交,获得监测数据并解析、存储,用户对数据进行处理,实现了对网络安全事件的分析监测[45]。
李鹏针对目前互联网络的发展和使用状况,从广义角度深入研究和分析了高速网络分流的模型。
根据NP在灵活性上的优势,本文提出了一个基于IXP2400网络处理器的G级负载均衡器的实现方案,实现了高效的协议、IP过滤和数据均衡分流[46]。
在实时数据获取方面:
王爱勇,杨小健,陆新健以关系数据库为介质,研究了基于Oracle的实时数据获取、处理、存储和访问技术.重点探讨了实时数据的压缩存储,并给出采用Oracle数据库内部语言PL/SQL实现数据压缩算法,由于数据的存储和访问中引进了数据压缩技术,在低频率和点数较少时,该技术可作实时数据库的替代方案[47]。
杨阳,李宇翔等利用C++Builder完成人机交互界面的设计以及数据的获取与处理;
在BorlandC++Builder6环境下,;
结合Matlab实现供电系统设备状态数据的处理,并通过建立Access数据库,在BCB6中实时存储处理供电系统的各部分状态信息[48]。
李娜娜采用了实时云计算平台对海量社交网络数据进行获取处理,设计了实时云计算平台下的数据获取任务调度策略及社交网络协议解析方法,制定了可抽取到目标数据的正则表达式,使用正则表达式匹配的信息抽取方式进行抽取,得到目标数据[49]。
在获取方法的研究方面:
余建平介绍了群集智能的主要理论研究及典型应用,概述了网络数据获取中的任播和查询两大关键技术,在此基础上对基于群集智能的蚁群优化算法及其在分布式网络环境下任播和查询两大关键数据获取技术中的应用进行了系统和深入的研究[50]。
杨阳,李宇翔等针对目前deepWeb数据集成在数据获取方面存在代价大和查询选择效率低等问题,提出了一种基于循环策略和动态知识的deepWeb数据获取方法,同时利用集成系统已获取的数据动态构建知识,并设计了基于集成系统动态知识的查询选择方法[51]。
1.4.3评述
国内外对数据获取的研究主要集中在网络数据以及移动用户数据的获取上,具体的方法模型不够完善,专门针对云计算、移动云计算或者联盟数据资源的获取几乎没有,大多是基于云计算或移动云计算的环境下,或是基于大数据的环境下,本文要做的就是集合移动云计算、联盟以及大数据这三个方面特点,对数据获取进行针对性研究,适应移动云计算联盟以及大数据的特点,快速获取出有效数据,避免一些冗余数据,从而为联盟的运行以及运作,提供良好的保障。
参考文献
[1]雷万云.云计算:
技术、平台及应用案例[M].北京:
清华大学出版社,2011:
100-103.
[2]MahadevSatyanarayanan,ParamvirBahl,RamonCaceres,NigelDavies“TheCaseforVM-BasedCloudletsinmobilecomputing.”[C].IEEEPervasiveComputing,2009:
14-23.
[3]GuT,Pung,H.K.,Zhang,D.Q.“TowardanOSGi-basedinfrastructureforcontext-awareapplications”[J].Perv