iCache9200互联网缓存解决方案.docx

上传人:b****6 文档编号:7977066 上传时间:2023-01-27 格式:DOCX 页数:21 大小:1.33MB
下载 相关 举报
iCache9200互联网缓存解决方案.docx_第1页
第1页 / 共21页
iCache9200互联网缓存解决方案.docx_第2页
第2页 / 共21页
iCache9200互联网缓存解决方案.docx_第3页
第3页 / 共21页
iCache9200互联网缓存解决方案.docx_第4页
第4页 / 共21页
iCache9200互联网缓存解决方案.docx_第5页
第5页 / 共21页
点击查看更多>>
下载资源
资源描述

iCache9200互联网缓存解决方案.docx

《iCache9200互联网缓存解决方案.docx》由会员分享,可在线阅读,更多相关《iCache9200互联网缓存解决方案.docx(21页珍藏版)》请在冰豆网上搜索。

iCache9200互联网缓存解决方案.docx

iCache9200互联网缓存解决方案

目录

1简介1-1

2解决方案2-1

2.1iCache系统部署场景2-1

2.1.1与DPI集成部署2-2

2.1.2核心网PS网络部署2-2

2.1.3系统扩展部署2-3

2.2iCache系统原理2-5

2.2.1Web缓存2-5

2.2.2Video缓存2-12

2.2.3P2P缓存2-16

2.3iCache系统可靠性2-20

2.3.1Web缓存可靠性2-20

2.3.2Video缓存及P2P缓存2-20

2.4iCache系统主要指标说明2-20

2.4.1吞吐量(Throughput)2-20

2.4.2命中率(HitRatio)2-20

2.4.3连接数(ConnectionNumber)2-21

2.4.4用户网络对系统指标的影响2-21

3结论3-1

4缩略语表4-1

简介

近年来随着互联网的发展,互联网用户数、互联网应用种类、网络带宽等都呈现出爆炸式的增长,对社会和人们的生活产生了巨大的影响。

在互联网应用中P2P技术、在线视频技术的发展给互联网带来的影响尤为广泛,据预测,到2013年,91%的个人消费者互联网流量为视频,在移动流量中,66%为视频。

P2P应用的快速发展很大程度上促进了互联网的发展和宽带接入的普及化,但是其所带来的负面效应也随之显现,最突出的矛盾就是对网络资源的滥用。

无论运营商如何增加网络带宽,P2P应用总是会尽力抢占所有可用的资源。

这种“黑洞效应”直接影响了运营商网络建设的积极性,同时也导致其用户满意度下降,进而间接导致运营商的商业利益受损。

对P2P流量进行控制和管理已经变得非常必要和紧迫,目前主要采用的手段是部署流量分析及控制设备,即对P2P应用进行分析和识别,然后再进行阻断或限速。

这种方案的优点是通过控制、管理可识别的P2P应用,来保证网络带宽和其他业务的QoS,但其局限性也十分明显,因为通过阻止用户使用来缓解网络拥挤,会直接导致用户流失,甚至面临法律上的风险。

显而易见,这种简单的“封堵”思路治标不治本。

在线视频的迅速发展源于用户上网习惯的转变,在P2P盛行的时代,受限于网络带宽等因素,在线视频的质量较差,难以满足用户对于高品质视频内容的需求,用户习惯于“先下载,后体验”的上网模式,而随着用户接入带宽的不断提升,在线视频正在迅速朝着高清化的趋势发展,在这种情况下,宽带用户更倾向于选择“即时体验”来获取视频等多媒体资源。

面对互联网流量的高速增长,运营商主要通过两种方法来应对:

●扩容带宽

●流量控制,包括技术上对用户流量进行整形、限速等,以及从资费套餐上进行流量限制等。

扩容带宽的解决方案简单易实施,但是费用昂贵,并且新扩容的带宽很快就会被P2P等流量再次占满,投资收益极少。

流量控制是立竿见影的解决方案,投资较小并可以迅速降低互联网出口的流量压力,但同时也极大的影响了用户体验,在较为成熟的竞争性市场容易造成用户流失。

因此,上述两种解决方案在投资收益和用户体验上并不能兼顾,往往顾此失彼,运营商需要能在投资收益和用户体验上都能兼顾的解决方案,华为iCache互联网缓存解决方案可以很好的满足运营商的需求。

解决方案

iCache系统部署场景

与DPI集成部署

当现网已经部署了DPI设备或者计划部署DPI设备时,iCache可以与DPI设备集成部署,需要DPI具备流量镜像功能并有足够的GE接口将镜像流量转发到重定向设备。

iCache与DPI设备集成部署拓扑图

核心网PS网络部署

iCache与在核心网PS网络部署拓扑图

iCache系统可以在核心网PS网络中部署。

建议部署在GGSN与防火墙之间,通过对10G/2.5G骨干链路的上行链路进行分光,然后将分光链路接到分流平台,由分流平台将10G/2.5G的流量平均分成N*GE流量输出到重定向设备;同时在交换机上进行策略路由,将http流量转发到CSS-WEB子系统。

系统扩展部署

iCache采用模块化设计,模块之间可以灵活、自由的组合,所以具有非常好的弹性和扩展性。

●灵活的配置保证最佳的缓存效率

−由于用户上网习惯的变化,互联网流量趋势会经常性的发生变化,比如前几年BT和eMule等P2P流量占据了互联网50%以上的流量,那时候的用户上网习惯是“先下载,后体验”,但是目前用户的上网习惯已经逐渐变成“实时体验”,所以P2P流量占比逐渐下降,而在线视频流量发展迅速。

为了充分保护运营商的既有投资,iCache系统提供了良好的弹性,如下图所示:

iCache弹性部署图

1、在线视频和P2P缓存设备采用同一硬件平台,可通过更改软件License互换。

2、如果HTTPCache设备超过正常负载,则可以通过手工配置将部分大文件下载类流量切换到在线视频缓存设备上。

3、如果在线视频缓存设备超过正常负载,则可以通过手工配置将部分在线视频流量切换到HTTPCache设备。

●良好的扩展性保护原有投资

−当运营商的网络规模和宽带用户数量增长后,为了继续保持较低的互联网出口带宽需求以及良好的用户体验,就需要相应的扩容缓存系统。

iCache支持平滑的、线性的扩容升级,只需要增加相应的缓存设备即可。

iCache扩容前拓扑图

iCache扩容后拓扑图

分布式部署

上述部署方案都基于集中式部署。

此外,iCache支持集中式和分布式两种部署模式,当网络规模较小的时候,可以采用集中部署的方式,不仅节省投资成本,也可以提高缓存效率。

当运营商网络规模不断扩大时,仍然可以采用集中部署的模式,只需要增加缓存设备,但是这样有可能引起各个POP节点和骨干网之间的链路拥塞。

这个时候,我们可以从集中部署模式向分布式部署模式迁移,在流量比较大的POP节点部署新增的缓存系统,新增的系统只为POP节点内的宽带用户提供服务,如下图所示:

iCache分布式部署图

iCache系统原理

Web缓存

HTTP基本原理

超文本传输协议(HTTP,HyperTextTransferProtocol)是互联网上应用最为广泛的一种网络协议。

所有的WWW文件都必须遵守这个标准。

设计HTTP最初的目的是为了提供一种发布和接收HTML页面的方法。

HTTP的发展是万维网协会(WorldWideWebConsortium)和Internet工作小组(InternetEngineeringTaskForce)合作的结果,(他们)最终发布了一系列的RFC,其中最著名的就是RFC2616。

RFC2616定义了HTTP协议中一个现今被广泛使用的版本——HTTP1.1。

HTTP是一个客户端和服务器端请求和应答的标准(TCP)。

客户端是终端用户,服务器端是网站。

通过使用Web浏览器、网络爬虫或者其它的工具,客户端发起一个到服务器上指定端口(默认端口为80)的HTTP请求。

客户端与服务器之间的交互用到了两种类型的消息:

请求(Request)和响应(Response)。

其中请求最常见的包括get和post请求,而服务器的响应则包括HTTP版本号,后面跟着3位数字表示响应代码,如200代表请求成功,404代表notfound。

CSS-WEB缓存工作流程

当客户机向服务器发送get请求的时候,web服务器将返回请求的资源,同时返回该资源的ETag标识以及expire时间,当没有超过expire时间,则客户机下次再次发送get请求的时候,将直接从缓存中获取资源,而不需要再次从web服务器上下载资源。

部署iCache系统之后,缓存上网流程如下:

1)当用户向web服务器发送请求的时候,流量会经过CSS-WEB系统,此时CSS-WEB会检测该资源是否已经被缓存,如果已经缓存,并且该资源没有过期,则直接将缓存内容返回给用户。

2)当缓存了该资源,但是该资源已经过期,则CSS-WEB会发送一个更新请求到web服务器,请求获得最新资源,如果web服务器返回“没有更改”报文,则直接返回缓存资源给用户,否则从服务器上下载资源返回给用户。

3)如果该资源没有被缓存,则CSS-WEB会代替用户去web服务器上下载,同时返回给用户,如果CSS-WEB定义的策略要求缓存该文件,则缓存该资源,并再次提供服务。

CSS-WEB工作模式

WEB缓存采用直路部署模式,通过在路由器上配置策略路由(PBR),将HTTP流量从路由器引流到缓存设备,它有2种工作模式:

半透明模式、透明模式。

半透明模式:

需要在路由器/交换机上做一定的配置修改,将用户访问外网Web服务器的流量通过策略路由(PBR)转向缓存服务器,然后由缓存服务器代理用户去外网下载内容再提供给用户。

缓存系统对用户是透明的,但是Web服务器看不到用户的IP,只能看到缓存服务器的IP地址。

WEB缓存半透明模式原理图

缓存系统工作流程如下:

1)用户的HTTP访问报文通过策略路由(PBR)牵引到缓存设备。

2)缓存设备用自己的IP地址代理用户向Web服务器发起请求。

3)Web服务器返回响应报文给缓存设备

4)缓存设备将响应报文返回给用户。

透明模式:

需要在路由器/交换机上做一定的配置修改,将用户访问外网Web服务器的流量以及Web服务器返回的流量通过策略路由(PBR)转向缓存服务器,缓存服务器作为所有HTTP流量的中转站,缓存系统对用户和Web服务器都是透明的。

WEB缓存透明模式原理图

缓存系统工作流程如下:

1)用户的HTTP访问报文通过策略路由(PBR)牵引到缓存设备。

2)缓存设备使用用户的IP地址代理用户向Web服务器发起请求。

3)Web服务器返回的响应报文通过策略路由(PBR)牵引到缓存设备。

4)缓存设备将响应报文返回给用户。

关键技术1:

URL过滤技术

URL过滤功能提供白名单,黑名单,分类地址库三种方式。

黑白名单的方式都是基于管理员自定义并手工输入URL的方式。

分类地址库采用Brightcloud作为第三方URL数据库提供者。

美国BrightCloud公司是全球最大的网址分类导航和内容过滤的互联网服务提供商,其网络覆盖十数倍于其他同类服务提供商。

Brightcloud提供了80多个详细分类,覆盖面广,命中率、准确率高。

URL过滤的流程如下:

1)当用户向web服务器发送请求的时候,流量会经过CSS-WEB系统,此时CSS-WEB会检测该URL是否属于管理员定义的白名单中,如果命中则直接进入缓存上网流程。

2)如果该URL不属于白名单,则查询是否属于黑名单中,如果属于黑名单中,则直接禁止并重定向该URL。

3)如果黑白名单都没有命中,则查询是否启用了Brightcloud分类禁止功能,如果启用了该功能,则查询该URL的分类,如果该分类被禁止,则重定向该URL。

如果无法查询到该URL的分类,则查看是否启用了在线更新功能,如果启用,则到互联网上升级该URL的分类。

如果在线更新依然无法获得其分类,则查看配置,是否禁用unknown分类的URL。

关键技术2:

支持GZIP压缩格式

CSS-WEB支持GZIP压缩格式传输,HTTP协议上的GZIP编码是一种用来改进WEB应用程序性能的技术。

大流量的WEB站点常常使用GZIP压缩技术来让用户感受更快的速度。

CSS-WEB支持GZIP压缩传输,当客户端支持HTTP1.1协议时候,将会向服务器请求资源,当服务器也支持GZIP的时候,就会把资源压缩之后传输给用户,在CSS-WEB缓存该资源的过程中也会将该压缩后的资源进行缓存,从而节省带宽。

GZIP压缩的原理是在一个文本文件中找出类似的字符串,并临时替换他们,使整个文件变小。

这种形式的压缩对Web来说特别适合,因为HTML和CSS文件通常包含大量的重复字符串,例如空格,标签,及样式定义。

GZIP支持的文件包括HTML、JavaScript、CSS和其他TEXT文件。

在传输优化测试中,使用GZIP方式压缩的站点,其TEXT文件平均可以压缩75%,压缩率是相当可观的。

如果每个用户节约50%的带宽,那么相同的带宽就可以服务多一倍的客户了。

CSS-WEB服务器能够将web服务器上的资源进行GZIP压缩,从而节省空间。

对于不支持GZIP的浏览器,将缓存内容提供给用户的时候将首先解压缩之后再传输给用户。

关键技术3:

配置回退和初始化功能

为解决误操作带来的后果,iCacheCSS-WEB提供了配置回退和初始化功能。

并提供回退后的配置和现在配置的差别。

其原理为每次进行了配置修改后,iCacheCSS-WEB都会保持一份配置副本,另外也提供一份默认配置。

于是可以将每次的配置副本进行对比,并进行配置文件替换以完成配置回退功能。

关键技术4:

支持safesearch技术

谷歌GoogleSafeSearch是一种从搜索结果中过滤掉色情内容的技术。

谷歌Google用户可据需要设定所需级别。

CSS-WEB支持设定是否开启SafeSearch的默认开启状态。

例如,开启safesearch功能之后,用户搜索的URL为q=sex&safe=strict,表示搜索启用了过滤功能,默认情况下该功能是关闭的,用户可以在“搜索设置”中来设置是否开启该功能。

管理员可以在CSS-WEB中设置是否默认启用该功能,当启用该功能之后,用户使用google搜索引擎的时候,默认的状态都启用了safesearch功能,从而能够达到过滤色情图片和文字效果,净化上网环境。

关键技术5:

支持热点统计技术

CSS-WEB支持保持近期客户访问记录,并进行数据挖掘。

支持热点统计,能够显示TOP100站点,并支持按照流量、按照缓存命中率来排序。

关键技术6:

优化的存储技术

iCacheCSS-WEB凭借华为公司在存储领域的深厚积累对缓存存储技术做了深入的优化,包括多核多线程技术,存储调度技术等。

iCacheCSS-WEB采用了强大的IntelNehalem平台CPU,一台CSS-WEB上有8个核,为充分利用处理器性能,对多线程处理进行了深度优化,保证充分利用每个核的处理能力。

iCacheCSS-WEB针对互联网缓存的特点,优化了存储调度技术,将小文件尽量保持在内存中,将大文件保存在磁盘中,并在高效的调度算法下,尽量做到顺序读写磁盘,以提高缓存设备的吞吐能力。

Video缓存

1.Video基本原理和发展趋势

近年来随着互联网的发展,互联网用户数、互联网应用种类、网络带宽等都呈现出爆炸式的增长,对社会和人们的生活产生了巨大的影响。

在线视频技术的发展给互联网带来的影响尤为广泛,据预测,到2013年,91%的个人消费者互联网流量为视频,在移动流量中,66%为视频。

在线视频和传统的观看视频不同,视频资源全部保存在视频服务器上,用户同过浏览器点播视频,向服务器发送点播请求,服务器收到后查找用户要点播的视频并过网络将对应视频传到用户的电脑上,电脑经过处理通过显示器把视频呈现给用户。

在线视频的迅速发展源于用户上网习惯的转变,在P2P盛行的时代,受限于网络带宽等因素,在线视频的质量较差,难以满足用户对于高品质视频内容的需求,用户习惯于“先下载,后体验”的上网模式,而随着用户接入带宽的不断提升,在线视频正在迅速朝着高清化的趋势发展,在这种情况下,宽带用户更倾向于选择“即时体验”来获取视频等多媒体资源。

2.Video缓存的部署方式

Video缓存采用旁路部署模式,不需要改变现有网络的组网结构,不会增加故障点。

缓存系统并不是位于正常的网络流量经过的路径上,而是采用分光/镜像的方式复制了一份流量,然后通过对复制的流量进行分析后采用重定向技术将用户的请求引导到缓存系统。

这种部署模式有以下好处:

1)对于缓存系统不关心的流量,缓存系统的存在与否对这些流量没有任何影响。

2)当部分缓存设备下线时,业务连续性不会受到影响,重定向子系统将检测到下线的缓存设备,并对位于这些设备上的资源停止发送重定向报文,用户仍然可以从外网获取资源。

3)即使整套系统下线,业务连续性也不会受到影响,就跟没有部署缓存系统时一样,用户直接从外网获取资源。

3.Video缓存工作流程:

iCache采用热点探测和被动缓存技术,只有在内网用户访问同一资源达到热点阀值后,才会把资源下载到缓存系统并为后续的用户访问提供服务。

在线视频缓存的具体工作流程分为两部分:

用户请求的资源达到热度阀值前:

1)用户发起HTTPGET请求。

2)RSS监听到该请求报文符合缓存基本标准,RSS查询内存中的白名单看资源是否已经被缓存,如没有,则查询调度子系统DSS。

3)DSS查询缓存服务器中是否存在用户请求的资源,如果没有,则将资源的热点阀值加1;

4)DSS通知RSS用户请求的资源没有被缓存。

5)重定向子系统不做任何操作,用户仍然从源站获取资源。

6)DSS判断用户请求的资源是否达到热度阀值,如果达到热度阀值,DSS挑选其中一台CSS服务器去外网下载资源。

7)CSS服务器启动下载进程。

8)CSS服务器完成资源下载。

9)CSS服务器通知DSS资源已经下载完毕,并告知资源存储的目录,流程结束;

Video缓存进栈前工作原理图

用户请求的资源达到热度阀值并被缓存到本地后:

1)用户发起HTTPGET请求。

2)RSS监听到该请求报文符合缓存基本标准,RSS查询内存中的白名单看资源是否已经被缓存,如有,跳到步骤4;如没有,则查询调度子系统DSS。

3)DSS返回保存有用户请求资源的CSS服务器信息给RSS,RSS将信息记录到本地的白名单中。

4)RSS发送重定向报文给内网用户。

5)内网用户接到重定向信息后连接CSS服务器进行资源请求。

Video缓存进栈后工作原理图

关键技术1:

缓存资源过滤技术

根据客户业务的需要,iCache系统黑白名单的管理功能,为运营商提供健康的缓存内容。

可以对敏感网站或者特定的资源进行访问控制,将该资源的索引,refer等信息加入黑名单配置中,就可以实现对目标资源的放行、阻断和重定向功能。

下面详细介绍黑名单几种状态的意义:

1)放行

如果资源对象处于黑名单“放行”状态时,当用户从外网获取该资源时,但系统不会对该资源进行缓存。

所有用户访问该资源一律从外网获取。

2)阻断

处于黑名单“阻断”状态时,当用户试图从外网访问该资源时,RSS会及时断掉内网用户和外网资源的连接,导致用户访问失败,阻断用户访问该资源。

3)重定向

如果资源对象处于“重定向”状态时,当用户试图从外网访问该资源时,RSS会及时断掉内网用户和外网资源的连接,并把连接重定向到指定好的资源的URL地址,导致用户只能访问指定的资源的内容。

关键技术2:

缓存子系统功能的互换

华为iCache(InternetCacheSystem)解决方案充分站在用户的角度为用户考虑,为了可以使客户更有效的利用现有资源,节省客户的投资成本和维护成本,成功开发了缓存子系统功能互换的功能。

该功能可以使不同的缓存子系统之间(P2P和Video)无限制自由切换,当客户设备故障或需求改变时,华为iCache(InternetCacheSystem)解决方案可以快速响应客户,将对应缓存子系统切换为客户需要的类型,快速满足客户需求,解决客户问题,并有效的节约了客户的投入成本,把可能问题对用户的影响降到最低。

关键技术3:

动态URL地址判断技术

目前在线视屏网站采用的URL地址技术多数为动态URL地址技术,这样导致针对于普通网站的URL地址算法对于采用动态地址的在线视频网站没有意义,只能产生大量的垃圾数据。

华为iCache(InternetCacheSystem)解决方案采用动态URL地址算法技术成功解决了这一难题,对于不同的动态URL地址在线视频网站分别采用独特的算法,精确定位该网站每一个资源。

不仅实现了网站资源的缓存和向用户吐出资源数据的基本功能,有效的提升了用户体验外等主流业务外,而且还可以通过黑名单对该网站资源进行控制,很好帮助客户的实现了上网行为管理等增值业务。

P2P缓存

P2P是peertopeer的缩写,就是数据不存放在统一的资源服务器上,而是存放在各个用户上的数据进行共享,每个用户下载的资源都是从其他用户下载,实现这种数据传输而制定的协议称着P2P协议,采用P2P协议进行用户间数据传输的软件称着P2P软件,常见P2P软件有BT、eMule、XL(迅雷)等。

以往占据主导地位的互联网架构是客户端/服务器(Client/Server)结构。

互联网以服务器为中心,各种各样的资源,包括文字、图片、音乐、电影等都存放在服务器的硬盘上,网民把自己的电脑作为客户端通过网络连到服务器上检索、下载、上传资料,在这种架构下,客户端和服务器存在着明显的主从关系,而P2P模式,也称为对等网络(PeertoPeer)结构,它的本质思想是,整个网络结构中不存在中心节点(或中心服务器),在P2P结构中,每一个节点(Peer)大都同时具有信息消费者、信息提供者和信息通讯等三方面的功能,在P2P网络中每一个节点所拥有的权利和义务都是对等的。

P2P缓存部署方式

目前现网中网络设备部署方式主要有直路和旁路两种结构,在直路模式中网络设备需要串行连接到主干线路上,旁路部署则不需要将设备串进主干线路,只需要镜像、分光等方式将流量负复制一份给旁路网络设备。

iCache系统采用旁路部署模式,与直路比具有以下优势:

4)不需要改变现有网络的组网结构,缓存系统并不是位于正常的网络流量经过的路径上,而是采用分光/镜像的方式复制了一份流量,然后通过对复制的流量进行分析后采用重定向技术将用户的请求引导到缓存系统。

5)不会增加故障点。

由于在主干线路上没有增加任何设备,故不会增加故障点。

6)对于缓存系统不关心的流量,缓存系统的存在与否对这些流量没有任何影响。

7)当部分缓存设备下线时,业务连续性不会受到影响,重定向子系统将检测到下线的缓存设备,并对位于这些设备上的资源停止发送重定向报文,用户仍然可以从外网获取资源。

8)即使整套系统下线,业务连续性也不会受到影响,就跟没有部署缓存系统时一样,用户直接从外网获取资源。

P2P缓存工作流程:

iCache系统支持BT、eMule、XL、PPS等多种P2P协议,由于每种协议特征的不同,所以对不同协议的资源提供缓存服务的原理也有所不同。

BTCache

iCache在完成BT资源缓存时,由RSS、DSS和CSS共同完成,其热点处理机制与在线视频的不同:

1)检测用户访问流量中包含的资源请求信息,一旦检测到P2P资源请求立即启动P2P缓存资源进栈。

2)缓存设备边下载资源边为用户提供缓存加速服务,未缓存资源片段仍然通过外网下载。

BT缓存的具体工作流程为:

1)用户出口流量被复制到监控服务器RSS监控口,RSS对出口流量进行深度分析,识别出网内用户对外的BT下载请求。

2)RSS发送重定向报文给用户,将用户请求重定向到DSS,DSS将充当代理Tracker服务器的角色。

3)DSS检索本地缓存系统,如果已经存在用户所需的数据资源,会将存有相关数据的缓存子系统CSS服务器的IP地址以及同时参与该任务的内网其他用户的IP地址列表,通过PEERLIST反馈给用户,用户根据所反馈PEERLIST中的IP地址建立连接,从CSS缓存服务器上和内网其它用户处获取数据;如果本地缓存系统里未包含用户所需要的数据资源,DSS会调配某一台BT缓存服务器去外网下载该资源,并将该BT缓存服务器IP地址通过PeerList

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 解决方案 > 学习计划

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1