1、可靠无线局域络中接入点失效的容错技术精品可靠无线局域络中接入点失效的容错技术-精品2020-12-12【关键字】方案、情况、方法、空间、会议、模式、监测、运行、地方、问题、系统、机制、有效、主动、深入、平衡、公平、健康、快速、合作、发展、建立、提出、发现、研究、位置、安全、稳定、网络、思想、基础、需要、环境、工程、资源、方式、作用、标准、结构、设置、增强、分析、简化、着眼、形成、满足、严格、保证、确保、服务、支持、解决、调整、取决于、实现、转变、协调、中心Rajeev Gandhi卡内基梅隆大学电子与计算机工程系5000 Forbes Avenue, Pittsburgh, PA 15213-
2、3890rgandhi摘 要按照IEEE 802.11标准中定义的结构模式之一的描述,移动工作站是通过连接到一个在无线网络和有线网络之间起桥梁作用的无线接入点达到与有线网络连通的。如果一个接入点连接失败,那么所有通过此接入点连接至有线网络的移动设备就会丢失连接。在本篇论文中,我们着眼于无线接入点失效的容错技术来分析如何增强无线网络的可靠性,提出并评估了一种全新的检错机制,这一基于信噪比的机制比“心跳”机制更为有效。另外,我们还比较了三种在802.11无线网络中能实现接入点错误恢复的技术。1- 介绍在过去几年中,无线网络有了迅猛的发展。与有线网络相比,无线网可以为移动中的用户提供流畅的网络服务。
3、近年来,基于IEEE 802.11 标准的无线网络6已经在为移动工作站提供的无线联网服务中获得了普及。IEEE 802.11 标准定义了两种为移动工作站提供网络互联的结构模式:基本模式(Infrastructural 模式),在这种模式下,移动工作站通过一接入点无线连接到有线网络,这个接入点充当了有线网络和移动工作站之间的网关(即无线终点)。在这篇论文以下的部分,我们将仅限于基本模式下的讨论。对等模式(Ad-hoc模式),该模式下,移动终端不需要接入点即可直接进行相互间通信协调来组成网络。图1. 两个以有线网络互联的基础服务设备(BSS)组成一个扩展服务设备(ESS)而形成的IEEE 802.
4、11无线系统每个接入点都有一个覆盖范围,即一个可进行操作的有限范围,在开阔环境下通常是500-1500英尺;在一个接入点的覆盖范围内工作的移动站可以从该接入点接收信号。建立多路并联接入点可以为移动中的工作站提供连续无间断的网络连接。因此,为了支持当移动工作站在两个接入点各自的覆盖范围之间移动时可以从原接入点接连转换到新接入点连接,IEEE 802.11 标准提供了一种切换方案。接入点和与其连接的移动工作站一起,组成了一个基础服务设备(BSS)。而通过一个有线网络连接在一起的多个BSS(又称为分布式系统)就组成了一个扩展服务设备(ESS)。图1展示了一个802.11无线系统,该系统中两个通过有线
5、网络连接的基础服务设备(BSS1和BSS2)组成了一个扩展服务设备(ESS)。无线网络以其灵活性和便利性,正被越来越多的用作各种应用程序的平台。很多重要的应用,比如股票交易、健康监测系统等等,要求其使用的网络即使在有错误存在的情况下仍能正常运转。不幸的是,现在的无线网络口碑非常不好,因为它太容易出错了,像是由用户移动、频道转换或者基础结构故障这样的问题都可能会导致连接丢失,这些状况让人很难相信它的可靠性。现在的用户大都满足于他们可以通过移动设备方便的地连接到有线网络/资源,即使这种连接是不可靠的。但是,当无线网络变得越来越普及,越来越多地支持各种重要应用时,用户们当然会期望无线网络也能像有线网
6、一样提供安全可靠的服务。更进一步说,提供一定程度上可靠的无线网络可以为移动工作站无线信号传输的发展带来更多机会,这样,各种应用就能更好地在移动站上运行。有关于无线蜂窝网络可靠性和强壮性的讨论在著作5,8,11中已经很深入了。Haas和其合作者5描述了一种对于现场数据库错误的容错技术,这个数据库记录了移动交换中心里移动工作站所在的位置。Tipper与合作者11,12分析了个人通信服务(PCS)网络的稳定性;他们在书中区分了几种不同无线网络层故障的原因并且给出了定量表示网络稳定性的参数,同时还建立了研究PCS网络中不同故障所带来的影响的仿真模型。他们仿真的结果表明:当有错误存在时,用户的移动会降低
7、网络的性能。Varshney与其合著者8,10研究了PCS网络的无线可靠性问题;他们区别了在一个PCS网络中不同部分故障的原因并提出了一系列解决不同层中容错的方案。Dahlberg与合作者3提出了重叠覆盖范围和同步加载平衡两个概念,用以消除PCS网络中基础结构出现的故障。最近,Chen和合作者2宣布已经解决了IEEE 802.11b网络中影区纠错的问题;他们在研究里,用接入点复制方法给出了无线系统可靠性的解析推理。我们的研究将围绕着无线网络的可靠性展开,尤其是检测802.11无线网络中的接入点失效并提出容错机制。在这篇论文中,我们讨论了接入点复制技术、重叠覆盖范围方法,并提出了一种新的802.
8、11无线网络接入点失效的多路复用容错技术。更进一步,我们比较了三种接入点失效容错技术各自的成本和增加的复杂度。虽然我们没有明确地解决无线系统链路层失效的问题,但是多路复用技术同样可以应用于这种故障的容错。本篇论文其余部分是这样组织的:第二部分给出了802.11切换过程的相关背景;第三部分介绍了如何检测接入点失效;接入点复制、重叠覆盖和多路复用容错技术位于第四部分。最后,第五部分包含了一些结论以及下一步的研究步骤。2- 802.11无线网络中的切换方案切换过程是指移动工作站和接入点之间在转换连接时所遵循的顺序。IEEE 802.11标准允许移动工作站在两个接入点的覆盖范围之间移动时,可以从一个接
9、入点交至下一接入点。但是在工作站被从一个接入点提交到新的接入点之前,工作站应该能够发现这个新的接入点。IEEE 802.11 标准规定了两种移动工作站检测接入点存在的模式被动扫描 在这种模式下,移动工作站先进行通道通道扫描(802.11标准定义了13个通道,每个5MHz),再检测由接入点周期发送的信标帧。信标帧包含了移动工作站与接入点进行通信所需的所有信息。如果工作站能够检测到某一通道上存在信标帧,那么它就能在此通道上建立接入点存在。被动扫描的优点是能够节省移动工作站电池的电量,因为它不需要发送任何东西。主动扫描 这种模式下,移动工作站通过在每个通道上发送Probe请求帧主动地寻找接入点。接收
10、到Probe请求帧的接入点会向客户发送一个Probe响应帧。移动工作站会在它接收到Probe响应帧的那个通道上建立接入点存在。一旦移动工作站在某一区域内发现了接入点的存在,那么它就必须选择一个来与之进行连接。IEEE 802.11规定一个移动工作站在给定时间内只能与一个接入点连接,这就允许了有线网络中的开关将移动工作站的信息发送给与之唯一连接的接入点。在移动工作站与新接入点建立连接之前,它必须向该接入点验明自己的身份。在接入点验证了工作站的身份后,工作站会向新的接入点重新发出连接请求,只有从新的接入点收到重连接响应以后,移动工作站才能与新接入点进行连接。整个切换过程的恢复时间就是检测接入点的扫
11、描过程的延时与重连接验证延时之和。3- 接入点失效的检测在我们探讨802.11无线网络对接入点失效的容错方法之前,需要先解决如何确定接入点已经失效这一问题。只有在检测到接入点失效之后,移动工作站才能启动适当的错误恢复机制。在802.11无线网络中,接入点会周期性地发出信标帧来提示无线网络的存在。因此,移动工作站检测接入点是否仍然有效的一种方法就是监测接入点发出的周期性信标帧。但是,这种通过信标帧检测接入点失效的方法有一个缺点,那就是检测不到信标帧并不意味着接入点的失效。很有可能移动工作站已经超出了接入点的覆盖范围,这样当然就无法接收到该接入点发送的信标帧。这样一来,用信标帧监测技术来检测接入点
12、失效的一个问题就是当监测不到信标帧时,究竟是因为用户移动带来的问题还是由接入点失效带来的问题。一些接入点失效容错技术(接入点复制和重叠覆盖)都是把用户提交给新的接入点,这是解决用户移动问题的典型方法。这一方法引起了一个重要的问题能否区分出这是用户移动还是接入点失效所带来的问题,难道这两种问题能用同一种方法解决?需要区分两个根源事件的主要原因是两者中要切换到新接入点的用户数量显著不同。典型地,用户移动切换模式里只有几个用户需要给定时间内在切换到新的接入点,为了减少切换延时,移动工作站可以采取主动扫描方式检测新的接入点。另一方面,在真正的接入点失效时需要切换到新接入点的用户就多得多了。在这种情况下
13、,如果所有的移动工作站几乎同时尝试接入通道(即使在802.11中级进入控制方案启动之后),就会产生大量的失败传送而导致工作站进入通道并发送Probe请求帧之前出现很大延时。因此,这种情况下,移动工作站采用被动扫描方法或许比采取探测新接入点的方法会更为有效。本篇论文中,我们打算使用移动工作站从接入点接收到的信号强度作为接入点“上/下”状态的指示。性能正常的接入点会在接收工作站上被一个信号(其实际强度取决于移动工作站和接入点之间的距离)指示出来;而完全失效的接入点会被指示为缺失信号。这样,一个接入点从正确操作到错误操作的转变就可以从接收工作站上信号强度的突然下落表现出来。从接入点接收到的信号的强度
14、包含在协议栈的低层,可以用来衡量接收信号的信噪比(SNR),单位是分贝(dB),在移动工作站里,我们可以算出接收信号的信噪比,并在信噪比突然跌落时启动错误恢复机制。图2给出了分别在两种情况下16秒内从接入点测量出的信噪比:(i)移动工作站从有效接入点移开,(ii)与移动工作站连接的接入点在测量期间失效。信噪比是用Linux无线扩展工具测量的,在Linux系统上的路径为:/sbin/iwconfig。如图2(b)所示,由于用户移动使工作站接收的信号信噪比在14秒内下降了大约40dB,而接入点失效使信噪比在不到2秒内下降了相同的量。因此,可以用一个原来“健康”的接入点上信号强度的突降来判断802.
15、11无线系统中接入点的失效。图2. 两种不同情况下在移动工作站上测得的信噪比:(a)表示用户离 开一个有效接入点,(b)表示与固定用户连接的接入点在测量期间失效。基于信噪比的接入点检错方案决不是一种十分简单安全的方法。用户快速移动也有可能引起信噪比的突降。在这种情况下,用户移动可能会被误判为接入点失效,这将会在用户移动导致的切换中增加延时。这种错误的判断可以通过适当调整检错参数(比如信噪比下跌的时间间隔,以及检错前后的信噪比变化)以使其最小化。4- 接入点失效容错复制技术1, 9已经被广泛地应用在了有线系统容错中;这样一来,为了容错接入点失效,我们可以简单地复制该接入点。可是,在无线系统中不能
16、这样直接地应用复制技术,因为大多数复制技术需要消耗额外资源。4.1 接入点复制技术无线网络中对于接入点失效的一种容错策略就是使用额外的、在主接入点失效时可被激活的备用接入点。在这种技术里,备用接入点必须能检测到主接入点的失效;并且,作为错误恢复机制的一部分,所有与失效接入点连接的移动工作站都必须移交到备用接入点。除了检测和处理失效的固有延时以外,这种技术还要求额外的花销-无线服务的供应商需要提供另外的接入点,这些接入点在无错情况下可能不需要被激活,但在错误恢复时是必不可少的。4.2 重叠覆盖技术另外一种接入点失效容错技术就是使用覆盖范围重叠的接入点。在不同接入点之间提供相互重叠的覆盖范围,其主
17、要目的是:如果一个接入点失效,那么与之连接的移动工作站就会被转交到覆盖范围与失效接入点的覆盖范围相重叠的接入点上去。尽管这一技术已被应用在蜂窝网络基础结构失效的容错中8, 12,但是在802.11无线网络中采用这种方法仍然有很多技术困难。IEEE 802.11标准规定了2.4GHz的ISM(工业,科学和医学)带宽,这一频率带被进一步分为13个每个5MHz的通道。更进一步,该标准规定相邻接入点使用的通道至少要被分割为5个子通道4以使相邻接入点的无线通讯干扰达到最小。这一限制意味着只有3个可用通道能用来建立扩展服务设备。既然覆盖扩展服务设备的通道数受到了限制,那么就不能确保重叠覆盖范围在任何地方都
18、是可行的。事实上,通道可用性受到了限制会导致影区2,即不被任何接入点覆盖的区域。进一步说,重叠覆盖范围技术要求每个接入点都预留一些多余容量用以支持由于相邻接入点(覆盖范围重叠)失效所带来的额外用户。如果没有预留多余空间,而且所有重叠接入点都达到各自的最大容量,那么当一个接入点失效时,与其连接的移动工作站会导致重叠范围内的用户传送量减少。应用重叠覆盖范围容错技术的另一个重要问题就是检测接入点失效并转换到有效接入点的延时。如果这一延时很大的话,那么大量应用可能会出错(尽管一些应用程序比如浏览器可以容忍大的延迟)。图3. 测量切换延时的实验配制我们进行了一项研究来判断检测接入点失效和切换过程的总延时
19、。如图3,我们的实验由两个覆盖范围互相重叠的接入点组成。一个接入点(Orinoco AP-2000)设置在通道1(2.412GHz)另一个(Netgear MR814V2)在通道11(2.462GHz)。实验中使用的移动工作站是900MHz的Windows XP PC,装有Netgear MA101 无线网卡,初始连接在通道1的Orinoco AP-2000接入点上,通过截取处理帧(比如Probe请求帧、Probe响应帧、确认帧和重连接帧)来同时在通道1和通道11上测量总延时。截取802.11处理帧的工作是由一台装有两块无线网卡的笔记本组成的无线嗅探器完成的。一块网卡配制成截取通道1的信息,另
20、一块截取通道11的信息,截取处理帧的网络嗅探器程序是ethereal。Orinoco AP-2000接入点在实验中被关闭用来仿真接入点失效。实验里使用的接入点错误恢复方案是Nergear MA101无线网卡默认的切换方案(也就是说,我们并没有使用第三段里讨论的基于信噪比的错误恢复方案)。Orinoco AP-2000接入点发出信标帧的时间间隔设置成大约100ms。用户从失效接入点切换到有效接入点所用的时间用T1和T2表示。T1 是无线sniffer截获到Orinoco AP-2000发出的最后一个信标帧的时间。T2 是无线sniffer截获到Netgear MR814V2发出的重连接响应帧的时
21、间。由于客户和无线sniffer在实验中始终固定在Orinoco AP-2000接入点的覆盖范围内,那么就可以把信标帧的缺失看作是接入点失效。我们的实验里测量出的总延时平均是7.03秒(标准偏差为1.37秒),误差源有三个。第一,因为Orinoco AP-2000以100ms的间隔发出信标帧,信标帧的缺失表示接入点失效,所以实验测得的失效备援延时可能会产生100ms的误差。第二,因为信标帧从接入点到移动工作站的传输路径和到无线sniffer的路径不同,所以工作站接收信标帧的时间可能与无线sniffer接收信标帧的时间不一样。这一误差可以通过使工作站接近无线sniffer而减小。最后,由于接入点
22、到sniffer的路径可能出错,一些信标帧可能只被用户接收到了,却没被无线sniffer收到。同样,这种误差可以通过使工作站和sniffer接近消除。因为我们使用了缺省的检错和切换方案,所以不同的硬件(无线网卡和接入点)可能会产生不一样的失效备援延时。然而,实验的结果表明失效备援时间可能为几秒,这对一些对于延迟要求严格的应用来说太大了(比如VoIP和视频会议)。这种容错技术还有一个重要问题就是如何重新分配剩余可用的接入点给与失效接入点连接的用户。当有多个相互覆盖的接入点时,从失效接入点切换就有了多个可用对象,怎样选择这些新接入点也有多种标准。自动就近选择就是一种标准;对于要与最近的接入点连接的
23、工作站来说,这无疑是最有利的,因为能使信息传递消耗的电量最少。但是,不可能把每一个移动工作站都分配给离它最近的接入点,因为每个接入点的容量有限。因此,在错误恢复时,我们应当尽量保证客户电量消耗最小,并且公平地分配剩余的可用接入点。4.3 多路复用技术我们的第三种方法提供了一种全新的无线网络接入点失效容错技术。这种方法在每个移动工作站上利用了多路无线网卡。其基本思想是:如果每个工作站上有多路无线网卡可用,那么每个这种网卡都可以连接到一个不同的接入点。这种方法有效地建立了从工作站到外部的多条通讯路径,每条路径都可以将工作站上某个网卡连接到一个单另的接入点上,因此,如果一个接入点失效了,连通性仍能通
24、过由已建立的连接路径转换到另一个接入点上而得到维持。如果移动工作站发出的信息仅仅在多余通讯路径上被复制,那么用于工作站通讯的总带宽就被扩宽了。这一现象可以通过在多余路径上复用数据包得到避免。这种方法的优点是:在复用策略下,通讯总带宽可以与单连接时的带宽一样。而缺点是:多路复用技术与复制技术相比,信息传送的平均延时增大了,因为在复用和解复用时,每条消息必须附加报头信息,这在错误恢复时就增加了延迟。与前两种容错技术不同,多路复用技术要求移动工作站(后称客户)和工作站通讯对象(后称服务器)上安装额外的软件。一种实现多路复用技术的方法是合并应用本身存在的多路连接。这种方法并不好,因为它要涉及修改应用程
25、序。另一种不需要修改程序的方法是利用指令集干预方法来捕获应用产生的网络层响应(比如socket(),并且把它们替换为自己的网络层函数。使用指令集干预后,拦截器可以实现预加载了应用的进程地址空间的指令集功能。拦截器捕获了所有用户/服务器端应用程序产生的网络层响应,把它们替换成为不同无线网卡的多路响应(例如一个单独网络设备产生的socket()响应会被替换成由所有无线网络设备产生的多路socket()响应)。为了在多路复用技术中使用更详细的方案,拦截器可以嵌入客户端和服务器端的中间设备层。因此,在多路复用方法里,当移动工作站和服务器之间的连接启动时,客户端中间设备的拦截器捕获连接请求。然后客户端中
26、间设备层启动与服务器端中间设备层的握手协议,建立客户端的无线网络设备数(或者通讯路径数)。随后,客户端的每一个无线网络设备上都打开一个单独连接。服务器端的中间设备经过多路通讯路径复用一段单独的数据流(从其服务器应用程序)到无线客户。客户端中间设备解复用/组合由多路网卡收到的数据将其转化为单独数据流并将对照数据流发送给其控制应用程序。如果接入点失效,客户端中间设备能够通过基于信噪比的方法检测到失效点,并向服务器中间设备发送错误提醒信息;服务器端中间设备能够从一个可用网络设备向服务器重新发送任何丢失的信息。另一方面,服务器端中间设备同样能在无法从特定通讯路径上接收到确认信息包时检测到接入点失效。一
27、旦服务器端中间设备检测到接入点失效,它能够触发客户/服务器中间设备在其余通讯路径上重新分配受到影响的数据包。这样客户端和服务器端的中间设备层就负责了错误检测、拦截应用程序的网络层响应和复用/解复用来自和发往应用程序的数据。错误警告和网络设备握手都是控制客户端与服务器端中间设备层交换的信息的例子。这种控制信息的传递要求网络数据包携带额外的报头信息来确认数据包的目的,并同意组织解复用的数据流。多路连接方法中使用的多路无线网络设备不一定要全部是一个类型。例如,一个可以是802.11b无线网卡,另一个可以是802.11a网卡,使用不同种类网络设备的好处是更容易提供相互重叠的覆盖范围。如果在一个区域内8
28、02.11b接入点无法提供重叠覆盖范围(由于干扰),仍然可以由802.11a接入点提供(由于其工作在5GHz带内,不会受到802.11接入点的干扰)。在不同的无线网络程序里使用不同的设备存在一个潜在的问题,那就是每个设备可能被分配给一个不同的带宽。即使在每个客户的无线网络程序中使用相同的设备,每个设备仍有可能被分配给不同的带宽,这取决于设备和各自接入点之间的距离。这样,客户/服务器中间设备就要给各种设备恰当地分配进入的数据,以使每个设备处理的数据能够与设备可用带宽相称。这种平衡加载机制会导致高带宽通讯路比低带宽通讯路径接收更多的数据包。使用多路复用连接技术的主要优点是它与接入点复制技术不同,不
29、会强行要求基础结构提供额外的备用接入点。这种方法还通过使用不同的无线网络技术使得随处提供重叠覆盖范围变得更加简单。这一方法还可被用来在影区内容错,以代替接入点复制方法。此外,在多路复用连接技术中,从接入点失效恢复所需的时间对应用的影响相对要小,因为还可以通过其他设备进行通讯。当然,多路连接技术的缺点是它不要求客户安装多路网络程序,这样一来就导致了更高的客户端仪器费用。另一个缺点是,如果一个接入点失效,那么与之连接的用户可能会被分配更低的带宽,除非失效的连接路径能通过另一个接入点被重新连接。多路复用连接方法还要求客户端和服务器端安装额外的软件,这在受限内存嵌入式设备上不一定可行。另外,使用多路网
30、卡会导致移动工作站消耗更多电量。5- 结论在本文中,我们解决了在802.11无线网络中对于接入点失效的检错及容错技术,增强了这类网络的可靠性。我们提出了一种基于信噪比(SNR)的检测接入点失效的机制;初步测量结果表明:信噪比是一种有效的检错方案,能准确判断出错误的原因是实际的接入点失效还是用户的移动。此外,我们还详细描述了接入点复制、重叠覆盖范围、以及多路复用连接等接入点失效容错技术。重叠覆盖范围和多路复用连接技术要比接入点复制策略更为有利,因为它们不会产生由备用接入点而带来的额外花销。另外,多路复用连接方法通过使用多种网络技术提供重叠覆盖范围而使重叠覆盖技术得以简化。我们测量出的重叠覆盖技术
31、中失效备援延迟时的初步结果表明:对于总延时有严格要求的应用(比如VoIP)来说,失效备援延时显得有些过大。作为这次研究的扩展延伸,我们打算进一步研究多路复用连接方法中的客户/服务器端中间设备,并比较三种接入点失效容错技术的恢复时间。参考书目:1 K.P Birman. Building Secure and Reliable Network Applications. Manning Publications Co.,19962 D.Chen, C.Kintala, S.Garg, and Dependability enhancement for IEEE 802.11 wireless L
32、AN with redundancy techniques. Proceedings of the International Conference on Dependable systems and Networks, pages 521-528, June 2003.3 T.Dahlberg and J.Jung. Survivable load sharing protocols: A simulation study. ACM/Baltzer Wireless Network Journal, 7:283-296, May 2001.4 802.11 Wireless Networks: The Definitive Guide. OReilly & Associates, Inc., April 2002.5 and Y.-B. Lin. Demand re-registration for PCS database restoration. Mobile Networks and Applications, 5(3):191-198, 2000.6 IEEE Computer Socie
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1