网络可靠性实现Word下载.docx
《网络可靠性实现Word下载.docx》由会员分享,可在线阅读,更多相关《网络可靠性实现Word下载.docx(17页珍藏版)》请在冰豆网上搜索。
在上述三个级别的可幕性需求中,第1级别需求的满足应在网络设备的设计和生产过程中予以考虑;
第2级别需求的满足应在设计网络架构时予以考虑;
第3级别需求则应在网络部署过程中,根据网络架构和业务特点采用相应的可靠性技术来予以满足。
2.可靠性度量
通常我们使用MTBF(MeanTimeBetweenFailures,平均故障间隔时间)和MTTR(MeanTimetoRepair,平均修复时间)这两个技术指标来评价系统的可靠性。
(D.MTBF
MTBF是指一个系统无故障运行的平均时间,通常以小时为单位。
MTBF越多,可靠性也就越高。
(2).MTTR
MTTR是指一个系统从故障发生到恢复所需的平均时间,广义的MTTR还涉及备件管理、
客户服务等,是设备维护的一项重要指标。
MTTR的计算公式为:
MTTR二故障检测时间+硬件更换时间+系统初始化时间+链路恢复时间+路山覆盖时间+转发恢复时间。
公式中各项的值越小,MTTR也就越少,可靠性也就越高。
3.可靠性技术
根据上边的描述可知,降低MTTR可以提高网络的可靠性。
在实际网络中,各种因素造成的故障难以避免,因此能够让网络从故障中快速恢复的技术就显得非常重要。
各种可靠性技术将主要从降低MTTR的角度,为满足第3级别的可黑性需求来提供技术手段。
可靠性技术的种类繁多,根据其解决网络故障的侧重不同,将其大致分为故障检测技术和保护倒换技术:
(1)・故障检测技术
故障检测技术侧重于网络的故障检测和诊断,主要使用的技术如表二所示
名称
简介
BFD
BidirectionalForwardingDetection(双向转发检测),是一个通用的、标准化的、介质无关、协议无关的快速故障检测机制,用于快速检测、监控网络中链路或IP路由的转发连通状况
NQA
NetworkQualityAnalyzer(网络质量分析),通过发送测试报文,对网络性能、网络提供的服务及服务质量进行分析,并为用户提供网络性能和服务质量的参数,如时延抖动、TCP连接时延、FTP连接时延和文件传输速率等
Track
用于实现联动功能。
联动功能山应用模块、Track模块和监测模块三部分组成,它通过建立联动项来实现不同模块间的联动,即山监测模块通过Track模块触发应用模块来执行某种操作。
监测模块负责对链路状态、网络性能等进行探测,并通过Track模块将探测结果通知给应用模块;
应用模块感知到网络状态变化后,及时进行相应处理,从而避免通信的中断或服务质量的降低
表二
(2)・保护倒换技术
保护倒换技术侧重于网络的故障恢复,主要通过对硬件、链路、路由信息和业务信息等进行冗余备份以及故障时的快速切换,从而保证网络业务的连续性。
主要保护倒换技术的如表三所示。
接口备份
同一台设备的各接口之间形成备份关系,通常曲主接口承担业务传输,备份接口处于备份状态。
当主接口本身或其所在线路发生故障而导致业务传输无法正常进行时,可以启用备份接口进行通信
以太网链路聚合
简称链路聚合,它通过将多条以太网物理链路捆绑在一起成为一条逻辑链路,实现了增加链路带宽的目的,而这些捆绑在一起的链路通过相互间的动态备份,可以有效地提高链路的可靠性
MSTP
MultipleSpanningTreeProtocol(多生成树协议),是一种二层管理协议,它通过选择性地阻塞网络中的冗余链路来消除二层环路,同时还具备链路备份的功能
GR
GracefulRestart(平滑重启),是一种保证转发业务在设备进行转发协议(如BGP、IS-IS、OSPF、LDP和RSVP-TE等)重启时不中断的技术。
它需要周边设备的配合来完成路山等信息的备份与恢复
VRRP
VirtualRouterRedundancyProtocol(虚拟路山器冗余协议),是一种容错协议,在具有组播或广播能力的局域网(如以太网)中,使设备出现故障时仍能提供缺省链路,有效地避免了单一链路发生故障后出现网络中断的问题
从前面的介绍可知,可靠性技术的种类繁多,面对越来越复杂的网络环境,要想依靠单一的技术来解决所有的可靠性问题儿乎无法实现。
因此,需要在对网络环境和用户需求进行细致分析的基础上,综合运用各种可幕性技术来提高网络的可鼎性。
此外,在建网之初还应充分考虑组网的可靠性,譬如:
根据业务现状或业务预测,边缘层的节点在接入时应釆用冗余备份机制,分别与汇聚层的节点相连;
核心层的各节点之间尽量采用全连接的方式,等等。
(二入可靠性技术应用实例:
一、单设备多出口模型:
L网络结构描述:
如图一所示,这种单设备,多出口网络通常在出口路曲器上会配置一条以上的默认路由,分别指向不同的ISP下一跳,通过修改优先级的方式(浮动静态路由)实现在路山层面的线路备份,当作为主用线路的链路故障时,作为备用默认路山的路山会浮动成为主用路山
图一
2.存在问题:
路山的切换是与物理接口的状态直接相关的,通常运营商(ISP)提供的专线接入会增加协议转换器等设备与路山器接口相连,协议转换器至路山器的这部分线路故障概率很低,路山器接口始终处于UP状态,当上行链路(协议转换器上层传输网络)或更上一级的网络发生故障时路山并不能切换,数据包仍然会通过该接口转发,造成数据包转发黑洞。
3决^
4.在配置静态(默认)路山时,指定了一跳地址可以通过联动功能,利用监测模块(NQA)监视
静态路山下一跳的可达性,并根据Track项的状态来判断静态路山的可达性。
Track主要山以下三种状态:
(1).Track项状态为Positive时,静态路由的下一跳可达,配置的静态路由将生效;
(2).Track项状态为Negative时,静态路由的下一跳不可达,配置的静态路由无效;
(3).Track项状态为Invalid时,无法判断静态路山的下一跳是否可达,此时配置的静态路由生效
5.配置实例
(1).创建侦测组和track项,并于静态(默认路由关联)
[RT1]
nqaentryadmintest看当前路由器的默认路由
[RT1.displayiprouting-table看\QA测试情况<
SWl>
tracert-q20过在ISF1路由器侧,通过一个ACL模拟在接口、线路处于正常状态下,上层数据无法正常转发的故障。
[ISPl-routerjdisplayaclall
BasicACL2000,named-none-,2rules,
ACL'
sstepis5
rule10denysource0(55timesmatched)RT1路由器上査看NQA测试情况
<
RTl>
displaynqahistoryRT1路由器上查看NQA失败后的默认路山
displayiprouting-tableverboseSP路山器故障恢复
[ISPl-router]undofirewallenable验总结及注意事项:
(1).当建立NQA测试项时,指定的PING测试地址可以为非直连地址,但必须保证路由可达,这就为测试带来了更多的灵活性,可以检测到更上游的网络情况。
如果测试的地址为非直连IF地址,可以在配置NQA项的时候,指定下一跳地址.
nqaentryadmintest于本例中NQA测试,发送的是ICMP-ECHO报文,在使用NQA前需要保证设备没有阻挡ICMP报文
(3)・测试的频率、超时触发次数、发送数据包的大小,可以根据需要调整。
二.多设备多出口模型:
1.网络结构描述:
如图二所示的网络结构,这种多设备,多出口网络通常在出口路由器通常会在路由器间运行VRRP.HSRP等路山冗余协议,终端将虚拟网关Ip为作为自己的默认网关,当网络中的主用设备故障或线路故障时,山备用设备接管转发数据。
同时作为主用设备的路山器通常会配置track上行链路,链路出现故障的时候会降低优先级,从而切换到备用设备上。
。
与上面的问题类似,接口跟踪只能检测到物理接口的故障,协议转换器的问题依然存在。
上行链路故障并不能被感知到,依然会通过主用设备转发数据。
造成转发黑洞。
3.解决方法:
通过在Track模块和VRRP协议之间建立联动,利用监测模块(NQA)监视路山下一跳的可达性,根据测试结果切换VRRP的主备用。
同时可以利用VRRP备份组配置,在提供备份的同时提供一些负载均衡。
4.配置示例
(1).分别在R1和R2路山器中建立两个VRRP组,一部分客户端将(R1路山器为VRRPmaster)作为默认网关,一部分客户端将(R2路山器作为VRRPMaster),实现路山的动态备份,以及负载均衡,
R1路山器的VRRP配置
[RTl-Vlan-interfacelOOZdisplaythis
interfaceVlan-interfacelOO
ipaddress
⑵vrrpvrid10v让tual-ip由器RT1及RT2的?
<QA配置,与实例一相同
LRT1.displaycurrent-configurationbeginnqa
nqaentryadmintest
typeicmp-echo
destinationip
frequency100
action-type
reaction1checked-elementprobe-failthreshold-typeconsecutive5trigger-only
nqascheduleadminteststart-timenowlifetimeforever
track1nqaentryadmintestreaction1
[RT2Jdisplaycurrent-configurationbeginnqa
(4)・路由器RT1及RT2的VRRP状态
[RT1Jdisplayvrrp
IPv4StandbyInformation:
RunMethod
:
VIRTUAL-MAC
VirtualIPPing
Enable
Totalnumberof
virtualrouters:
2
Interface
VRIDState
Run
Adver・
Auth
Virtual
Pri
Time
Type
IP
VlanlOO
10Master
120
1NONE
20Backup
100
LRT2]displayvrrp
Adver・Auth
(3)•在R3路山器侧,通过一个ACL模拟在接口、线路处于正常状态下,上层数据无法正常转发故障
LRT3Jdisplayaclall
BasicACL2000,named-none-,3rules,ACL'
rule10denysource0(2timesmatched)rule20permit
LRT3-Serial0/2/0]displaythis
interfaceSerial0/2/0
link-protocolppp
firewallpacket-filter2000inboundRT1路山器上查看NQA测试情况
[RT1Zdisplaynqahistory
NQAentry(adminadmin,tagtest)historyrecord(s):
Index
Response
Status
2241
3000
Timeout
2012-05-0715:
48:
2240
2239
2238
May715:
35:
2032012RT1VRRP/4/MasterChange:
IPv4Vlan-interfacelOOVirtualRouter10:
MASTER-->
BACKUPreason:
Received
VRRPpacketAuthVirtual
10
Backup
90
NONE
20
[RT2]%May715:
5472012RT2VRRP/4/MasterChange:
BACKUP-->
MASTERreason:
Timerfired
AuthVirtual
PriTimeTypeIP
VlanlOO10Master1001NONE
VlanlOO20Master1201NONE(7)•在R4路山器侧,通过一个ACL模拟在接口、线路处于正常状态下,上层数据无法正常转发故
[RT4Zdisplayaclall
[RT4-Serial0/2/0Zdisplaythis
firewallpacket-filter2000inbound
LRT4]firewallenable
(8).RT2路由器NQA测试失败后,illRT1路由器成为备份组20的Master负责转发数据
RT2>
displaynqahistory
9736
58:
9735
9734
9733
58:
NQAentry(adminadmin,
tagtest)historyrecord(s):
%May715:
22:
9222012RT2VRRP/4/MasterChange:
IPv4Vlan-interfacelOOVirtualRouter20:
MASTER—>
BACKUP
VRRPpacket
reason:
displayvrrp
RunMethod:
VIRTUAL-MAC
VirtualIPPing:
Enable
Totalnumberofvirtualrouters:
Adver.
10Backup
[RT1Zdisplayvrrp
InterfaceVRIDStateRun
Master
5•经验总结及注意事项:
(与示例一中类似)
(1)-当建立NQA测试项时,指定的PING测试地址可以为非直连地址,但必须保证路由可达,这就为测试带来了更多的灵活性,可以检测到更上游的网络情况。
nqaentryadmintest于本例中NQA测试,发送的是ICMP-ECHO报文,在使用NQA前需要保证设备没有阻挡ICMF报文
(3)・测试的频率、超时触发次数、发送数据包的大小,可以根据需要调整。
(4)・备份组的配置不是必须的,可根据实际情况调整
三.分支网络通过MPLSVPN骨干全互联模型
如图三所示,分支网络通过三层MPLSVPN骨干相连,实现站点各VP$之间的互通,以及各VP\之间的隔离。
骨干网使用私有AS号码,AS64512,使用BGP作为路由协议分发、维护YPNV4路由,各路山器通过OSPF协议作为内部IGP使各BGP路山器能通过loopback0接口互联。
为了减少IBGP的全互联数量及易于网络扩展(新加入PE路山器只需要和P1和P2路山器建立IBGP邻居即可)。
将P1和P2路山器配置BGF路山反射器,用来在个BGP反射器客户端间发射VPNV4路山。
Trunk
PEILoopbavkO-
1.1.1/32
20.1.1.0/24OfficeVPN
图三
2.存在问题
BGP、OSPF路山协议,LDP标签分发协议,通过在邻居间发送和接收hello(keepalive)包,检测邻居的存货情况,实现网络收敛。
当邻居出现故障时,需要等待讣时器超时后才能更新邻居信息,重新计算路由,使网络收敛,在收敛前数据无法正常转发。
3.解决方法
利用BFD机制为OSPF,BGP、MPLS、LDP提供快速切换能力。
与OSPF结合
(1).R1路由器OSPF相关配置及信息
LRljdisplaycurrent-configurationbeginospf10R2路山器上,建立ACL模拟与R1相连接的网络出现故障。
[R2]displayaclall
ACL,sstepis5
(3)rule10denysource0(29timesmatched)控R1上的OSPF信息
Rl>
debuggingospfeventR1及R2路由器互联接口上开启bdfospf协议检测功能
LRl-Serial0/2/0Zdisplaythis
ospfcost10
(6)ospfbfdenable启BFD检测后的故障模拟测试
[R2]firewallenable*May810:
59:
51:
8132012R1RM/6/RMDEBUG:
OSPF-BFD:
MessageTypedeletesession,ConnectTypedirect-connect,SrcIPAddress,SrcIFIndex3,DstIPAddress・
OSPF10:
NbrRevLLDownStateFull->
Down・
OSPF10:
NbrRevHelloReceivedStateDown->
Init.1路山器BGP相关配置及信息
(2)[Rl]displaycurrent-configurationbeginbgp2路由器BGP相关配置及信息
(3)[R2jdisplaycurrent-configurationbeginbgp64512R2路由器上模拟故障
[R2-LoopBackO:
displaythis
interfaceLoopBackO
ShutdownCurrentevent