CDMA双机原理与常见问题处理0617B112.docx

上传人:b****8 文档编号:23538762 上传时间:2023-05-18 格式:DOCX 页数:54 大小:1.18MB
下载 相关 举报
CDMA双机原理与常见问题处理0617B112.docx_第1页
第1页 / 共54页
CDMA双机原理与常见问题处理0617B112.docx_第2页
第2页 / 共54页
CDMA双机原理与常见问题处理0617B112.docx_第3页
第3页 / 共54页
CDMA双机原理与常见问题处理0617B112.docx_第4页
第4页 / 共54页
CDMA双机原理与常见问题处理0617B112.docx_第5页
第5页 / 共54页
点击查看更多>>
下载资源
资源描述

CDMA双机原理与常见问题处理0617B112.docx

《CDMA双机原理与常见问题处理0617B112.docx》由会员分享,可在线阅读,更多相关《CDMA双机原理与常见问题处理0617B112.docx(54页珍藏版)》请在冰豆网上搜索。

CDMA双机原理与常见问题处理0617B112.docx

CDMA双机原理与常见问题处理0617B112

资料编码

产品名称

RAC6610

BSC6680

使用对象

技术支持工程师

产品版本

RAC6610V200R001

BSC6680V300R001

编写部门

CBSS维护

资料版本

1.0

 

CDMA双机原理与常见问题处理

拟制:

张旭47745

日期:

2006-11-2

审核:

CBSS维护

CBSS技术支持

日期:

2006-11-8

审核:

日期:

批准:

日期:

华为技术有限公司

HuaweiTechnologiesCo.,Ltd.

版权所有XX

Allrightsreserved

 

记录

日期

文档修订版本

描述

作者

2006-11-2

1.00

初稿完成

张旭

2006-11-28

1.01

根据评审修改

张旭

2007-05-24

1.02

修改了文档名称、增加了数据同步一直为传送状态时的处理方法

张建胜

2007-09-10

1.03

补充1.9.2中对一种双机同步失败的手动处理措施

张建胜

2008-01-03

1.04

添加了对PARC平台BSC的描述,更换了《CDMABAM密码及机器名修改指导书.doc》,增加2条FAQ,修改了LDF超大的FAQ

李经伟

2008-5-21

1.05

增加5条FAQ,修改3条FAQ

李经伟

2009-2-12

1.06

增加了12条FAQ

李经伟

2009-02-13

1.07

补充了3.2.15双机同步Bam服务器重新启动后,查询双机状态为“未安装”

补充了3.3.2中的第11点和第12点

修改了1.3.3和1.3.4中的部分内容

王子男

 

目录

第1章双机原理介绍6

1.1双机的由来6

1.2双机设计思想6

1.2.1组网设计6

1.2.2硬件设计7

1.2.3虚拟IP与双机切换设计7

1.2.4数据同步设计9

1.3双机的实现10

1.3.1功能模块分解10

1.3.2数据同步建立11

1.3.3数据传输12

1.3.4基于临时表的数据传输13

1.3.5故障倒换判决13

1.3.6相关命令13

第2章双机配置流程14

2.1初始安装配置14

2.2双机配置工具15

2.3数据同步卸载17

第3章双机常见问题FAQ18

3.1操作系统以及SQLServer类问题FAQ18

3.1.1安装RAC双机系统对操作有什么要求,SQLServer版本有什么要求?

18

3.1.2双机系统对SQLServer服务器名和BAM计算机名有什么要求?

23

3.1.3双机运行正常,但在应急工作站上备份的数据库文件比Bam服务器上的小很多,为什么?

25

3.2双机配置类FAQ25

3.2.1如何检查双机系统中的IP地址设置的正确性?

25

3.2.2双机IP配置错误导致Bam管理器起不来28

3.2.3EWS上虚拟IP配置为本机实际IP,导致Bam宕机后EWS不能升为主用,为什么?

29

3.2.4BAM和EWS、主用和备用的概念30

3.2.5“Peername”配错导致双机无法同步。

30

3.2.6对EWS的路由进行删除添加操作,删除后就添加不进去了,为什么?

(适用于RAC6610)31

3.2.7为什么内网虚拟IP和实际IP不能同网段,而外网没有此限制?

32

3.2.8如何检查BAM和EWS版本的一致性32

3.2.9在Bam管理器里怎么没找到Dual进程呀?

是不是没运行呀?

32

3.2.10应急工作站和BAM服务器Windows系统不断提示IP地址冲突,应该怎么解决?

33

3.2.11PARC-BSC增加了一个内网备用VIP,是什么作用呀?

(适用于BSC6680)33

3.2.12按照《产品手册》,使用OMU调试网口ETH2出厂IP(192.168.1.1)无法远程桌面登录OMU,为什么?

(适用于BSC6680V3R6及以后版本)34

3.2.13OMU板上电后内网Team时断时连,为什么?

(适用于BSC6680V3R6及以后版本)34

3.2.14双机环境下手工升级基站,如何避免主备倒换?

34

3.3数据同步类FAQ35

3.3.1为什么配置好双机后的第一次数据同步需要那么长时间(1个小时左右)?

35

3.3.2双机数据同步建立失败有哪些原因,如何解决?

36

3.3.3为什么在查询数据同步状态的时候,数据传送状态一直都是正在传送状态?

42

3.3.4某局点打开CDR过滤开关后,导致双机数据传送状态一直是“正在传送”,双机无法倒换,为什么?

43

3.3.5Bam机器上的数据库LDF文件超大,备份文件dat也超大,占据磁盘很大的空间,怎么解决?

43

3.3.6数据同步会同步哪些数据?

发生双机倒换会有什么影响?

45

3.3.7双机配置工具中Reset按钮和Aplly按钮的作用分别是怎样的?

47

3.3.8双机数据同步进度是根据什么来判断的,为什么有时候会有百分比突变过程?

47

3.3.9数据同步建立过程中,查询双机建立状态,一直停留在某个百分比,超过半个小时不能继续,怎么处理?

48

3.3.10RACV200R001C02版本中,双机倒换后,在建立新的数据同步过程中,为什么备用机会发生重启?

48

3.4倒换相关类FAQ48

3.4.1常见的双机故障倒换有哪些原因?

48

3.4.2执行SWPBAM命令,提示用户备用机拒绝倒换,怎么回事?

48

3.4.3双机倒换时MML命令怎么不能执行?

49

3.4.4查询双机状态的时候为什么自动故障倒换是”-”?

49

3.4.5从应急工作站主用倒换到IBMBam主用后,发现应急工作站LoadData目录下面的数据加载文件消失,什么原因?

49

3.4.6主用BAM内网断链是否会发生自动倒换?

49

3.4.7为什么使用远程升级工具升级BSC/BTS之前要求做双机倒换测试?

49

3.5网络心跳相关类FAQ50

3.5.1主备用机器运行正常,但是却都无法检测到对方50

3.5.2双机情况下客户端无法连接BAM51

3.5.3双机之间数据是通过内网交互还是外网?

51

3.6其他FAQ51

3.6.1RAC6610的双机与BSC6600的应急工作站有什么区别?

两者的备份机制是怎么样的。

51

第1章双机原理介绍

1.1双机的由来

大家熟知的BAM服务器在CDMABSC/RAC系统中承担着重要的功能角色,工程开局,数据配置,日常维护,性能统计,告警查询,用户数据管理等等。

如果BAM发生故障,BSC/RAC主机将处于不可维护状态。

为保障BAM的正常运行,提高BAM子系统的稳定性,RACV100R001B02版本开发中将BAM由原来的单服务器工作方式改为双机工作方式(一个服务器,一个应急工作站),运行在主备模式,一旦服务器因硬件故障或者不可恢复的软件故障宕机,应急工作站能够在最短时间内切换到主用模式,继续向用户和主机提供服务。

为实现这种功能,BAM新增双机软件同时运行在服务器和应急工作站上,通过两端双机软件的协同工作,完成服务器和应急工作站之间的双向监控,并保持主备BAM上数据的一致。

注:

RAC产品所有版本都支持双机系统,BSC产品从BSC6680V3R1开始支持双机系统。

1.2双机设计思想

1.2.1组网设计

双机系统在RAC系统中的网络地位如下图所示。

1.2.2硬件设计

本着以最少的成本获得最大性能的设计思想,双机硬件上采用不对等的模式,主服务器采用IBMX343服务器,应急工作站采用普通PC机。

1.2.3虚拟IP与双机切换设计

双机系统中有两个很重要的概念:

实际IP和虚拟IP。

实际IP地址:

我们通常意义上理解的IP,仅限于BAM双机系统内部通讯使用。

该IP地址可以通过点击"网卡->TCP/IP协议"进行配置和观察。

虚拟IP地址:

为了实现对外屏蔽主备系统差异,使得内网或者外网的客户端访问BAM时能够使用各自网段内唯一的地址,双机系统在内网和外网分别提供了一个虚拟IP地址。

双机系统在启动的时候主用机会自动设定到绑定虚拟IP的网卡上。

主机各个单板通过内网虚拟IP(MUSA平台下一般是10.12.3.128,PARC平台下一般是80.0.0.255)访问BAM,而LMT或M2000通过外网虚拟IP访登录BAM。

BAM服务器通过两个双端口容错网卡各自绑定为一组,分别连接到主备LanSwitch。

应急工作站通过两个双端口网卡分别连接到主备LanSwitch。

主备LanSwitch级连后分别接到主备MUX(对于大容量RAC系统,则是主备CMPU;对于PARC平台BSC,则是主备SCUOa)。

图中的蓝粗线和红细线表示的网络分别处于不同的网段,每一个网段设定为不同的VLAN。

不同的VLAN之间不能互访。

BAM双机切换设计思路是为主节点动态绑定两个虚拟IP地址(简称为VIP),内外网各一个,分别为内网主机和外网客户端访问BAM的开放地址。

节点原来设置的IP地址仅用于节点之间数据同步和心跳网络的建立。

节点的心跳网络通过三条链路建立:

一为通过内网网卡互连的Ethernet,一为通过外网网卡互连的Ethernet,一为通过串口线直接连接的RS232串口通讯。

BAM以主从节点之间的心跳判断对方活动与否,任何一条链路中断仅能产生告警,只有当三条链路同时中断一定时间(2倍于BAM启动时间――-5分钟)才能判断为某一节点真正故障,这时判决为主备切换。

(注:

RACV200R001C02B012之后的版本已经去掉了RS232串口线的心跳链路,即只有内外网两条心跳链路)

目前主备切换实现模型为非对称模型,即仅有从服务器到应急工作站的自动切换功能。

主从节点的BAM程序完全一致,只是注册表配置有些许不同。

节点运行为主用状态时,它必须是成功地绑定了上述的两个VIP,即在网卡上已经设置了这两个IP地址,而且VIP是设置在正确的网卡上,内外网不能颠倒。

当主节点退出运行时,删除VIP。

这时VIP资源可重新用于绑定,如果是从结点检测到主节点故障或从结点比主节点先占有该VIP资源,则发生切换。

对于内网主机和外网客户端来说,由于主从节点切换后,VIP不变,结合以下的数据同步,只要有重连机制,则可让切换后的节点承担原BAM一样的功能,而内网主机和外网客户端不知道已经发生了切换,只是在告警上要求有相关信息上报。

1.2.4数据同步设计

BAM双机设计的目的就是服务器发生故障后,应急工作站能够在最短时间内启动,实现BAM的功能。

在用户角度上看,倒换后,基本不影响使用功能。

所以在设计时,数据同步采用了MicrosoftSQLServer2000的事务复制同步技术,它在不同的数据库之间对数据和数据库对象进行复制和分发并进行同步以确保其一致性。

主服务器上的各个同步数据库中的任何增加、删除、修改的数据都实时的同步到应急工作站上。

MicrosoftSQLServer2000中事务复制同步技术涉及到的几个很重要的概念。

发布:

发布是一个数据库中的一个或多个项目的集合。

这种多个项目的分组使得指定逻辑相关的一组数据和数据库对象以一起复制变得更容易。

项目:

项目是指定要复制的数据表、数据分区或数据库对象。

项目可以是完整的表、某几列(使用垂直筛选)、某几行(使用水平筛选)、存储过程或视图定义、存储过程的执行、视图、索引视图或用户定义函数。

订阅:

订阅是对数据或数据库对象的复本的请求。

订阅定义将接收的发布和接收的时间、地点。

订阅的同步或数据分发可以由发布服务器(强制订阅)或订阅服务器(请求订阅)请求。

发布可以支持强制订阅和请求订阅的混合。

发布服务器:

发布服务器是提供数据以便复制到其它服务器的服务器。

发布服务器可以具有一个或多个发布,每个发布代表一组逻辑相关的数据。

除了指定其中哪些数据需要复制之外,发布服务器还检测事务复制期间发生更改的数据并维护有关此站点上所有发布的信息。

分发服务器:

分发服务器是作为分发数据库宿主并存储历史数据和/或事务以及元数据的服务器。

分发服务器的角色根据执行的复制类型而不同。

远程分发服务器是独立于发布服务器并配置为复制的分发服务器的服务器。

本地分发服务器是既配置为复制的发布服务器又配置为复制的分发服务器的服务器。

订阅服务器:

订阅服务器是接收复制数据的服务器。

订阅服务器订阅的是发布而不是发布中分离的项目;并且订阅服务器只订阅其需要的发布,而不是发布服务器上所有可用的发布。

根据复制的类型和所选择的复制选项,订阅服务器还可以将数据更改传播回发布服务器或将数据重新发布到其它订阅服务器。

CDMABSC/RAC双机系统中数据同步物理模型如下图所示:

该模型中,分发服务器与订阅服务器在同一服务器(备用BAM)上,发布服务器单独在一服务器上(主用BAM)。

该模型能够减少发布服务器上的本地处理工作和磁盘使用量,使主用BAM因为数据复制消耗的性能降低到最低限度。

1.3双机的实现

在实现上,双机软件表现为一个Windows的可执行文件Dual.exe,该服务进程伴随着BAM管理器(SecurityManager)的启动而启动,退出而退出,在Windows的进程管理器中可以查看该进程的运行状况。

1.3.1功能模块分解

双机软件设计了如下模块:

主控模块、数据同步模块、硬件监控模块、心跳处理模块、VIP管理模块。

其中,硬件监控模块由于是独立的线程,和双机状态机没有直接关系,因此放到了SecurityManager中启动。

各个模块功能如下:

主控模块:

初始化双机环境,创建VIP管理对象,创建心跳处理对象,创建数据同步监视对象,处理1秒定时器,驱动各模块运行,一定条件下完成主备倒换。

VIP管理模块:

设置节点的内外网虚拟IP,清除节点的内外网虚拟IP,定时检查VIP的设置。

硬件监控模块:

接收操作系统上报的Trap包,完成对服务器硬件的监控,故障告警上报。

心跳处理模块:

内外网心跳通道的建立、网络通道有效性检查、通道故障告警上报。

数据同步模块:

数据库同步连接的建立、拆除;数据同步的监控;数据同步故障告警上报。

1.3.2数据同步建立

当主从节点VIP环境配置正确,心跳链路正常之后,Dual进程会启动数据同步安装,建立两者之间的数据同步。

数据同步建立完毕,表示主从BAM之间的数据通道已经建立,可以进行数据同步传输。

1.3.3数据传输

数据同步建立完毕,将进行数据传输。

1)第一次数据传输

这是数据同步通道建立完毕之后的首次数据传输,这一步要将数据库所有数据从主用机

复制到备用机,故需耗时约三十分钟(配置数据多,时间会更长)。

如果第一次同步复

制失败,备用机将因为本地数据不完整而拒绝主备倒换。

2)实时同步数据传输

首次建立成功之后,数据同步状态将会出现空闲状态,后续的数据同步是基于SQL

Server事务的复制类型,只要在主用服务器上的数据发生了增加、删除或修改中的任何

一种改变,数据都将被迅速地复制到备用机上。

1.3.4基于临时表的数据传输

在数据由主用机传输到备用机的时候,采用的SQLServer临时表缓存的机制。

即主用机上的数据首先复制到备用机的临时表,当主用机故障倒换,备用机升为主用的

时候,临时表的数据才自动倒入配置表,此时原主用机和原备用机上的配置表才真正一

致。

这一点在升级做用户数据脚本的时候要特别注意。

注:

关于此处的注意项以及曾经发生的两次事故请参见《无线CBSS维护部技术通知

[2006]004号--关于RAC双机系统运行机制的技术通知》。

1.3.5故障倒换判决

BAM和EWS之前采用1秒钟心跳握手消息来判断对端存活状态,消息格式为内部私有协议。

连续300秒收不到对端心跳信号,则判断心跳链路故障。

如果所有心跳链路均故障,则判定为对端故障,发起自动故障倒换。

1.3.6相关命令

当前只有下面5个:

命令

命令描述

备注

DSPDUALSTAT

查询双机系统状态

SWPBAM

双机主备倒换

SWPDATA

建立双机系统数据同步

DRPDTSYNC

卸载数据同步

在RACV2R1C04开始提供

DSPOMUSTAT

查询OMU状态

在BSCV3R6开始提供

 

第2章双机配置流程

双机配置可以在安装时候配置,也可以安装完毕后使用双机配置工具DualCfg配置。

配置过程中主要是设置主备用机器的内外网IP地址,绑定的虚拟IP,以及主备用机器的机器名。

2.1初始安装配置

BAM侧

1、设置本端内外网虚拟IP(内外网网卡不能选错)

2、设置对端计算机名、内外网IP地址

EWS侧:

同BAM侧设置基本类似

安装完毕,BAM和EWS心跳链路完全正常后,双机程序会自动发起数据同步建立过程。

2.2双机配置工具

如果初始安装的时候没有进行双机配置或配置错误,可以在后期采用双机配置工具DualCfg(存放在\Airbridge\Services目录下)来进行配置。

在BAM侧,做如下配置,然后点击“Apply”按钮:

在EWS侧,做如下配置,然后点击“Apply”按钮:

两端配置完毕后,如果配置的IP地址、机器名均正确,则双机同步会自动建立。

注意几点:

(1)需先把BAMService、BAMManager退出,否则无法运行DualCfg。

(2)“Peername”是对端电脑名,不要输错了,可以通过在对端电脑桌面右键单击<我的电脑>-<属性>-<网络标识>查看到。

(3)如果BAM为备用机,EWS为主用机,不会自动建立双机同步,需要使用MML命令“SWPDATA”手工建立。

2.3数据同步卸载

如果有需要卸载数据同步,可以采用双机配置工具分别在BAM和应急工作站上进行卸载。

卸载成功弹出如下对话框

主用和备用两端均卸载成功,则数据同步完全卸载成功。

 

第3章双机常见问题FAQ

3.1操作系统以及SQLServer类问题FAQ

3.1.1安装RAC双机系统对操作有什么要求,SQLServer版本有什么要求?

注意:

以下要求对BAM和EWS均适用。

1、操作系统要求是Windows2000Server+SP4版本

确认方法:

在<我的电脑>上单击右键,在弹出的菜单中选择<属性>

2、SQLServer要求是企业版或标准版+SP4+HotfixKB901200,不能是个人版。

确认方法:

打开SQLServer企业管理器->在SQLServer实例上单击右键->在弹出菜单中选择<属性>

3、要求在操作系统中补充安装SNMP网络组件。

确认方法:

控制面板->添加/删除程序->添加/删除Windows组件

在弹出窗口上选择<管理和监视工具>,然后点击<详细信息>按钮

在弹出窗口上确认“简单网络管理协议”前面是否打勾;若没有则打上勾,点击“确定”,点击“下一步”安装之(可能会提示选择Windows安装文件,请定位到Windows安装盘或源文件的“I386”目录)

3.1.2双机系统对SQLServer服务器名和BAM计算机名有什么要求?

二者必须保持一致,否则会影响双机建立。

确认方法如下:

1、在<我的电脑>上单击右键,在弹出的菜单中选择<属性>;

2、在弹出的属性窗口中,选择<网络标识>页面,红色标注处即为机器名

3、打开[开始]->[程序]->[MicrosoftSQLServer]->[查询分析器],并连接本机(127.0.0.1),输入sa用户密码,按<确认>

4、执行语句:

sp_helpserver,结果如下:

5、检查上图中id为0的行的name字段是否和步骤2中的机器名一致(不区分大小写),如果一致,则这个就是正确的机器名。

否则,进行步骤6。

注意:

上面查询分析器的结果中,可能没有id为0的记录。

是由于多次不正常手段卸载数据同步造成,这种情况下必须重新安装SQLserver,即步骤6中的方法a。

6、解决不一致的办法请参考《CDMABAM密码及机器名修改指导书.doc》里“Bam服务器机器名的修改方法”章节。

3.1.3双机运行正常,但在应急工作站上备份的数据库文件比Bam服务器上的小很多,为什么?

在数据由主用机传输到备用机的时候,采用的SQLServer临时表缓存的机制,即主用机上的数据首先复制到备用机的临时表,当主用机故障倒换,备用机升为主用的时候,临时表的数据才自动倒入配置表,此时原主用机和原备用机上的配置表才真正一致。

所以在备用机升为主用之前,备份的数据库文件都会比主用机小一些。

3.2双机配置类FAQ

3.2.1如何检查双机系统中的IP地址设置的正确性?

IP地址的正确性直接影响到双机系统的建立,需要按照如下注意项依次在BAM和EWS

上分别进行检查。

1、实际IP检查

a、在主用机上面<开始>-<运行>的窗口中输入cmd并运行。

b、在弹出的Dos窗口中输入ipconfig,显示出本机所有的IP,如下图:

c、如上图红色部分,检查规划用于内网的网卡,上面是否绑定了内网的实际IP;检查

规划用于外网的网卡,上面是否绑定了外网的实际IP。

d、在备用机上面<开始>-<运行>的窗口中输入cmd并运行。

e、在弹出的Dos窗口中输入ipconfig,显示出备用机所有的IP,如下图:

f、如上图,检查规划用于内网的网卡,上面是否绑定了内网的实际IP;检查规划用于

外网的网卡,上面是否绑定了外网的实际IP。

2、虚拟IP检查

a、主用机器上, 在<开始>-<运行>的窗口中输入regedit并运行,找到节点

HKEY_LOCAL_MACHINE\SOFTWARE\Huawei\cdma2000\System

该节点下面ExtraNetAddr对应的键值为外网虚拟IP;

InnerNetAddr对应的键值为内网虚拟IP;

若发现虚拟IP和规划的的不一样,或内网虚拟IP设反了,请打开DualCfg.exe进行更正。

b、在备用机上面进行同样的检查。

3、双机配置中对端机器名,对端内网实际IP,对端外网实际IP,及本机运行类型检查

a、在主用机器上,在<开始>-<运行>的窗口中输入regedit并运行,找到节点HKEY_LOCAL_MACHINE\SOFTWARE\Huawei\cdma2000\Monitor

该节点下面PeerNodeName为对端机器名

DualPeerInnerIP为对端内网实际IP

DualPeerOuterIP为对端外网实际IP

DualCfgNodeId为本机服务器类型

在服务器类型(DualCfgNodeId)中0x00000001

(1)是指Server

0x00000002

(2)是指EmergencyWorkstation

如下图:

b、查找上图中的键值,请检查这四项与对端实际情况是否相符,不符请使用DualCfg.exe修改。

c、在对端做同样的检查。

4、以上各项设置正确后,进行网络状况测

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 工程科技 > 能源化工

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1