优化GSMDRI Not DetectedDRI Inhibited.docx
《优化GSMDRI Not DetectedDRI Inhibited.docx》由会员分享,可在线阅读,更多相关《优化GSMDRI Not DetectedDRI Inhibited.docx(29页珍藏版)》请在冰豆网上搜索。
优化GSMDRINotDetectedDRIInhibited
白皮书:
CTU/CTU2DRINotDetected和DRIInhibited问题的调试指导
RamiroGuzman
版本1.0
2004年2月17日
BTSCenterofExcellence
GlobalTelecomSolutionsSector
Motorola,Inc
摘要
本文可用于指导现场工程师和客户针对CTU和CTU2出现的DRINotDetected/DRIInhibited问题的故障排除和分析。
修订历史
日期
版本
修订者
变更内容
17Nov2004
0.1
R.Guzman
OriginalDraft
10Dec2004
0.2
R.Guzman
Changesafterinitialreview
14Jan2005
0.3
R.Guzman
Changesaftergroupreview
4Feb2005
0.4
R.Guzman
ChangesafterSWgroupreview
17Feb2005
1.0
R.Guzman
InitialRelease
参考资料
参考
名称
版本
1
MaintenanceInformationGSMStatisticsApplication
68P02901W56-M
2
ServiceManualHorizonmacrooutdoorCategory523MaintenanceInformation(Maint.)
Chapter3-FRUreplacementprocedures
68P02902W02-A
3
ServiceManual:
HorizonIImacro
Chapter7:
FRUreplacementprocedures
68P02902W96-B
4
MaintenanceInformationDeviceStateTransitions
68P02901W57-M
5
MaintenanceInformation:
AlarmHandlingattheOMC
68P02901W26-P
目录
1.介绍4
1.1.文本约定4
2.关于DRINotDetected&DRIInhibited问题的描述4
2.1.DRINotDetected5
2.2.DRIInhibited6
3.DRINotDetected&DRIInhibited问题的调试步骤7
3.1.DRINotDetected的调试步骤7
3.2.DRIInhibited的来源8
4.应被收集的数据和信息9
4.1.一般信息10
4.2.DRINotDetected的测试11
4.3.DRIInhibited的测试14
附录119
附录220
附录322
介绍
本文针对CTU和CTU2上出现的DRINotDetected/DRIInhibited两个问题,为客户和现场工程师提供了一个系统的分析方法。
该方法可以用以收集数据并找出导致问题的根本原因。
文本约定
本文使用以下约定:
此格式的文本:
“WORD”代表一个设备的输出信号。
此格式(黑体)的文本:
“WORD”代表输入到一个设备的命令。
术语“Radio”被用来指CTU和CTU2。
一个收发信机可能包含一个或者两个DRI,这取决于Radio的类型是CTU还是CTU2。
一个DRI代表了一个载波,并不一定是代表整个CTU2。
‘控制器’该词被用来指MCU、MCUF或者是H2SC。
关于DRINotDetected&DRIInhibited问题的描述
从系统软件的角度来看,在系统中的每一个Radio都有相关的状态分配给它们。
这个状态被用来确定一个Radio是否正在被系统使用。
每一个状态包含三个组成部分:
管理状态、操作状态和原因代码。
CTU和CTU2具有各种各样的状态,这些状态取决于Radio所处的环境和条件。
操作状态是由故障管理(FM)来控制的:
∙Disabled.‘Disabled’状态表明系统认为它不能使用该设备。
系统可能因为检测到一个问题而将设备设成‘Disabled’的状态。
∙Enabled.‘Enabled’状态表明该设备可用,但并没有用于用户的通信。
该设备可以作为热备用并接收检测点的信息。
∙Busy.‘Busy’状态表明该设备正在被使用,而且正在支持用户的通信。
管理状态是由操作员来控制的:
∙Locked.‘Locked’状态表明该设备不应该被系统使用。
∙ShuttingDown.‘ShuttingDown’状态是在‘Unlocked’和‘Locked’这两个状态之间的一个短暂状态。
系统会在把该设备转移到‘Locked’状态之前等待,直到所有该设备的使用者停止使用该设备。
∙Unlocked.‘Unlocked’状态表明该设备正在被系统使用。
∙NotEquipped.‘NotEquipped’状态表明该设备在系统中并不存在。
当一个Radio从任何一个状态(很可能是‘Locked’状态)被手动或者是软件执行了UNLOCK或者INS命令,该收发信机将会经过几个D-U状态,最终达到E-U状态(Enabled-Unlocked).在这期间,系统中就会发生一些下载代码的操作。
如果DRI检测到一个接口的问题,它就永远到达不了E-U状态,而且很可能终止在DRINotDetected的状态。
如果在数据库中配置了足够多的收发器(RTF),那么软件就能分配一个收发器给DRI。
DRI设备就能达到B-U:
NoReason的状态。
这个状态意味着DRI是激活的,而且能够处理用户的通信。
如果当DRI出现问题的时候,最终DRI会达到一个类似D-U:
XXXXX的状态,这里XXXXX代表原因代码之一,比方说Code-Loadfailed,Inhibited,DRINotDetected,等等。
本文档将会详细介绍DRINotDetected和DRIInhibited的原因代码。
DRINotDetected
当软件在系统中没能检测到Radio时,DRINotDetected这个原因代码就会出现。
而且当执行state命令时,就会在屏幕上显示以下结果:
DEVICESTATUSINFORMATIONFORLOCATION6:
OPERSTATES:
D:
DisabledE:
EnabledB:
Busy
ADMINSTATES:
L:
LockedU:
UnlockedE:
EquippedS:
Shutdown
LastTransitionRelated
DeviceStateReasondd/mmhh:
mm:
ssFunction
-------------------------------------------------------------------
DRI000D-LNOREASON02/0108:
20:
03None
DRI010D-UINHIBITED02/0108:
25:
31None
DRI020D-LNOREASON02/0107:
40:
38None
DRI030D-LNOREASON02/0107:
40:
54None
DRI040D-UDRINotDetected02/0107:
31:
01None
DRI050D-UDRINotDetected02/0107:
31:
06None
在以上情况中,有两个DRI没有被检测到。
我们将会在下面的章节中讨论出现这种现象的原因。
DRINotDetected的来源
以下列出了目前我们已知的DRINotDetected的来源:
1.Radio没有加电。
2.Radio已经加电,但是没有LED显示或者TTY口没有激活。
3.Radio和控制器(SC)的接口被切断。
(这种情况有可能包括Radio跟扩展单元的接口)
4.当前的数据库与安装的硬件不匹配。
在本文中,我们会描述如何判定DRINotDetected问题会是上述四项的哪一项,而且也会针对如何收集数据以及如何解决问题(如果可能的话)给出详细的信息。
DRIInhibited
如果软件认为Radio应该被禁止,那么DRIInhibited就会出现。
通常在大多数情况下,在最近的10分钟内Radio检测到三次同样的DRI报警,而且该报警不能被重新启动清除,那么系统将会把DRI的状态设置在Inhibited的状态。
当DRI在D-U状态时,Inhibited的状态就会被报告。
当执行state命令时,就会在屏幕上显示以下结果:
DEVICESTATUSINFORMATIONFORLOCATION6:
OPERSTATES:
D:
DisabledE:
EnabledB:
Busy
ADMINSTATES:
L:
LockedU:
UnlockedE:
EquippedS:
Shutdown
LastTransitionRelated
DeviceStateReasondd/mmhh:
mm:
ssFunction
-------------------------------------------------------------------
DRI000D-LNOREASON02/0108:
20:
03None
DRI010D-UINHIBITED02/0108:
25:
31None
DRI020D-LNOREASON02/0107:
40:
38None
DRI030D-LNOREASON02/0107:
40:
54None
DRI040D-UDRINotDetected02/0107:
31:
01None
DRI050D-UDRINotDetected02/0107:
31:
06None
在以上的例子中,一个DRI呈现出Inhibited的状态。
我们将会在下面的章节中讨论出现这种现象的原因,但通常出现这种情况的原因是DRI存在一个处于运行状态的告警。
如果该DRI转换到D-UInhibited的状态,但没有一个处于运行状态的告警,那么系统就会收到一个DRI243告警(DRIAlarm#243:
UnlockedDeviceNotinService)。
从软件版本1.6.1.0.5后,所有转换到D-UInhibited状态的DRI都会使系统产生一个DRI243的告警,而且不会产生其他相关的告警。
因此,任何一个没有产生告警,而且不提供服务的DRI都会导致系统生成243告警。
这并不局限于出现INHIBITED状态的Radio。
在CTU2中,如果其中的一个DRI出现243告警,那么另外一个DRI也将会受到影响。
要点在于如果DRI出现Inhibited状态,那么一定存在一个与它相关的告警。
DRIInhibited的来源
如果软件认为Radio应该被禁止,那么DRIInhibited就会出现。
通常在大多数情况下,在最近的10分钟内Radio检测到三次同样的DRI报警,而且该报警不能被重新启动清除,那么系统将会把DRI的状态设置在Inhibited的状态。
以下我们把可能导致DRIInhibited的情况进一步细分:
1.系统中正在服务的Radio出现报警。
2.系统中一个新的Radio已经被激活并且出现报警。
3.系统被重新配置,但新安装的硬件跟新的配置不匹配。
4.系统负荷很重(软件版本1670.20-t1及以后能解决该问题)。
5.当该DRI被从系统中拿出,一个新的BCCH的收发器将要分配给它。
这只是一个中间状态。
解决该问题的关键是理解哪种报警导致了DRI出现inhibited的状态。
在现场,当显示状态的模式被打开的情况下,状态的改变将会导致一个配置标签(ConfigTag),而这个标签跟一个报警相关。
在本文中,我们会描述如何判定DRIInhibited问题会是上述四项的哪一项。
DRINotDetected&DRIInhibited问题的调试步骤
下文中,我们将对如何调试DRINotDetected和DRIInhibited问题给出详细的说明。
DRINotDetected的调试步骤
当一个Radio出现DRINotDetected问题时,应当按照以下的流程图进行分析、调试。
图1.DRINotDetected调试流程图
DRIInhibited的来源
当一个Radio出现DRIInhibited问题时,应当按照以下的流程图进行分析、调试。
图2.DRIInhibited调试流程
应被收集的数据和信息
注意:
在收集数据和信息的过程中,请记录所有的MMI命令以及相关测试的结果。
一般信息
本节指定了那些需要提供给摩托罗拉的信息,以便使摩托罗拉能够对出现问题的系统有个清晰的了解。
请提供以下信息:
-Radio的状态和配置信息,以及Radio所在站的性能信息。
请在现场对基站进行任何操作之前回答下列问题:
-多少个Radio/扇区受到了影响?
-机柜中的哪些插槽受到了影响?
-哪种类型的Radio受到了影响(CTU,CTU2,两种都是)?
-对于那些受到影响的Radio,设法取得OMCIOI(INTF_ON_IDLE)的统计信息。
-问题是不是在出现下列情况之一后出现的?
o升级
o小区的重新规划
o硬件升级
-在站的MCUF/H2SCMMI-RAM的提示符下运行下列命令:
disp_proc0
disp_proc
state
disp_cell_status
disp_gsm_cell
disp_hop
disp_hopactive
statertf**
disp_neighbor
disp_act_alarm
-对于站上所有的DRI/RTF,在MMI-RAM的提示符下运行下列命令:
disp_rtf_chan
disp_eqrtf
disp_eqdrifull
disp_cal_datadri
DRINotDetected的测试
注意:
在收集数据和信息的过程中,请记录所有的MMI命令以及相关测试的结果。
测试#1:
针对某个特定的DRI,确定通过断路器已经给Radio上电。
测试#2:
确定LED的状态是打开的。
LED
状态
说明
收发信机状态
关闭
收发信机没有上电
绿灯闪
正在装入启动代码
绿灯
正常操作状态
黄灯闪
测试模式
黄灯
收发信机被禁止
红灯
告警状态
红、绿灯交替闪
正在对FLASH重新编程
不要关掉电源!
如果LED没有指示,并且通过了4.2.1节的测试,那么或者是LED工作不正常,或者是该Radio没能正常上电。
需要将该收发信机返回摩托罗拉维修。
测试#3:
确认Radio上有激活的MMI提示符:
MMI-ROM0000->
如果没有提示符的话,说明该Radio没能正常工作。
应该将其返回摩托罗拉维修。
在用户用rlogin连接到Radio的emon的情况下,提示符应该是:
emon_XXXX%>
如果没有提示符的话,说明该收发信机没能正常工作。
应该将其返回摩托罗拉维修。
测试#4:
对于CTU和CTU2,检查一下背板连接器和前面板是否有物理损坏。
如果前面板有弯曲或者不平的话,那么背板的连接也可能不正确。
同时也要确认一下MCUF/SiteController是否被正确安装。
如果以上没有问题的话,DRI和SiteController之间的通信链路就应该建立起来了。
在RSSemon的提示符下确认是否从MCUF/SiteController收到消息。
以下例子显示了当Radio上电时,在emon提示符下收到的消息。
当Radio被操作进入UNLOCKED状态的命令时,收到的消息是一样的。
EXECDLSP:
LinkEstablishedtoCPU1015h.
rss_activate:
receivedRSS_ACTIVE_REQmsgfromFM.
RSS:
OpeningDRI0
RSS:
OpeningDRI1
send_rss_act_suc:
sendingaRSS_ACT_SUCtoFM.
dri_standby:
rec'dmsgtoputDRI0inSBY.
send_dri_mcap_act:
sendingaRSS_DRI_ACT_REQforDRI0toLayer1.
DRI0,CTU2codeloadcomplete
send_rss_scheduler_start:
sendingaRSS_SCHEDULER_STARTtoLayer2.
send_dri_start_sync:
sendingaRSS_DRI_START_SYNC_MSGforDRI0toLayer1.
send_dri_sby_suc:
sendingaDRI_STANDBY_SUCCESSforDRI0toFM.
dri_activate:
rec'dDRI_ACTfordri0.
send_abis_dri_act:
sendingaRSS_ABIS_ACT_DRIforDRI0toAbis.
send_dri_act_suc:
sendingaDRI_ACTIV_SUCCESSforDRI0toFM.
prc_rss_msgs:
rec'dINS_CONF:
DRI0,timeslot1,type:
TCH(fullrate)
prc_rss_msgs:
rec'dINS_CONF:
DRI0,timeslot2,type:
TCH(fullrate)
prc_rss_msgs:
rec'dINS_CONF:
DRI0,timeslot3,type:
TCH(fullrate)
prc_rss_msgs:
rec'dINS_CONF:
DRI0,timeslot4,type:
TCH(fullrate)
prc_rss_msgs:
rec'dINS_CONF:
DRI0,timeslot5,type:
TCH(fullrate)
prc_rss_msgs:
rec'dINS_CONF:
DRI0,timeslot6,type:
TCH(fullrate)
prc_rss_msgs:
rec'dINS_CONF:
DRI0,timeslot7,type:
TCH(fullrate)
prc_rss_msgs:
rec'dINS_CONF:
DRI0,timeslot0,type:
BCCH-SDCCH/4combined
dri_standby:
rec'dmsgtoputDRI1inSBY.
确认MCUF/SiteController是否能够检测到收发信机。
以下的例子显示了在SiteControlleremon提示符下的TTY输出。
NGEXECDLSPdl_message_con:
Controlmailboxopenedforchannel10,=0
NGEXEC_DLSPprocess_hdlc_msg:
LINKESTABLISHEDforchannel10,LinkMailboxid=2003
MIP:
Resultofpcmcia_availableis1
MIP:
Startingcodeload;gettinglistforcpu0x2003.
MIP:
SendingdownloadOKnoobjectstoloadtoCAforCPU0x2003
另外一个要点是,如果问题出现在一个扩展单元,那么我们应该检查一下光纤、FMUX、XMUX和SiteI/OCard。
测试#5:
确定一下最近数据库是否被修改过。
如果数据库被修改过的话,确保数据库跟安装的硬件相匹配。
使用以下命令:
disp_eqdrifull
然后把输出跟安装的硬件比较。
如果不匹配的话,就要找出原因所在。
以下例子显示了在一个执行该命令后的输出结果:
DeviceFRUKitNumberSerialNumber
---------------------------------------------------------------
CSFP000NotApplicable
BTP000H2SCSWLN9221ECX78K4T0430
BTP100NotApplicable
DRI000CTU2SWRF9139JX79T4V00XU
DRI010CTU2SWRF9139JX79T4V00XU
DRI020CTU2SWRF9139JX79T4V010U
DRI030CTU2SWRF9139JX79T4V010U
DRI100CTU2SWRF9139JX79T4U0ARG
DRI110CTU2SWRF9139JX79T4U0ARG
DRI120CTU2SWRF9139JX79T4V00MD
DRI130CTU2SWRF9139JX79T4V00MD
DRI200CTU2SWRF9139JX79T4V00N0
DRI210CTU2SWRF9139JX79T4V00N0
DRI220CTU2SWRF9139JX79T4V00MR
DRI230CT