05 Code Load FailuresChinese.docx
《05 Code Load FailuresChinese.docx》由会员分享,可在线阅读,更多相关《05 Code Load FailuresChinese.docx(24页珍藏版)》请在冰豆网上搜索。
05CodeLoadFailuresChinese
白皮书:
CTU/CTU2CodeLoadFailures问题的调试指导
RamiroGuzman
JosephMaffiola
版本1.0
2005年4月8日
BTSCenterofExcellence
GlobalTelecomSolutionsSector
Motorola,Inc
摘要
本文可用于指导现场工程师和客户针对CTU和CTU2出现的CodeLoadFailures问题进行故障排除和分析。
修订历史
日期
版本
修订者
变更内容
14Jan2005
0.1
R.Guzman
Original.
28Mar2005
0.2
R.Guzman
J.Maffiola
AddedTest#4.
8Apr2005
1.0
R.Guzman
J.Maffiola
Revisionaftergroupreview.
参考资料
参考
名称
版本
1
MaintenanceInformationGSMStatisticsApplication
68P02901W56-M
2
ServiceManualHorizonmacrooutdoorCategory523MaintenanceInformation(Maint.)
Chapter3-FRUreplacementprocedures
68P02902W02-A
3
ServiceManual:
HorizonIImacro
Chapter7:
FRUreplacementprocedures
68P02902W96-B
4
MaintenanceInformationDeviceStateTransitions
68P02901W57-M
5
MaintenanceInformation:
AlarmHandlingattheOMC
68P02901W26-P
目录
1.介绍4
1.1.文本约定4
2.关于CodeLoadFailures问题的描述4
2.1.CodeLoadFailed5
2.2.DRICodeLoadFailed6
2.3.RCUCodeLoadFailed7
3.CodeLoadFailures问题的调试步骤9
3.1.CodeLoadFailures的调试步骤9
4.应被收集的数据和信息10
4.1.一般信息10
4.2.CodeLoadFailed的测试11
附录114
附录221
附录322
1.介绍
本文针对CTU和CTU2上出现的CodeLoad问题,为客户和现场工程师提供了一个系统的分析方法。
该方法可以用以收集数据并找出出现问题的根本原因。
2.文本约定
本文使用以下约定:
此格式的文本:
“WORD”代表一个设备的输出。
此格式的文本:
“WORD”代表输入到一个设备的命令。
‘收发信机’该词被用来指CTU和CTU2。
在某些情况下,当一个过程只应用于某种特定的收发信机类型时,将特殊注明。
一个收发信机可能包含一个或者两个DRI,这取决于收发信机的类型是CTU还是CTU2。
一个DRI代表了一个载波,并不一定是代表整个CTU2。
‘控制器’该词被用来指MCU、MCUF或者是H2SC(基站控制器)。
3.关于CodeLoadFailures问题的描述
从系统软件的角度来看,在系统中的每一个收发信机都有一个相应的状态。
状态被用来决定一个收发信机是否正在被系统使用。
每一个状态包含三个组成部分:
管理状态、操作状态和原因代码。
CTU和CTU2具有各种各样的状态,这些状态取决于收发信机所处的环境和条件。
操作状态是由故障管理器(FM)来控制的:
∙Disabled.‘Disabled’状态表明系统认为它不能使用该设备。
系统可能因为检测到一个问题而将设备设成‘disabled’的状态。
∙Enabled.‘Enabled’状态表明该设备可用,但并没有用于用户的通信。
该设备可以作为热备用并接收检测点的信息。
∙Busy.‘Busy’状态表明该设备正在被使用,而且正在支持用户的通信。
管理状态是由操作人员来控制的:
∙Locked.‘Locked’状态表明该设备不应该被系统使用。
∙ShuttingDown.‘ShuttingDown’状态是在‘Unlocked’和‘Locked’这两个状态之间的一个短暂状态。
系统会在把该设备转移到‘Locked’状态之前等待,直到所有该设备的使用者停止使用该设备。
∙Unlocked.‘Unlocked’状态表明该设备可以被系统使用。
∙NotEquipped.‘NotEquipped’状态表明该设备在系统中并不存在。
当一个收发信机从任何一个状态(很可能是‘Locked’状态)被手动或者是软件执行UNLOCK或者INS命令,该收发信机将会经过几个D-U状态,最终达到E-U状态(Enabled-Unlocked).在这期间,系统中就会发生一些代码的下载。
如果DRI检测到与控制器的通信出现问题,它就永远到达不了E-U状态,而且很可能终止在DRINotDetected状态。
如果在数据库中配置了足够多的RTF,那么软件就能分配一个RTF给DRI。
DRI设备就能达到B-U:
NoReason的状态。
这个状态意味着DRI是激活的,而且能够处理用户的通信。
当DRI进入服务状态的过程中出现问题,最终DRI会达到一个类似D-U:
XXXXX的状态,这里XXXXX代表一个原因代码,如:
Code-Loadfailed,Inhibited,DRINotDetected,等等。
本文档将会详细介绍CodeLoadFailed,DRICodeLoadFailed和RCUCodeLoadFailed原因代码。
4.CodeLoadFailed
介绍
当DRI下载BSS操作代码的时候,如果系统软件检测到一个错误,CodeLoadFailed这个原因代码就会出现。
DRI会尝试完成三次BSS操作代码的下载,如果仍然失败,DRI的状态会变为D-U:
CodeLoadFailed.如果执行state命令,就会在屏幕上显示以下结果:
DEVICESTATUSINFORMATIONFORLOCATION6:
OPERSTATES:
D:
DisabledE:
EnabledB:
Busy
ADMINSTATES:
L:
LockedU:
UnlockedE:
EquippedS:
Shutdown
LastTransitionRelated
DeviceStateReasondd/mmhh:
mm:
ssFunction
-------------------------------------------------------------------
DRI000D-LNOREASON02/0108:
20:
03None
DRI010D-UNOREASON02/0108:
25:
31None
DRI020D-LNOREASON02/0107:
40:
38None
DRI030D-LNOREASON02/0107:
40:
54None
DRI040D-UCodeLoadFailed02/0107:
31:
01None
DRI050D-LNOREASON02/0107:
31:
06None
在以上例子中,一个DRI出现了CodeLoadFailed故障。
我们将会在下面的章节中讨论出现这种现象的原因。
无论DRI的状态如何转变,每当进行CodeLoad进程的时候,故障管理器都会发送一条DRI_STANDBY消息给RSSCFM。
CodeLoadFailed的原因
以下列出了目前我们已知的CodeLoadFailed的原因:
1.收发信机到控制器的接口出现问题(这也包括到扩展机柜的接口)。
2.没有从RSS正确接收到CodeLoad成功的消息。
3.对于CTU2,CodeLoadFailure可能是由于CTU2的操作代码没有被正确的存储在(或者不存在)CSFP(PCMCIA)上.那么原因代码是“CodeObjectsMissing”,.
4.另外可能的失败原因是CodeLoad操作超时。
如果此类问题出现,应该INS这个收发信机。
我们曾经遇到过一种情况,当一个较大配置的站中的所有收发信机同时启动的时候,其中的一些收发信机可能不能及时完成CodeLoad,从而导致CodeLoad超时。
虽然一些必要的升级减少了这种情况的发生,但偶然情况下仍会发生超时现象,这并不是一个硬件方面的问题。
在本文中,我们会描述如何判定CodeLoadFailed问题是上述四项的哪一项,而且也会针对需要收集哪些数据以及如何解决问题(如果可能的话)给出详细的信息。
4.1.DRICodeLoadFailed
介绍
如果系统软件不能下载CCDSPs,CEB,或者FEP代码到收发信机,原因代码DRICodeLoadFailed就会出现。
当执行state命令时,就会在屏幕上显示以下结果:
DEVICESTATUSINFORMATIONFORLOCATION6:
OPERSTATES:
D:
DisabledE:
EnabledB:
Busy
ADMINSTATES:
L:
LockedU:
UnlockedE:
EquippedS:
Shutdown
LastTransitionRelated
DeviceStateReasondd/mmhh:
mm:
ssFunction
-------------------------------------------------------------------
DRI000D-LNOREASON02/0108:
20:
03None
DRI010D-UNOREASON02/0108:
25:
31None
DRI020D-LNOREASON02/0107:
40:
38None
DRI030D-LNOREASON02/0107:
40:
54None
DRI040D-UDRICodeLoadFailed02/0107:
31:
01None
DRI050D-LNOREASON02/0107:
31:
06None
在以上例子中,一个DRI出现了DRICodeLoadFailed的状态。
我们将会在下面的章节中讨论出现这种现象的原因。
DRICodeLoadFailed的原因
以下列出了目前我们已知的DRICodeLoadFailed的原因:
1.收发信机到控制器的接口出现问题(这也包括到扩展机柜的接口)。
2.没有从RSS正确接收到CodeLoad成功的消息。
3.对于CTU2,CodeLoadFailure可能是由于CTU2的操作代码没有被正确的存储在(或者不存在)CSFP(PCMCIA)上.那么原因代码是“CodeObjectsMissing”.
4.另外可能的失败原因是CodeLoad操作超时。
如果此类问题出现,应该INS这个收发信机。
我们曾经遇到过一种情况,当一个较大配置的站中的所有收发信机同时启动的时候,其中的一些收发信机可能不能及时完成CodeLoad,从而导致CodeLoad超时。
虽然一些必要的升级减少了这种情况的发生,但偶然情况下仍会发生超时现象,这并不是一个硬件方面的问题。
5.如果收发信机固件(FW)的启动程序(BootLoader)检测到存储器发生错误,也会导致DRICodeLoadFailed.这可以通过在收发信机上查看SWFM纪录来确认。
在本文中,我们会描述如何判定DRICodeLoadFailed问题会是上述五项的哪一项,而且也会针对需要收集哪些数据以及如何解决问题(如果可能的话)给出详细的信息。
5.RCUCodeLoadFailed
介绍
如果系统软件不能正确下载EQDSPs代码到收发信机,原因代码RCUCodeLoadFailed就会出现。
当执行state命令时,就会在屏幕上显示以下结果:
DEVICESTATUSINFORMATIONFORLOCATION6:
OPERSTATES:
D:
DisabledE:
EnabledB:
Busy
ADMINSTATES:
L:
LockedU:
UnlockedE:
EquippedS:
Shutdown
LastTransitionRelated
DeviceStateReasondd/mmhh:
mm:
ssFunction
-------------------------------------------------------------------
DRI000D-LNOREASON02/0108:
20:
03None
DRI010D-UNOREASON02/0108:
25:
31None
DRI020D-LNOREASON02/0107:
40:
38None
DRI030D-LNOREASON02/0107:
40:
54None
DRI040D-URCUCodeLoadFailed02/0107:
31:
01None
DRI050D-LNOREASON02/0107:
31:
06None
在以上例子中,一个DRI出现了RCUCodeLoadFailed的状态。
我们将会在下面的章节中讨论出现这种现象的原因。
RCUCodeLoadFailed的原因
以下列出了目前我们已知的RCUCodeLoadFailed的原因:
1.收发信机到控制器的接口出现问题(这也包括到扩展机柜的接口)。
2.没有从RSS正确接收到CodeLoad成功的消息。
3.对于CTU2,CodeLoadFailure可能是由于CTU2的操作代码没有被正确的存储在(或者不存在)CSFP(PCMCIA)上.那么原因代码是“CodeObjectsMissing”.
4.另外可能的失败原因是CodeLoad操作超时。
如果此类问题出现,应该INS这个收发信机。
我们曾经遇到过一种情况,当一个较大配置的站中的所有收发信机同时启动的时候,其中的一些收发信机可能不能及时完成CodeLoad,从而导致CodeLoad超时。
虽然一些必要的升级减少了这种情况的发生,但偶然情况下仍会发生超时现象,这并不是一个硬件方面的问题。
在本文中,我们会描述如何判定RCUCodeLoadFailed问题会是上述四项的哪一项,而且也会针对需要收集哪些数据以及如何解决问题(如果可能的话)给出详细的信息。
6.CodeLoadFailures问题的调试步骤
下文中,我们将对如何调试CodeLoadFailures问题给出详细的说明。
7.CodeLoadFailures的调试步骤
当一个收发信机出现CodeLoadFailures问题时,应当按照以下的流程图进行分析、调试。
图1.CodeLoadFailure调试流程图
8.应被收集的数据和信息
警告:
在收集数据和信息的过程中,请记录所有的MMI命令以及相应的测试结果,并将所得的数据作为附件粘贴到创建的SR和RMA中。
9.一般信息
请提供以下信息:
-收发信机的状态和配置信息,以及收发信机所在基站的性能信息。
在对基站进行任何改动之前回答下列问题:
-多少个收发信机/扇区受到了影响?
-机柜中的那些插槽受到了影响?
-哪种类型的收发信机受到了影响(CTU,CTU2,两种都是)?
-对于那些受到影响的收发信机,得到OMCINTF_ON_IDLE的统计信息。
-问题是不是在出现下列情况之一后出现的?
o升级
o小区的重新规划
o硬件改变
-在站的MUCF/H2SCMMI-RAM的提示符下运行下列命令:
disp_proc0
disp_proc
state
disp_cell_status
disp_gsm_cell
disp_hop
disp_hopactive
statertf**
disp_neighbor
disp_act_alarm
-对于该基站的所有的DRI/RTF,在MMI-RAM的提示符下运行下列命令:
disp_rtf_chan
disp_eqrtf
disp_eqdrifull
disp_cal_datadri
如果发生CodeLoadFailed问题,有可能上述命令中某些数据无法收集。
请将这些细节信息加入到创建的RMA中。
10.CodeLoadFailed的测试
警告:
在收集数据和信息的过程中,请记录所有的MMI命令以及相应的测试结果。
测试#1:
第一步是确定收发信机的当前状态。
如果该收发信机已经做过re-torque(按照新的扭矩拧紧螺钉),请确认该操作已经被正确的完成。
确认后,执行下面的命令:
Type:
“statedri*”
STATUSINFORMATION:
Device:
DRI020
Administrationstate:
UNLOCKED
Operationalstate:
DISABLED
Reasoncode:
NOREASON
Timeoflasttransition:
FriJan400:
16:
201980
RelatedDevice/Function:
None
Assignedto:
None
ENDOFSTATUSREPORT
管理状态应该是“UNLOCKED”,操作状态应该是“DISABLED”。
原因代码会指出CodeLoadFailure的类型,可能为“CodeLoadFailed”,”DRICodeLoadFailed”或者“RCUCodeLoadFailed”.如果原因代码是“CodeLoadFailed”请执行4.2.2小节的测试2。
如果看到原因代码显示为“CodeLoad”,说明CodeLoad进程还没有完成,请等待并确认CodeLoad进程完成。
测试#2:
一旦原因代码CodeLoadFailed被确认,请输入如下命令:
insdri
(从控制器的MMI口输入以上命令)
以上命令会引起收发信机重新执行CodeLoad进程.请等待并确认CodeLoad被成功完成。
如果仍然发生CodeLoad失败,请执行章节4.2.3的测试3。
在控制器和收发信机上通过输入如下命令来查询SWFM日志文件。
swfmreadall
(在控制器的emon提示符下输入以上命令)
swfmreadall
(在收发信机的emon提示符下输入以上命令)
关于SWFM更多的细节以及通过SWFM解决问题的范例,请参考SRCLARIFY1125067
测试#3:
如果“ins”命令没有解决CodeLoadFailed的问题,请尝试下面的命令:
reset_devicedri
(在控制器的MMI提示符下输入以上命令)
以上命令会引起收发信机重新执行CodeLoad进程.请等待并确认CodeLoad成功。
如果仍然发生CodeLoad失败,请执行章节4.2.4的测试4。
在控制器和收发信机上通过输入如下命令来查询SWFM文件。
swfmreadall
(在控制器的emon提示符下输入以上命令)
swfmreadall
(在收发信机的emon提示符下输入以上命令)
关于SWFM更多的细节以及通过SWFM解决问题的范例,请参考SRCLARIFY1059369
测试#4:
如果执行”ins”和“reset_device”仍然不能解决问题,请lock该收发信机。
Lockdri
(在控制器的MMI提示符下输入以上命令)
然后输入如下命令来设置iir_mods:
iir_mod66201h
(在控制器的emon提示符下输入以上命令)
和
iir_mod670ffffh
(在控制器和收发信机上的emon提示符下输入以上命令,例如:
BTP和RSS)
然后输入如下命令来设置filters
filterstart_newtag0xxxx1d2fh
filterstart_newtag0xxxx1d26h
filterstart_newtag0xxxx160dh
filterstart_newtag0xxx160eh
filterstart_newtag0xxxx0e46h
filterstart_newtag0xxxx0e47h
filterstart_newtag0xxxx0e48h
(在控制器的emon提示符下输入以上命令)
第一个iir_mod设置CADRIIIR,第二个irr_mod设置CAManagementIIR。
最后的命令用于观察DRI侧的HDLC通信,来确认DRI和BTS之间的通信连接。
设置的filters会捕捉在codeload期间出现的各种消息。
输入以下命令来unlock收发信机:
unlockdri
(在控制器的MMI的提示符下输入以上命令)
在CodeLoad完成之后(不管成功还是失败),在控制器和收发信机上记录所有的SMFM信息。
swfmreadall
(在控制器的emon提示符下输