常见DP问题中的trouble shooting.docx
《常见DP问题中的trouble shooting.docx》由会员分享,可在线阅读,更多相关《常见DP问题中的trouble shooting.docx(32页珍藏版)》请在冰豆网上搜索。
常见DP问题中的troubleshooting
关于DP中的troubleshooting
(一)备份被锁,无法进行
(二)磁带位置与IDB记录不一致
(三)卡带处理
(四)磁带出现fair状态
(五)Tape显示NOHW
(六)Deviceislocked
(七)ESL322efirmwareupdate
(八)Drive超时问题的处理
(九)DP中常用命令
(十)IDBExport&Import
(十一)TableSpace空间不足的相关问题
(十二)MediaPool无法打开
(十三)Driveabort无法继续备份
(一)备份被锁,无法进行
问题现象:
启动备份时产生如下错误:
问题判定:
产生此warning的原因是某个进程退出时没有正常退出而产生一个锁定文件,所以启动备份时不能正常启动。
解决办法:
删除该锁定文件后重新启动备份。
Command:
rm/var/opt/ignite/locked_filename
返回目录
(二)磁带位置与IDB记录不一致
问题现象:
在copy过程中因备份有问题,为了不影响业务重启了DP,重启成功后再重新启动该未完成的COPY任务时,备份中产生如下warning:
问题判定:
磁带的物理位置与IDB中所记录的不一致。
问题解决:
进行barcodescan后重新备份。
返回目录
(三)卡带处理
问题现象:
[Major]From:
BMA@bjdcbk01"HP:
Ultrium1-SCSI_1"Time:
9/27/069:
40:
22AM
[90:
51]/dev/rmt/19mn
Cannotwritetodevice([5]I/Oerror)
[Critical]From:
VBDA@bjmaxics"C:
"Time:
9/27/069:
58:
45AM
ReceivedABORTrequestfromSM=>aborting.
[Critical]From:
VBDA@bjmaxics"C:
"Time:
9/27/069:
58:
45AM
ConnectiontoMediaAgentbroken=>aborting.
[Normal]From:
VBDA@bjmaxics"C:
"Time:
9/27/069:
58:
45AM
ABORTEDDiskAgentforbjmaxics:
/C"C:
".
[Major]From:
BMA@bjdcbk01"HP:
Ultrium1-SCSI_1"Time:
9/27/069:
40:
26AM
[90:
159]ApparentlySCSIUnitAttention.
[Major]From:
BMA@bjdcbk01"HP:
Ultrium1-SCSI_1"Time:
9/27/069:
40:
29AM
[90:
162]Skippingwriteoffilemark.(ApparentlySCSIUnitAttention).
[Major]From:
BMA@bjdcbk01"HP:
Ultrium1-SCSI_1"Time:
9/27/069:
40:
29AM
[90:
162]Skippingwriteoffilemark.(ApparentlySCSIUnitAttention).
[Major]From:
BMA@bjdcbk01"HP:
Ultrium1-SCSI_1"Time:
9/27/069:
40:
30AM
[90:
135]Cannotejectmedium.(Trailingfilemark(s)couldnotbewritten.)
[Major]From:
BMA@bjdcbk01"HP:
Ultrium1-SCSI_1"Time:
9/27/069:
40:
30AM
[90:
64]By:
UMA@bjdcbk01@/dev/rac/c20t0d6
Cannotunloadexchangermedium(Detailsunknown.)
问题判定:
磁带卡在drive里,无法退出。
问题解决:
1.用命令将drive里的磁带强行退出
-到DP里看带子卡在哪个drive(如10-180-lto的SCSI_1)。
-再到那个drive里,看看他的物理路径(SDSIAddress)。
如:
bjdcbk01/dev/rmt/19mn
-然后到secureCRT里进入bjdcbk01,进入那个带库(omni_lto1)。
-statd,看看哪个磁带在那个drive里卡着呢(如s31)
-到bjdcbk01,#mt-f/dev/rmt/19mnoffline把磁带用命令导出
-然后在进入omni_lto1,moved1s31.把磁带放回原来的槽位。
-把磁带verity一下看看有没有损坏。
Ok!
2.如果1步未能成功,可以利用机械手将磁带退出
-找出卡带的drive
-查看机械手的设备文件(ioscan–fun查找/dev/rac/c*t*d*的地址)
-mc–p/dev/rac/c*t*d*-sDRIVE–dSLOT。
返回目录
(四)磁带出现fair状态
问题现象:
磁带显示为黄色,并在后面的状态栏中显示为fair。
问题判定:
磁带的默认使用时间为36个月,或写操作250次以上,超过此期限后,磁带将显示为fair状态,并不能再进行写操作。
问题解决:
清洗带库;
确认磁带是否超出使用期限:
✓Devices&Media->pool名称->properties->Condition->validforandMaximumoverwrites
注:
Validfor和maximumoverwrites这两个条件任意一个已超出就会出现问题现象。
✓Devices&Media->Devices->slots->选择tape->properties->Info->MediumCreatedtime
注:
此时间可以与上步中察看的值相结合来判断磁带是否超出使用期限。
如果超出使用期限,更换磁带;如果未超出使用期限,且备份的数据已过期,可以将磁带重新格式化后继续使用。
注:
如果磁带未超出使用期限,且数据未过期,建议不要格式化磁
带,因为此时的磁带只是不能进行写操作,读操作仍可以正常
进行。
返回目录
(五)Tape显示NOHW
问题现象:
1,备份任务启动后,无法继续进行,报出如下错误信息:
2,同时在相应的client主机上也会报出如下EMS错误:
Apr2511:
26:
44bjdcdbEMS[7593]:
------EMSEventNotification------Value:
"CRITICAL(5)"forResource:
"/adapters/events/TL_adapter/2_0_11_1_0"(Threshold:
>="3")Executethefollowingcommandtoobtaineventdetails:
/opt/resmon/bin/resdata–R497614871–r/adapters/events/TL_adapter
/2_0_11_1_0-n497614849–a
3,通过EMS报错信息的描述,可以判断为主机与备份介质之间的链路存在问题
4,在备份服务器上执行ioscan-fnCtape命令,来查看备份媒体的运行状态
注:
如果此时只有某个drive出现NOHW状态,则可能为此drive存在问题;
而此次出现问题时,我们发现同时有4个drive出现异常状态,而且这4个drive连在同一个IFCCard上,所以经分析判断问题可能出现在IFCCard上。
问题判定:
1,因同时4个drive显示NOHW状态,而4个drive同时出问题的几率很小,所以可以判断为连接drive的IFCCard出现问题;
2,查看IFCCard的状态,从状态灯上查看,IFCCard上连接交换机的两个FCPort灯都不亮,检查交换机的相应端口,灯亦不亮;
3,登录交换机查看交换机状态,交换机以及相应端口状态正常,可以派出交换机出现问题,同时可判定IFCCard存在问题;
4,通过串口登录IFCCard,发现FCPort0&1状态均为down;进一步查看FCPort的配置,发现discoverymode是manual,而且FCPortSpeed为4G(而交换机端口均为2G)与交换机端口不符;
5,通过以上,可以判定问题出现于IFCCard的FCPort的配置中。
问题解决:
通过串口连接IFC7:
HPStorageWorkse2400-FC4GInterfaceController
5.9.28P09K7ZAD569-60002_PR507082F4
04/29/200801:
58:
33
1)PerformConfiguration
2)SystemUtilities
3)DisplayTraceandAssertionHistory
4)Reboot
5)DownloadaNewRevisionofTheFirmware
6)HpMenu
Command>1(Select1)
ConfigurationMenu
5.9.28P09K7ZAD569-60002_PR507082F4
04/29/200802:
00:
10
1)BaudRateConfiguration
2)EthernetConfiguration
3)FibreChannelConfiguration
4)DeviceMapping
5)TraceandEventSettingsConfiguration
6)Real-TimeClockConfiguration
7)ActiveFabricConfiguration
8)HostStatisticsConfiguration
A)SaveConfiguration
B)RestoreLastSavedConfiguration
C)ResettoFactoryDefaults
X)Returntomainmenu
Command>3(Select3)
FibreChannelConfigurationMenu
5.9.28P09K7ZAD569-60002_PR507082F4
04/29/200802:
00:
40
CurrentFibreChannelConfiguration-FCPort0:
FCLinkStatus:
UP/FABRIC
NodeName:
10:
00:
00:
E0:
02:
03:
BB:
56
PortName:
10:
00:
00:
E0