HP Netserver 排错指南.docx

上传人:b****7 文档编号:25765163 上传时间:2023-06-13 格式:DOCX 页数:26 大小:27.52KB
下载 相关 举报
HP Netserver 排错指南.docx_第1页
第1页 / 共26页
HP Netserver 排错指南.docx_第2页
第2页 / 共26页
HP Netserver 排错指南.docx_第3页
第3页 / 共26页
HP Netserver 排错指南.docx_第4页
第4页 / 共26页
HP Netserver 排错指南.docx_第5页
第5页 / 共26页
点击查看更多>>
下载资源
资源描述

HP Netserver 排错指南.docx

《HP Netserver 排错指南.docx》由会员分享,可在线阅读,更多相关《HP Netserver 排错指南.docx(26页珍藏版)》请在冰豆网上搜索。

HP Netserver 排错指南.docx

HPNetserver排错指南

HPNetServer故障排除指南

概述

蜂鸣代码

BIOS版本

内存

MMC

网卡

磁带机

视频

硬盘驱动器概述

公用托架(非热插拔)硬盘

热插拔硬盘

HPMylex

HPMylex规格

HPMylex故障排除

SCSI控制器

SCSI快速参考

检测键错误

NetRAID控制器

NetRAID驱动程序

NetRAID规格

NetWare

NT

SCO

常用术语

概述

灯没有亮,也不显示错误消息

如果服务器不工作(灯没有亮),也不显示错误消息,请检查下列内容:

1.确保将所有线缆(显示器、键盘和鼠标)和电源线均插入其相应的插座。

2.确保交流电源插座在工作。

如果服务器插入一个交换式多插座盒,请确保插座盒上的开关处于开启状态。

3.确保打开服务器(加电灯应该为绿色,同时应打开风扇)。

4.关闭服务器,至少等待20秒,然后重新打开服务器,看故障是否排除。

5.确保所有板正确安装到插槽中。

它们必须牢固地插入其插槽,同时必须牢固连接所有线缆。

6.确保处理器模块牢固地插入其插槽。

7.如果安装新板后您的服务器停止工作,请卸下该板,并打开服务器。

如果您的服务器现在工作,请参阅该板随附的文档,确定如何设置跳线和开关(如果存在)。

8.如果您的服务器仍不工作,请卸下您安装的所有板和选件(不卸下软盘驱动器或硬盘驱动器),并打开服务器。

9.如果您的服务器现在工作,请验证每个适配器板上的跳线和开关。

一次重新安装一个板和选件,以确定是由哪个组件产生问题。

10.如果添加了内存(SIMM),请确保其适当插入。

NetServer关闭且无法再打开

如果服务器关闭,在尝试重新启动前请执行下列操作:

1.首先检查,以确保服务器有电。

将您已知工作的设备插入电源插座中。

2.查看故障排除清单,了解服务器基本完整性。

3.检查服务器通风是否适当。

服务器的顶部和所有侧周围的间距应至少为6英寸才能拥有适当的气流。

4.检查系统规格,并确保环境温度和电压符合指定准则。

5.确保所有风扇均在工作。

如果需要更换有缺陷的后部冷却风扇,请参阅“卸下和更换后部冷却风扇”。

如果电源风扇有缺陷,则需要更换电源;请参阅“卸下和更换电源”。

服务器停止工作(挂起)

如果服务器停止工作,请执行下列操作:

1.在继续之前,请参阅故障排除清单。

2.如果系统挂起,请关闭电源开关,并再次打开,该操作是比使用CtrlAltDel更为完善的复位方式。

3.如果自检报告错误,请检查连接和/或更换出现故障的部件。

4.如果问题依然出现,请卸下,并更换处理器板。

5.一旦发现部件有问题,请通过重新安装出现故障的部件验证它是否有问题。

NetServer随机复位

此NetServer具有一种在工厂启用的自动服务器重新启动(ASR)功能。

ASR功能与HPTopTools一起用于服务器。

在某些情况下,NetServer重新启动

关闭和重新启动服务器的情况包括:

∙影响系统定时器的操作系统问题。

您可选择启用或禁用自动服务器重新启动。

如果选择关闭服务器且使其在20秒后重新启动,应将CyclePoweronASR选项设置为启用。

在NetServer上安装网络操作系统时,选择此选项。

阅读有关自动服务器重新启动的影响,请参阅HPTopToolsforServers。

系统不启动(引导)

注:

自检错误消息反映哪些模块有缺陷,且应该更换。

请遵循屏幕上显示的指导操作。

1.在继续之前,查看故障排除清单。

2.如果出现内存问题:

A.关闭系统,然后再打开,因为它是比CtrlAltDel更为完善的复位方式。

B.如果自检发现问题,请检查错误消息并按照屏幕上的指导校正问题。

3.检查所有SIMM安装是否正确:

A.检查SIMM是否符合SIMM准则。

B.将SIMM重新插入其插槽。

4.对于内存冲突(两个板或驱动程序正尝试使用相同的内存地址),请更改适配器板使用的地址。

5.一旦发现部件有问题,即应通过重新安装该部件,并重新产生错误来验证该部件有问题。

返回页首

蜂鸣代码

∙确保没有控制台开关

∙拔下服务器插头2分钟

∙检查蜂鸣代码错误消息

∙重新插入内存

∙重新插入处理器

∙重新插入VRM

∙重新插入电源

∙重新插入鼠标、键盘和视频线缆

∙卸下所有卡

∙转至基本内存

∙更换组件

∙在不同的电源上尝试服务器

返回页首

BIOS版本

∙只支持最新BIOS版本

∙在升级之前需要最新BIOS版本

∙在调遣部件之前升级BIOS

∙解决严重问题时更新了BIOS版本。

 确保该版本为最新版本。

返回页首

内存

未计数

∙验证其HPRam

∙验证系统板上的DIMM灯是否亮着

∙检查HW事件日志

∙闪存NVRam

∙闪存BIOS

∙尝试不同的内存插槽

单位ECC错误

∙检查硬件事件日志以确定哪个DIMM有问题

∙重新启动服务器清除错误

∙监视事件日志,看事件是否继续

∙更换DIMM

多位错误

∙检查硬件事件日志,以确定哪个DIMM有问题

∙更换DIMM

∙如果服务器有内存卡,请确保将其重新插入

在操作系统中看不到

∙确定自检时的内存总量

∙确保其惠普内存

∙闪存NVRam

∙闪存BIOS

∙与操作系统供应商一起检查

返回页首

MMC

错误[与0080,0090相同]

∙参考KRS文档BPN03277

∙检查是否没有控制台开关

∙断电2分钟

∙未连接串行设备

∙确保电源清洁

∙可从UPS中卸下,也可在UPS上尝试

∙尝试闪存BIOS

∙如果安装了TTRCC,请验证是否安装了固件v2.0或更新版本

返回页首

网卡

操作系统中未加载卡

∙使用最新惠普驱动程序加载

∙重新插入卡

∙尝试不同的插槽

∙尝试主要总线

∙确保未加载其他NIC

∙尝试通过MS-DOS引导在NIC支持磁盘上运行setup.exe。

不能登录服务器

∙验证Link灯

∙尝试对服务器使用ping命令,然后使用pingout

∙检查,以确保加载了最新惠普驱动程序

∙客户应检查Wins、DNS、网关和IP地址设置

∙验证HPSet中的设置(驱动程序、速度和流量)

返回页首

磁带机

不能完成备份

能够找到驱动器并开始备份

∙验证加载了最新驱动程序

∙确保将控制器设置为默认值

∙闪存或重新闪存系统上的当前BIOS

∙尝试在NetWare中使用tagdisable命令

∙建议与备份软件的供应商联系

返回页首

视频

服务器上无视频

∙确保服务器不在控制台开关上

∙拔下服务器插头2分钟

∙重新插入内存、处理器和VRM

∙尝试不同的显示器

∙卸下所有的卡,转至基本内存

∙卸下UPS(如果有)

∙尝试卸下所有硬盘驱动器

∙加电时系统是否发出蜂鸣声?

∙在LH4上确保两个插头均已重新插入

返回页首

硬盘驱动器概述

故障排除

∙始终确保客户具有良好的备份

–如果没有,请在NOS启动后进行备份。

∙客户应具有最新ERD(紧急维修磁盘)。

∙您应写下配置

–不要依赖了解该配置的客户。

相同的驱动器多次出现故障

*不要强制驱动器处于联机状态*

∙检查"PhysicalDrive"-"Properties"-"ErrorCount"

∙如果任何种类的错误超过50个,请更换驱动器

∙确保系统BIOS为最新版本

∙检查线缆配置

∙检查驱动器是否正确

∙不要更新性能降低的驱动器或控制器上的固件

∙检查驱动器的固件

∙检查控制器的固件

∙检查后面的固件

∙确保未加载SNMPSCSIDetailAgent或应用补丁程序

自检时看不到

∙请参阅公用托架(非热插拔)硬盘信息

∙请参阅热插拔硬盘信息

线缆

∙重新插入线缆

∙检查线缆是否损坏

∙检查线缆终结是否正确

∙确保驱动器未连接到同一SCSI通道上的内部和外部

–这会损坏内置终结

–也会导致SCSIID设置重复

∙尝试相同类型的不同线缆

∙尝试不同的连接器(如果可能)

∙检查线缆芯是否弯曲

控制器

∙确保自检期间控制器在显示标题

∙将控制器复位为默认值

∙如果是磁盘阵列控制器

–请参阅热插拔硬盘故障排除提示

–请参阅NetRAID故障排除提示

返回页首

公用托架(非热插拔)硬盘

自检时看不到

∙确保不存在SCSIid冲突

–切记要同时检查内部和

 外部是否存在驱动器

–如果在LH3或LH4上,请检查SCSI-B的两个线缆上是否存在驱动器

∙确保所有驱动器运转

–如果有一个未在运行,请将其卸下

–查看、倾听并感觉驱动器的活动

–监视驱动器灯看驱动器是否在运转

∙检查驱动器上的电源灯

∙断开所有驱动器,一次一个

–查看是否存在重复的SCSIid

控制器

∙确保自检期间控制器在显示标题

∙将控制器复位为默认值

公用托架

∙验证是否未终结设备

–所有终结均是由线缆上的有源终结完成

–有源终结器必须位于内部线缆上

∙查看是否存在重复的SCSIid

–查看同一SCSI链上是否存在其他设备

–通常,控制器都使用SCSIid#7(不用于设备)

返回页首

热插拔硬盘

自检时看不到

∙如果驱动器不在标准SCSI上

–自检时不会列出硬盘本身

–进入NetRAID实用程序是查看驱动器的唯一方式

∙确保不存在SCSIid冲突

–切记要同时检查内部和

 外部是否存在驱动器

–检查较旧的机笼是否没有相同的id设置

–如果在LH3或LH4上,请查看驱动器是否在SCSI-B的两个线缆上

∙确保所有驱动器运转

–如果有一个未在运行,请将其卸下

–查看、倾听并感觉驱动器的活动

–监视驱动器灯看其是否在运转

∙检查驱动器上的电源灯

∙断开所有驱动器,一次一个

–查看是否存在重复的SCSIid

热交换硬盘笼

∙确保第二个机笼中没有使用相同的SCSIid的驱动器。

∙查看同一SCSI链上是否存在其他设备

∙如果存在NetRAID,不要串级链接到其他设备

∙线缆是否在正确的连接器上(或在端口中或端口外)

返回页首

HPMylex

提示与诀窍

∙不可用

∙词汇表

∙驱动程序和卡规格

∙故障排除

已知问题

∙最大逻辑驱动器大小为32Gb

∙更新BIOS不更新固件

∙如果EISADual拥有固件<1.58,请首先更新BIOS。

∙如果闪存一个单通道卡,而双通道的BIOS被更新,该卡会被“烤热”,务必更换。

HPDAMON.NLM-NovellNetWare

∙要加载:

- 从服务器控制台

- 键入:

LOADHPDAMON.NLM

∙命令行选项:

可指定下列选项:

1. /LF

 其中,是监视程序记录所有事件的

 文件的所需路径-文件名。

 默认日志文件是"SYS:

\PUBLIC\HPDA.LOG"

2. /GR

 其中,是广播通知向其

 发送的NetWareGROUP。

 默认GROUP是"EVERYONE"。

3. /MR

 启用手动重建。

 在默认情况下,监视程序将尝试

 自动重建出现故障的磁盘,除非指定了/MR。

EX:

LOADHPDAMON/LFVOL1:

\DATA\HPDA.LOG/MR

∙驱动器信息:

 监视程序定期查询连接到服务器的所有惠普磁盘阵列的状态。

根据发生的事件的性质,监视程序跟踪的事件可以分为两类:

1. 信息性(INFO)。

INFO事件未报告

   问题;而是报告已知状态。

   INFO事件的实例是重建

   操作结束。

2.问题(TRAP)。

TRAP事件因

   出现问题而生。

TRAP的实例是硬盘

   出现故障。

- INFO和TRAP事件均发送给:

  服务器控制台

  日志文件指定的(或默认)

- TRAP事件也发送给:

  NetWareGROUP指定的(或默认)

  NetWareSNMPAgent(如果安装了NSA/OpenView)

注:

建议始终加载监视程序!

返回页首

HPMylex规格

提示与诀窍

∙不可用

∙概述信息

∙词汇表

∙故障排除

规格

∙CPUInteli960RISC32位微处理器

∙高速缓存大小4MBSIMM(仅用惠普指定的部件更换)

- 单通道EISADAC具有4x1MbSimm

- 双通道EISA和PCIDAC具有1x4MbSimm

∙写策略:

 连续写入或回写

∙写策略:

 始终启用

∙SCSI总线类型:

- PCIDAC:

 快速宽式

- EISADAC:

快速

∙通道个数:

- 单通道EISADAC-1

- 双通道EISA和PCIDAC-2

∙收发器类型–单端

连接器类型

内置

外置

PCIDAC

68针(1通道)

68针,超高(1通道)

EISADAC

50针(1/通道)

50针,高(仅通道0)

RAID级别

RAID

也称为

硬盘/通道

0

“striping”

最少2个

1

“mirroring”

仅2个驱动器

5

“stripingw/distributedparity”

最少3个

6

“stripingw/blocklevelmirroring”

最少3个

BIOS和固件

BIOS

固件

1.19H

2.14

1.19H

1.99

PCI

1.29

2.47

∙每个DAC的阵列:

 2(每个SCSI通道1个)

∙逻辑驱动器:

 每个DAC最多8个

∙最大逻辑大小:

 32GB

∙最大物理驱动器大小:

 对9Gb的驱动器进行最大测试

∙热备:

 每个通道支持1个

∙联机容量扩展:

 紧急容量仅支持1个硬盘(不集成到RAID冗余模式中)

-不是RAID保护的一部分

返回页首

SCSI控制器

看不到卡

∙重新插入卡

∙尝试不同的插槽

∙闪存NVRam

∙闪存BIOS

∙拉所有硬盘驱动器线缆

∙转至“基本”配置

返回页首

SCSI快速参考

有帮助的SCSI链接

∙快速参考指南

∙连接器类型

∙SCSI标准

返回页首

检测键错误

SCSI设备还提供检测键错误。

报告这些错误是为了响应发送给驱动器的命令。

这些错误不一定表明出现硬件故障。

检测键代码因制造商而异,解码整个错误不是我们的责任,但是,有几个基本代码可帮助确定需要对哪个区域进行进一步调查。

代码中的第一位表示下列检测键之一

值(十六进制)描述

0.

无检测:

表明没有报告指定逻辑单元的特定检测键信息。

1.

已恢复错误:

表示最后一条命令成功完成,目标执行了一些恢复操作。

通过检查其他检测字节和信息字节可确定详细信息。

2.

未就绪:

表示使用的逻辑单元不可访问

3.

介质错误:

表示可能因介质缺陷导致的未恢复的错误或记录数据错误导致命令终止。

4.

硬件错误:

表示在执行命令或自检期间目标检测到不可恢复的硬件故障(例如,控制器故障、设备故障、奇偶校验错误等等)。

5.

非法请求:

表示命令描述符块中的非法参数或其他参数作为一些命令的数据来应用。

6.

单元注意:

表示目标已复位或已经加电。

7.

数据保护:

表示在防止进行此操作的块上尝试了读取或写入介质的命令。

读取或写入操作未执行。

B.

异常终止命令:

表示目标因启动者请求/操作而异常终止命令。

C.

相等:

表示SearchData命令满足相等比较。

D.

错误比较:

表示缓冲区中的数据在READBUFFER和WRITEBUFFER命令之间损坏,或者在VERIFY期间出现MISCOMPARE(启用BYTCK)。

第二个十六进制位表示其他检测信息。

值(十六进制)描述

00.

没有其他检测信息

01.

没有索引/扇区信号

02.

没有搜索完成

03.

写故障

04.

驱动器未就绪

05.

逻辑单元不响应选择

08.

逻辑单元通讯故障

09.

跟踪下列内容时伺服丢失

0C.

通过自动重新分配恢复了写错误

10.

IDCRC或ECC错误

11.

数据块的不可恢复的数据错误

12.

未找到ID字段的地址掩码

14.

未找到记录

15.

搜索定位错误

16.

数据同步掩码错误

17.

通过目标读取重试恢复了数据读取(未使用ECC)

18.

通过目标的ECC校正恢复了数据读取(未通过重试)

19.

缺陷列表错误

1A.

参数超出

1B.

同步传输错误

1C.

找不到缺陷列表

1D.

比较错误

20.

无效命令操作代码

21.

非法逻辑块地址。

24.

CDB中的非法字段

25.

无效LUN

26.

参数列表中的无效字段

27.

写保护

28.

根据总线设备请求加电或复位

2A.

模式选择参数已更改

2C.

命令顺序错误

2F.

命令被另一启动者清除

31.

介质格式损坏

32.

没有缺陷备件位置

33.

备用操作失败

3D.

标识消息中的无效位

3F.

目标运行条件发生更改

40.

RAM故障

41.

数据路径诊断程序故障

42.

加电诊断程序故障

43.

消息拒绝错误

44.

内部控制器错误

45.

选择/重新选择失败

46.

软复位未成功

47.

SCSI接口奇偶校验错误

48.

启动者检测到错误

49.

不适当/非法消息

4E.

尝试交迭命令

5C.

RPL状态更改

80.

一般固件错误限定符

返回页首

NetRAID控制器

故障排除

∙始终确保客户具有良好的备份

–如果没有,请在NOS启动后进行备份。

∙客户应具有最新ERD(紧急维修磁盘)。

∙写下配置

–不要依赖了解该配置的客户。

也可参阅-NetRAID驱动器相关故障排除

自检期间控制器未显示标题

∙重新插入卡

∙尝试不同的插槽

–检查服务器上的插槽是否是支持/建议的插槽

–是否真的拥有NetRAID控制器?

∙控制器是否超过一个?

-检查资源冲突

–卸下其他控制器

 +看您查看的是否是正确的控制器

 +有时用户会混淆他们查看的是哪个控制器

∙清除NVRam

–可能需要保留在清除位置直到问题解决

∙闪存系统BIOS

-NetRAIDBIOS不闪存,未检测到卡

∙检查硬件事件日志

–从浏览器

–或控制面板

∙万一出现资源冲突,请卸下所有其他卡

∙重新插入高速缓存芯片

∙断开硬盘驱动器线缆

初始化失败

*步骤后尝试初始化*

∙检查NetRAID上的固件看是否为最新版本

∙闪存NetRAID卡上的固件

∙尝试确定驱动器故障

–连接到SCSI控制器

–是否有驱动器显示标题的时间多于常规时间?

-是否有驱动器因其他驱动器异常而亮?

∙在Raid为0时初始化一个驱动器

–确保驱动器上没有数据

∙检查并重新插入所有线缆

–检查是否存在弯曲的线芯

–检查线缆配置是否正确

–不能串级链接驱动器机笼中的设备

∙尝试不同的通道

∙重新插入高速缓存模块

∙更换驱动器

硬盘上的配置信息和NVRAM中的不匹配

∙通过Cntl–M转至配置菜单下的“查看、添加或删除”,

-选择磁盘,然后不必保存即退出

–选择NVRam

–与客户一起确定哪个配置最正确

–保存该配置

∙您应该选择出现故障的驱动器的配置,然后尝试重建驱动器

∙尝试拔下服务器的插头2分钟

–可能需要进行此操作2次

∙闪存NetRAID卡上的NVRam

∙如果在NVRam和磁盘之间没有选件

–尝试第二次重新引导

–仔细记录消息

 +NVRam不匹配                或

 +无法解析的配置

–首先尝试拉出所有驱动器并清除配置

∙然后,必须重新配置,而不必进行初始化

无法解析的不匹配配置

∙通常在一个驱动器具有与其余驱动器不同的配置时出现

∙尝试拉出一个驱动器并重新引导。

-消息更改为NVRam不匹配时,您就能够知道是哪个驱动器不同。

-驱动器出现故障

–重建为相同的驱动器

∙清除并重新配置所有驱动器,而不必初始化

NOS中看不到逻辑驱动器/无法引导

∙确保至少一个逻辑驱动器通过BIOS处理(请参阅自检期间显示的此消息)

∙确保将最新驱动程序加载到正确的位置

∙检查事件日志了解引导错误

∙从MS-DOS6.22软盘运行Fdisk。

 验证分区存在、分区正确且有一个正确的分区处于活动状态

∙如果是外部–检查连接、终结和ID设置

返回页首

NetRAID驱动程序

故障排除

∙始终确保客户具有良好的备份

–如果没有,请在NOS启动后进行备份。

∙客户应具有最新ERD(紧急维修磁盘)。

∙写下配置

–不要依赖了解该配置的客户。

驱动器一般故障排除

∙检查驱动器属性看是否存在错误

–如果任何种类的错误超过50个,请更换驱动器

–如果TopTools"PredictiveFailure"建议更换驱动器,则自动更换驱动器

∙检查控制器上的固件

-NetRAIDAsst-"Adapter"-"Properties"

–只更新性能未降低的阵列上的f/w

∙检查驱动器的固件

∙不要更新性能降低的阵列中的任何固件

∙确保未加载SNMPSCSIDe

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 求职职场 > 自我管理与提升

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1