1、DellPowerEdge服务器硬件故障排除手册范本Dell PowerEdge服务器硬件故障排除手册本文档介绍了物理、固件和软件接口部件,它们提供了系统的必备功能,确保系统能够正常 运行。系统前面板和背面板上的物理连接器提供了方便的连接和系统扩展功能。系统固件、 应用程序和操作系统监测系统和组件的状态, 并在出现问题时发出警报。以下指示灯和信息均可以报告系统情况: 前面板或背面板指示灯系统信息警告信息诊断信息警报信息本节介绍了各种类型的信息, 列出了可能的原因,并提供了解决信息所指示问题的步骤。 本节说明了系统指示灯和部件。您可能需要的其它信息皿目警告:产品信息指南提供了重要的安全与管制信息
2、。保修信息可能包括在本说明文 件中,也可能作为单独的说明文件提供。机架解决方案附带的机架安装指南或机架安装说明介绍了如何将系统安装到机架中。使用入门指南简要介绍了系统功能、如何设置系统以及技术规格。 系统附带的CD提供了用于配置和管理系统的说明文件和工具。 系统管理软件说明文件介绍了软件的功能、要求、安装和基本操作。 操作系统说明文件介绍了如何安装(如果有必要) 、配置和使用操作系统软件。单独购买的任何组件所附带的说明文件提供了有关配置和安装这些选件的信息。 系统有时会附带更新,用于介绍对系统、软件和 /或说明文件的更改。匕注:请经常查看support.dell. 是否有更新,并首先阅读这些更
3、新,因为这些更新通常会替代其它说明文件中的信息。系统可能附带版本注释或自述文件, 提供系统或说明文件的最新更新, 或者专供有经验的用户或技术人员使用的高级技术参考资料。在启动过程中访问系统部件表1-1介绍了在系统启动过程中访问系统部件可能需要输入的击键。 如果输入击键之前已开始载入操作系统,请让系统完成引导过程,然后重新启动系统并再试一次。表1-1.用于访问系统功能的击键击键说明进入系统设置程序。请参阅使用系统设置程序。打开公用程序分区,使您可以运行系统诊断程序。请参阅运行系统诊断程序。进入引导菜单。进入PXE引导。进入SAS配置公用程序。有关详情,请参阅 SAS适配器用户指南。进入底板管理控
4、制器 (BMC)管理公用程序,从中可以访问系统事件日志(SEL)。有关设置和使用 BMC的详细信息,请参阅BMC用户指南。进入RAID配置公用程序,从中可以配置一个可选的 RAID卡。有关详情,请参阅RAID卡的说明文件。仅当通过系统设置程序启用了 PXE支持时才显示选项(请参阅使用系统设置程序)。此击键使您可以为 PXE引导配置NIC设置。有关详情,请参阅集成 NIC的说明文件。如果具有可选的 Dell远程辅助卡(DRAC),此击键使您可以访问选定的 DRAC配置设置。有关设置和使用 DRAC的详细信息,请参阅DRAC用户指南。前面板部件和指示灯表1-1显示了位于系统前面板上的控件、指示灯、
5、连接器和驱动器。 图1-1. 前面板部件和指示灯1电源按钮/ 指示灯。系统接通电源时,通电指示灯会亮起。电源按钮控制向系统的直流电源设备输出。注:如果使用电源按钮关闭系统电源,并且系统运行的是 ACPI兼容操作系统,则系统可以在电源关闭之前从容关闭。如果系统运行的不是 ACPI兼容操作系统,则按下电源按钮将立即关闭电源。2NMI按钮。使用特定操作系统时,用于排除软件和设备驱动程序错误。可以使用回形针 末端按下此按钮。只有当合格的支持人员或操作系统说明文件指示可以使用此按钮时才能使 用它。3系统识别 按钮。前面板和背面板上的识别按钮可用于查找机架中的特定系统。当按下其中一 个按钮时,系统前面板上
6、的 LCD面板和后面板上的蓝色系统状态指示灯将闪烁,直至再次按下其中一个按钮。4LCD面板。用于提供系统ID、状态信息和系统错误信息。系统正常运行期间 LCD将亮起。系统管理软件和位于系统前后两面的识别 按钮均可以使LCD呈蓝色闪烁,以识别特定的系统。系统需要注意时,LCD将呈琥珀色亮起,并在 LCD面板上显示错误代码,后跟描述性文本。如果系统已连接至交流电源并且检测到错误,则无论是否已打开系统电源,LCD都将呈琥珀色亮起。5USB连接器。将USB 2.0兼容设备连接至系统。16视频连接器。将显示器连接至系统。7硬盘驱动器。八个2.5央寸热拔插或五个 3.5央寸热拔插。8光盘驱动 器。一个细长
7、型光盘驱动器。硬盘驱动器指示灯代码硬盘驱动器托盘带有两个指示灯 一驱动器活动指示灯和驱动器状态指示灯。图1-2. 硬盘驱动器指示灯1绿色和琥珀色驱动器状态指示灯2绿色驱动器活动指示灯活动LED指示硬盘驱动器和存储控制器之间的命令活动。状态LED是一个双色(绿色/琥珀色)LED,用于指示插槽中驱动器的状态。 LED的颜色和闪烁速率指示驱动器的状态,如表 1-2中所示。表1-2. 硬盘驱动器指示灯显示方式绿色指示 灯琥珀色指 示灯驱动器/插槽状态插槽闲置不亮不亮插槽闲置,存在不支持的驱动器,驱动器已停止运转 以供卸下(准备卸下)或者已插入新驱动器但 RAID控 制器尚未更新状态。驱动器联机亮起不亮
8、驱动器是联机、就绪、热备用或外部驱动器。识别驱动器(准备拆卸)亮 起250 mS不 亮250 mS不亮由于用户请求(请求识别驱动器或准备拆卸),正在识 别插槽。正在重建驱动 器亮 起400 mS不 亮100 mS不亮正在向驱动器写入数据,以使虚拟磁盘产生冗余。驱动器故障不亮亮 起150 mS不 亮150 mS由于在驱动器上检测到不可恢复的故障(在完成错误 处理后),因此RAID控制器再也无法访问或控制 (读取或与入)驱动器。预测到故障(SMART)亮 起500 mS不 亮500 mS不 亮1000 S不 亮500 mS亮 起500 mS驱动器报告了预测性的故障事件。重建终止亮 起3000 mS
9、 不 亮9000 mS不 亮6000 mS 亮 起3000 mS 不 亮3000 mS驱动器已在用户请求(准备执仃拆除操作)下停止运 转,或者用户操作或驱动器故障之外的其它原因使驱 动器上的重建操作终止。在RAID配置中,通过驱动器状态指示灯的亮起可以指示驱动器的状态。Q 注:对于非 RAID配置,只有驱动器活动指示灯处于活动状态。驱动器状态指示灯不亮。表1-2列出了 RAID硬盘驱动器的驱动器指示灯显示方式。 系统中发生的驱动器事件不同,显示方式也不同。例如, 硬盘驱动器出现故障时, 显示方式为“驱动器故障”。选择要卸下 的驱动器后,显示方式为“准备卸下驱动器”, 然后为“准备插入或卸下驱动
10、器”。 安装备用驱动器后,显示方式为“准备运行驱动器”,然后为“驱动器联机”。连接外部设备将外部设备连接至系统时,请遵循以下原则:大多数设备必须连接至特定连接器并且必须安装设备驱动程序,才能正常运行。 (您的操作系统软件或设备本身通常会附带设备驱动程序。 )有关具体的安装和配置说明,请参阅设备附带的说明文件。请始终在系统和设备电源处于关闭状态时连接外部设备。 然后,先打开所有外部设备,再打开系统(除非设备的说明文件另有说明) 。有关各个连接器的信息,请参阅跳线和连接器。有关启用、禁用以及配置 I/O 端口和连接器的信息,请参阅使用系统设置程序。背面板部件和指示灯图1-3显示了位于系统背面板上的
11、控件、指示灯和连接器。图1-3. 背面板部件和指示灯大多数设备必须连接至特定连接器并且必须安装设备驱动程序,才能正常运行。 (您的操作 系统软件或设备本身通常会附带设备驱动程序。 )有关具体的安装和配置说明,请参阅设备 附带的说明文件。请始终在系统和设备电源处于关闭状态时连接外部设备。 然后,先打开所有外部设备,再打开系统(除非设备的说明文件另有说明) 。I/O端口和连接有关各个连接器的信息,请参阅跳线和连接器。有关启用、禁用以及配置 器的信息,请参阅使用系统设置程序。电源指示灯代码前面板上的电源按钮控制输入系统电源设备的电源。 打开系统电源时,电源指示灯将呈绿色亮起。冗余电源设备上的指示灯显
12、示了是否存在电源或者是否出现了电源故障(请参见图 1-4 )。表1-3列出了电源设备指示灯代码。图1-4. 冗余电源设备指示灯1电源设备状态2电源设备故障3交流电源状态表1-3. 冗余电源设备指示灯指示灯功能电源设备状态绿色表示电源设备正在运行。电源设备故障琥珀色表示电源设备出现问题。交流电源状态绿色表示有效的交流电源已连接至电源设备。NIC指示1-5。每个NIC有两个指示灯,用于提供有关网络活动和链路状态的信息。请参见图 表 1-4列出了 NIC指示灯。图1-5. NIC指示灯T |1链路指示灯(绿色)2活动指示灯(琥珀色)表1-4. NIC指示指示灯发光方式含义链路和活动指示灯都不亮。NI
13、C未连接至网络。链路指示灯亮起。NIC已连接至网络上的有效链路伙伴。活动指示灯呈闪烁状态。正在传输网络数据。LCD状态信息系统的控制面板LCD可以提供状态信息,以表明系统何时运行正常或何时需要注意。LCD呈蓝色亮起表示系统运行正常, 呈琥珀色亮起表示出现错误。 LCD滚动显示信息,包括后跟描述性文本的状态代码。表 1-5列出了可能出现的 LCD状态信息和导致生成每条信息的可能原因。LCD信息是指系统事件日志 (SEL)中记录的事件。有关SEL和配置系统管 理设置的信息,请参阅系统管理软件说明文件。口目 警告:只有经过培训的维修技术人员才能卸下主机盖并拆装任何部组件。有关安全预防措施、拆装计算机
14、部组件和防止静电损害的完整信息,请参阅产品信息指南 。Q 注:如果系统无法引导,按下“系统 ID”按钮至少五秒钟,直至 LCD上显示错误代码。记下该代码,然后请参阅获得帮助。表1-5. LCD状态信息代码检测原因更正措施N/ASYSTEM NAME由62个字符组成的字符 串,可由用户在系统设置程 序中定义。在以下情况下显示 SYSTEMNAME打开系统电源。关闭系统电源并显示活动POST错误。此信息仅供参考。可以在系统设置程序中更改系统 ID和系统名称。请参阅使用系统设置程序。E1000FAILSAFE,CALL SUPPORT请参阅获得帮助。1E1114Temp Ambie nt系统周围环境
15、温度超出允 许围。请参阅排除系统冷却故障。E1116Temp Memory存已超过允许温度,系统已 将其禁用以防止损坏组件。请参阅排除系统冷却故障。E12 nnxx PwrGd指定的稳压器出现故障。请参阅获得帮助。E1210CMOS Batt缺少CMOS电池,或电压超 出允许围。请参阅排除系统电池故障。E1211ROMB BattRAID电池丢失、损坏或因 温度冋题而无法再充电。重置RAID电池连接器。请参阅安装RAID电池和排除系统电池故障。E1229CPU # VCORE处理器# VCORE稳压器出 现故障。请参阅获得帮助。E1310RPM Fan #指定的冷却风扇的 RPM超 出允许的运
16、行围。请参阅排除系统冷却故障。E1313FanRedundancy系统中的风扇不再有冗余。 如果风扇再出现故障,系统 将面临过热的危险。检查控制面板 LCD以获取其它滚动信 息。请参阅排除系统冷却故障。E1410CPU # IERR指定的微处理器报告部错 误。请参阅系统的“信息更新技术表”(位 于support.dell. ),以获取最新的系统信息。如果问题仍然存在,请参阅获得 帮助。E1414CPU #Thermtrip指定的微处理器超出了允 许的温度围并已停止运行。请参阅排除系统冷却故障。如果问题仍 然存在,请确保处理器散热器安装正确。 请参阅排除处理器故障。注:LCD将继续显示此信息,直
17、到断开 系统的电源线连接并将其重新连接至交 流电源,或使用 Server Assista nt 或BMC管理公用程序清除了 SEL为止。有 关这些公用程序的信息,请参阅 DellOpe nMan age底板管理控制器用户指 南。E1418CPU #Prese nee指定的处理器缺少或损坏, 且系统的配置不受支持。请参阅排除处理器故障。E141CCPU Mismatch处理器的配置不受 Dell支持。确保您的处理器与系统的使用入门指 南中概述的微处理器技术规格中介绍 的类型匹配且相符。E141FCPU Protocol系统BIOS已报告处理器 协议错误。请参阅获得帮助。1E1420CPU Bus
18、 PERR系统BIOS已报告处理器 协议错误。请参阅获得帮助。E1421CPU Init系统BIOS已报告处理器 初始化错误。请参阅获得帮助。E1422CPU MachineChk系统BIOS报告了机器检 查错误。请参阅获得帮助。E1610PS # Miss ing指定的电源设备中没有电; 指定的电源设备安装错误 或出现故障。请参阅排除电源设备故障。E1614PS # Status指定的电源设备中没有电; 指定的电源设备安装错误 或出现故障。请参阅排除电源设备故障。E1618PS #Predictive电源设备的电压超出允许 围;指定的电源设备安装错 误或出现故障。请参阅排除电源设备故障。E1
19、61CPS # In putLost指定的电源设备的电源不 可用,或超出了允许围。检查指定电源设备的交流电源。如果问 题仍然存在,请参阅排除电源设备故障。E1620PS # In putRange指定的电源设备的电源不 可用,或超出了允许围。检查指定电源设备的交流电源。如果问 题仍然存在,请参阅排除电源设备故障。E1624PSRedundancy电源设备子系统不再有冗 余。如果最后一个电源设备 也出现故障,系统将关闭。请参阅排除电源设备故障。E1710I/O Cha nnelChk系统BIOS报告了 I/O通 道检查。请参阅获得帮助。E1711PCI PERR B#D# F#PCI PERRS
20、lot #系统BIOS报告了组件的 PCI奇偶校验错误,该组件 所在的PCI配置空间位于 总线#,设备#,功能#。系统BIOS报告了组件上 的PCI奇偶校验错误,该 组件位于指定的 PCI插槽。卸下并重置PCI扩充卡。如果问题仍然 存在,请参阅排除扩充卡故障。如果问题仍然存在,则表示提升卡或系 统板出现故障。请参阅获得帮助。PCI PERRSlot #系统BIOS报告了组件上 的PCI奇偶校验错误,该 组件位于指定的 PCI插槽。卸下并重置PCI扩充卡。如果问题仍然 存在,请参阅排除扩充卡故障。如果问题仍然存在,则表示提升卡或系 统板出现故障。请参阅获得帮助。E1712PCI SERR B#D
21、# F#PCI SERR系统BIOS报告了组件上 的PCI系统错误,该组件 所在的PCI配置空间位于卸下并重置PCI扩充卡。如果问题仍然 存在,请参阅排除扩充卡故障。如果问题仍然存在,则表示提升卡或系Slot #总线#,设备#,功能#。系统BIOS报告了组件上 的PCI系统错误,该组件 位于指疋的插槽。统板出现故障。请参阅获得帮助。E1714Unknown Err系统BIOS已确定系统中 存在错误,但无法确定错误 来源。请参阅获得帮助。E171FPCIE FatalErr B# D#F#PCIE FatalErr Slot #系统BIOS报告了组件上 的PCIe致命错误,该组件 所在的PCI配
22、置空间位于 总线#,设备#,功能 #。系统BIOS报告了组件上 的PCIe致命错误,该组件 位于指疋的插槽。卸下并重置PCI扩充卡。如果问题仍然 存在,请参阅排除扩充卡故障。如果问题仍然存在,则表示提升卡或系 统板出现故障。请参阅获得帮助。E1810HDD # FaultSAS子系统已确定硬盘驱 动器#出现故障。请参阅排除硬盘驱动器故障。E1811HDD # RbldAbrt指定的硬盘驱动器的重建 终止。请参阅排除硬盘驱动器故障。如果问题 仍然存在,请参阅 RAID说明文件。E1812HDD #Removed指定的硬盘驱动器已从系 统中卸下。仅供参考。E1913CPU &FirmwareMis
23、matchBMC固件不支持处理器。更新至最新的BMC固件。有关设置和使 用BMC的详细信息,请参阅BMC用户 指南。E1A14SAS Cable ASAS电缆A丢失或损坏。重置电缆。如果问题仍然存在,请更换 电缆。请参阅SAS控制器卡。E1A15SAS Cable BSAS电缆B丢失或损坏。重置电缆。如果问题仍然存在,请更换 电缆。请参阅SAS控制器卡。E2010No Memory系统中没有安装存。安装存。请参阅一般存模块安装原则。E2011Mem Co nfigError检测到存,但是存无法配 置。配置存期间检测到错 误。请参阅排除系统存故障。E2012Unu sableMemory已配置存
24、,但存不可用。存 子系统出现故障。请参阅排除系统存故障。jE2013Shadow BIOSFail系统BIOS无法将其快擦写映像复制到存中。请参阅排除系统存故障。E2014CMOS FailCMOS故障。CMOSAM无常 工作。请参阅获得帮助。E2015DMACon trollerDMA控制器出现故障。请参阅获得帮助。E2016IntCon troller中断控制器出现故障。请参阅获得帮助。E2017Timer Fail计时器刷新出现故障。请参阅获得帮助。E2018Prog Timer可编程间隔计时器错误。请参阅获得帮助。E2019Parity Error奇偶校验错误。请参阅获得帮助。E201
25、ASIO ErrSIO出现故障。请参阅获得帮助。E201BKybdCon troller键盘控制器出现故障。请参阅获得帮助。E201CSMI Init系统管理中断(SMI)初始 化失败。请参阅获得帮助。E201DShutdow nTestBIOS关闭系统检测失败。请参阅获得帮助。1E201EPOST MemTestBIOS POST存检测失败。请参阅排除系统存故障。如果问题仍然 存在,请参阅获得帮助。E201FDRAC Co nfigDell 远程辅助卡 (DRAC)配置失败。请查看屏幕上的具体错误信息。确保DRAC电缆和连接器已正确就位。 如果问题仍然存在,请参阅 DRAC说明文件。E202
26、0CPU Config处理器配置失败。请查看屏幕上的具体错误信息。E2021MemoryPopulati on存配置不正确。存安装顺序 不正确。请查看屏幕上的具体错误信息。请参阅 排除系统存故障。E2022POST Fail视频后出现一般故障。请查看屏幕上的具体错误信息。E2110MBE Crd #DIMM # & #“# & # ” 所指的 DIMM 组中的一个 DIMM发生存 多位错误(MBE)。如果没有 存卡,则“ Crd # ”字符串 将不计入信息。请参阅排除系统存故障。iE2111SBE LogDisable Crd# DIMM #系统BIOS已禁用存单位 错误(SBE)记录,在重新
27、 引导系统之前,不会继续记 录更多的SBE。“#”表示BIOS所指的DIMM。如果没请参阅排除系统存故障。有存提升卡,则“ Crd # ” 字符串将不计入信息。E2112Mem SpareCrd # DIMM#由于系统BIOS已确定存 中有太多错误,因此已释放 存。“ # & #” 表示 BIOS 所指的DIMM对。如果没有 存卡,则“ Crd # ”字符串 将不计入信息。请参阅排除系统存故障。E2113Mem MirrorCrd # DIMM#& #由于系统BIOS已确定二 分之一镜像中有太多错误, 因此已禁用存镜像。“# ”表示BIOS所指的DIMM对。如果没有存卡, 则“ Crd #
28、 ”字符串将不计 入信息。请参阅排除系统存故障。E2118Fatal NB MemCRC北行的全缓冲 DIMM(FBDIMM)存子系统链路中 的其中一个连接失败。请参阅排除系统存故障。E2119Fatal SB MemCRC南行的FBDIMM存子系统 链路中的其中一个连接失 败。请参阅排除系统存故障。11910In trusi on主机盖已被卸下。仅供参考。119113 ERRs ChkLogLCD溢出信息。LCD上最多只能按顺序显 示三条错误信息。第四条信 息显示为标准的溢出信息。查看SEL以了解事件详细信息。11912SEL Full系统事件日志中的事件已 满,无法再记录更多事件。通过删除事件条目清除日志。W1228ROMBBatt 24hr预先警告RAID电池只剩 下不足24小时的电量。更换RAID 电池。请参阅 RAID 电池。注:有关本表中使用的缩写或缩写词的全称,请参阅词汇表。解决LCD状态信息所描述的问题LCD上状态信息的代码和文本(请参见表 1-5 )通常可以
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1