EMC日常维护手册.docx

上传人:b****4 文档编号:3990371 上传时间:2022-11-27 格式:DOCX 页数:40 大小:88.86KB
下载 相关 举报
EMC日常维护手册.docx_第1页
第1页 / 共40页
EMC日常维护手册.docx_第2页
第2页 / 共40页
EMC日常维护手册.docx_第3页
第3页 / 共40页
EMC日常维护手册.docx_第4页
第4页 / 共40页
EMC日常维护手册.docx_第5页
第5页 / 共40页
点击查看更多>>
下载资源
资源描述

EMC日常维护手册.docx

《EMC日常维护手册.docx》由会员分享,可在线阅读,更多相关《EMC日常维护手册.docx(40页珍藏版)》请在冰豆网上搜索。

EMC日常维护手册.docx

EMC日常维护手册

EMC日常维护手册

(v20131108)

作者

专家支持部

审核

冀正青

分类

其他

子类

指导手册

更新时间

2013-11-08

关键字

EMC日常维护

摘要

此手册用于指导EMC存储驻场工程师日常工作,驻场工程师可以按照每天、每周、每月工作内容展开工作,此手册仅适用于EMCCX系列存储的驻场维护,各工程师可根据自身项目特点增加、减少内容。

主要适用环境

EMC存储驻场运维工作

版本说明

版本号

拟制/修改责任人

拟制/修改日期

修改内容/理由

V

冀正青

2013-10-18

新建

V201311110

冀正青

2013-11-11

增加日常工作内容与规范

版本说明2

1硬件部分5

1.1ClariionCX系列产品硬件介绍5

1.2如何用Navisphere看存储的状态20

1.3客户发现Clariion出现问题,应如何报修?

23

1.4EMCClariionCX系列开关机注意事项及详细步骤26

1.5Clariion主动性售后支持及call-home的介绍28

1.6如何收集日志37

1.7常见故障处理和日志分析42

1.8监视存储系统的运行,定位故障点FRU45

2.软件部分48

2.1PowerPath管理与配置48

2.2主机信息收集(emcgrab)54

3.日常工作内容与规范61

3.1存储日常维护总体说明61

3.2每日工作内容61

3.3每周工作内容与交付物62

3.4每月工作内容与交付物63

1硬件部分

1.1ClariionCX系列产品硬件介绍

1.1.1ClariionCX系列产品的基本构成

构成:

由SPS,DPE/SPE和DAE三部分组成示例:

CX4-960

名词解释:

SPS:

StandbyPowerSupply,接DPE或者SPE+DAEOS,对WriteCache提供后备电源保护

SPE:

StorageProcessorEnclosure,包含两个全冗余的存储控制器

DPE:

DiskProcessorEnclosure,SPE和DAEOS在同一个Enclosure

DAE:

DiskArrayEnclosure,磁盘柜,包含15个硬盘槽位,磁盘ID从左至右为0-14

DAE_OS:

包含控制器系统(OS)的DAE,占用DAE从左至右前五块硬盘

注:

Clariion系列中采用DPE架构的有CX200/300/400/500,而CX600/700,3和4系列均为

SPE架构

1.1.2CX600/CX700基本部件及状态灯介绍

前视图

(1)3个热插拔风扇模块

(图1-1)

(2)风扇模块错误灯(黄灯亮表示有错误,在前面板上看不见,需拆下前面板才能看见)

(3)SPE电源指示灯(绿灯)SPE错误指示灯(黄灯)

后视图

(1)StorageProcessorsA

(2)StorageProcessorsB

(图1-2)

(3)2个热拔插电源模块(active/active,1+1)

细节图

(图1-3)

(1)4个前端(连主机)2GbFC端口(每个StorageProcessor)

(2)4个后端(连扩展DAE)2GbFC端口(每个StorageProcessor)

(3)10/100局域网管理端口

(4)SPStatusLEDs--用于SP启动检测和检查SP的健康状态

(5)Port80hCard--在SP主板上,用与开机自检,

(6)SPSMonitoringPort--连接SPS的串口,用于SP与SPS之间的通讯和控制

(7)Serial/PPPPort--获取动态IP地址进行维护或也可通过HyperTerminal软件检测SP的启动

1.1.3CX200/300/400/500基本部件及状态灯介绍

/300/400/500DiskProcessorEnclosure(DPE)

(四款产品均为DPE架构,除SP的前端和后端端口数量有差别外,基本一样,下图为CX500

的DPE)

(图1-4)

(1)BE0–后端总线端口0(HSSDC)--连接DPE和DAE

(2)BE1–后端总线端口1(HSSDC)--连接DPE和DAE(3)两个前端2Gb端口(FC)每个StorageProcessor

(4)Enclosure状态灯--绿色(电源灯),黄灯(错误灯或可用于检测启动过程)

(5)10/100以太网管理端口

(6)SerialMgmtPort(RJ-45)--获取动态IP地址进行维护或也可通过HyperTerminal软件检测SP

的启动

(7)SPSMonitoringPort--连接SPS的串口,用于SP与SPS之间的通讯和控制

1.1.4CX3-10/3-20/3-40基本部件及状态灯介绍

前视图

(图1-5)

(A)四个热插拔电源模块,从左至右依次为PS_A0A1B0B1(B)电源模块故障指示灯,故障时亮黄色

(C)系统电源指示灯:

绿色,常亮系统故障指示灯:

黄色,系统故障时亮

后视图

(图1-6)

细节图

(三款产品均为SPE架构,除SP前端和后端端口数量有差别外,基本一样,下图为CX3-40

的SP)

(图1-7)

A:

SPS监控端口

B:

管理串口C:

电源指示灯:

绿色,常亮D:

故障指示灯:

黄色,故障时亮E:

服务管理网口F:

客户管理网口G:

后端扩展端口H:

前端光纤端口

1.1.5CX3-80基本部件及状态灯介绍

前视图

(图1-8)A:

电源模块,上有黄色故障指示灯,故障时亮B:

冷却风扇模块,上有黄色故障指示灯,故障时亮C:

系统故障指示灯:

黄色,故障时亮D:

系统电源指示灯:

绿色,常亮

后视图

A:

电源模块

B:

SANManagementModule

C:

I/O模块电源模块

(图1-9)

细节图

A:

SP控制器工作状态指示灯

B:

I/OModule

(图1-10)

细节图

A:

后端端口工作状态LEDB:

后端端口

C:

前端端口

D:

前端端口工作状态LED

(图1-11)

E:

I/O模块电源与故障指示灯,黄色灯亮表示有故障

细节图

A:

电源指示灯B:

故障指示灯C:

用户管理网络端口

D:

服务管理网络端口,仅限于EMC服务人员使用

E:

管理串口

F:

SPS监控端口

(图1-12)

1.1.6CX4-120/240/480基本部件及状态灯介绍

前视图

A0:

电源模块A1:

电源模块B0:

电源模块B1:

电源模块C:

CPU模块AD:

CPU模块B

E:

CPU模块A电源和故障指示灯

F:

CPU模块B电源和故障指示灯

G:

存储系统电源和故障指示灯

(图1-13)

后视图

A:

ManagementModule(管理模块)

B:

I/OModule(I/O模块)

(图1-14)

C:

Power/FaultLED(电源/故障指示灯)

细节图

A:

ManagementModule(管理模块)

(图1-15)

B:

BackEndPortonI/OModule(I/O模块上的后端端口,连接DAE)

C:

FCFrontEndPortonI/OModule(I/O模块上的前端光纤端口,连接主机)

D:

iSCSIFrontEndPortonI/OModule(I/O模块上的前端iSCSI端口,连接主机)

细节图

A:

ServiceLANPort(服务端口,仅限于EMC服务使用)

B:

ManagementLANPort(用户管理端口)C:

SPSPort(SPS监控端口)D:

CommunicationsPort(管理端口)E:

NMI(系统维护用,勿触动)

(图1-16)

1.1.7CX4-960基本部件及状态灯介绍

前视图

A1:

PowerSupplyA(电源模块A)

A2:

PowerSupplyB(电源模块B)

B1-B4:

Blowers/Fans(风扇模块)

(图1-17)

C:

EnclosureFaultLED(系统故障指示灯)

D:

PowerLED(系统电源指示灯)

后视图

A:

PowerSupplyB(电源模块B)B:

PowerSupplyA(电源模块A)C:

ManagementModule(管理模块)D:

ManagementModule(管理模块)E:

I/OAnnex(I/O扩展模块)

(图1-18)

细节图

A:

PowerLED(电源指示灯)B:

FaultLED(故障指示灯)C:

UnsafetoRemoveLED

D1-D4:

I/OModule(I/O模块)

(图1-19)

细节图

A:

FaultLED(故障指示灯)B:

PowerLED(电源指示灯)C:

USB

D:

ManagementLANPort(以太网管理端口)

E:

ServiceLANPort(以太网服务端口,仅限于EMC服务人员)

F:

NMIButton

G:

CommunicationsPort(服务端口)

H:

SPSPort(SPS监控端口)

(图1-20)

1.1.8DiskArrayEnclosure(DAE)基本部件及状态灯介绍

前视图

(图1-21)

(10)硬盘状态灯--绿灯表示连接状态,绿灯闪烁表示磁盘活动状态,黄灯亮表示磁盘报错

(11)盘柜状态灯--绿灯表示供电正常,黄灯亮表示盘柜有错误

(12)Slot0-4,共5块DAE-OSVaultDrives(仅限于DAE_OS),从左至右,Slot0--Slot4

后视图

TwoLinkControlCard(LCC)

(图1-22)

(1)LCC状态灯--绿色表示电源,黄色表示有错误

(2)Expansion端口(HSSDC)--灯亮表示有信号

(3)光纤环路ID指示灯(LoopIDLED)--0,1,2,3,表示后端连接的光纤换路(Loop)ID(4)Primary端口(HSSDC)--灯亮表示有信号

TwoDAE电源模块

(5)两个集成了风扇的电源模块

(6)风扇错误灯(黄色)

(7)电源状态灯(绿色--有电,黄色--有错)

(8)交流电源输入开关,对DAE-OS,DPE或SPE关电,应使用此开关

(9)Enclosure地址开关-如是DAE-OS的Enclosure,则其必须被设置为0

后视图

(图1-23)A:

电源模块,下面电源模块为PSA,上面为PSBB:

LCC模块,下为LCCA,上为LCCB

C:

PRI端口,连接SPBackEnd端口或者上级DAEEXP端口

D:

EXP端口,连接下级DAEPRI端口

E:

EnclosureIDLEDF:

LoopIDLEDG:

电源与故障指示灯

1.1.9StandbyPowerSupply(SPS)基本部件及状态灯介绍

KWIUSPS

(1)电源开关

(2)交流电源输入

(3)SPE&启动盘所在DAE的交流输出

(图1-24)

(4)SPS监测端口--连接SP的串口,用于SP与SPS之间的通讯和控制

(5)状态灯(从下至上)

内部监测灯—亮黄色表示SPS内部监测出错

更换SPS指示灯—亮黄色表示电池寿命已到或者自检出错电池供电指示灯--当SPS给SP或DAEOS供电时亮黄色电源灯--当SPS充满电后亮常绿,当SPS电池被充电时闪绿色

2USPS

A:

交流输入

B:

交流输出

C:

电源开关

(图1-25)

D:

SPS监测端口--连接SP的串口,用于SP与SPS之间的通讯和控制

E:

状态灯(从下至上)

内部监测灯—亮黄色表示SPS内部监测出错

更换SPS指示灯—亮黄色表示电池寿命已到或者自检出错电池供电指示灯--当SPS给SP或DAEOS供电时亮黄色电源灯--当SPS充满电后亮常绿,当SPS电池被充电时闪绿色

1.2如何用Navisphere看存储的状态

1.2.1在Navisphere中,除正常状态以外,CX磁盘阵列的四种常见状态

T:

一个或者多个部件处于Transition状态,比如LUN正在Rebuilding,SPS正在充电F:

一个或者多个部件出现故障,注意,存储刚加电,由于SPS充电,也会出现F状态X:

存储系统不可访问,比如网络连接断开等情况

当前Navishper版本不支持对该存储系统进行管理

举例如下:

ArrayinTransition

ArrayFaulted

ArrayInaccessible

1.2.2如在Navisphere发现有报错,检查CX磁盘阵列错误的简单方法

1、右击存储,选择fault,会显示具体报错信息

2、展开Physical项,可以定位具体故障部件

3、Clariion每个部件都有独立的故障指示灯,在Navishpere发现错误后,可以观察存储故障部件的错误指示灯进一步确认

1.3客户发现Clariion出现问题,应如何报修?

(注:

如客户已装了dial-out或者Call-home,存储会让管理工作站自动拨号并报修,若无,需

客户自己发现并报修)

1.3.1获取ClariionCX系列阵列的序列号

有以下五种方法:

方法一:

EMC工程师在存储安装时会在存储贴上写有序列号的白色标签,标签上会注明客户

EMC报修电话、SiteID、存储序列号等信息:

方法二:

如安装工程师漏贴标签,注意必须查SPE或DPE上的标签

(DPE架构的从机柜后面查看上图所示位置)

(SPE架构的从机柜正面拆下SPE挡板,查看上图所示位置)方法三:

通过serializationtag查看(仅适用于Clariion4系列产品)

CX4-120/240/480请查看存储SPE后部的黑色标签,上面有产品的PN(型号),SN(序列号)

CX4-960和CX4-120/240/480差不多,也是在SPE后部有一个黑色标签,只是位置不同

方法四:

通过Navisphere命令查看CX存储的序列号:

(红色字体)C:

\ProgramFiles\EMC\NavisphereCLI

Desc:

PhysicalNode:

K10

Signature:

1912950

PeerSignature:

1912955

SCSIId:

0

SPIdentifier:

A

SPMemory:

4096

SerialNo:

Cabinet:

SPE3C:

\ProgramFiles\EMC\NavisphereCLI>

方法五:

通过Navisphere图形界面查看CX存储的序列号

右击存储,选择Properties,在弹出窗口General选项卡中的SerialNumber一项

1.3.2拔打EMC全球响应中心800电话报修

如用固定电话报修,请拔打如用手机报修,请拔打请依照语音提示进行报修

注意:

必须事先准备好序列号,报修时需提供存储序列号(CX系列的序列号格式基本都是CK2000开头,后跟8位数字),同时请提供具体的故障描述,如果部件故障,最好能提供故障部件的PartNumber(PN),特别是硬盘的PN,以便于服务人员准确准备备件

1.4EMCClariionCX系列开关机注意事项及详细步骤

1.4.1开机前注意事项:

1.磁盘阵列在加电前,为确保磁盘柜散热和工作正常,请确认所有磁盘柜的每个槽位都已经插上硬盘和挡风板

2.开机前需确保――SPE或DPE至少要有一个正常工作的SP,每个DAE都至少要一块正常工作的LCC

1.4.2开机步骤:

1.检查所有供电线路联接是否正常,是否有松动或改动并改正

2.从机柜顶部开始,由上至下打开所有DAE磁盘机箱的电源。

3.打开机柜最底部两个电池(SPS)(CX300可能只有一个)开关

4.开机完成.

1.4.3关机前注意事项:

1.警告:

请不要在关闭两个电池(SPS)的电源开关前,关闭SPE,DPE,DAE等盘柜的任何一个电源,否则很可能会导致严重错误,并造成数据丢失!

(CX300可能只有一个SPS)

2.即使关闭两个电池(SPS)的电源开关后,也需要等待3分钟直到CX存储写缓存中的数据完全写入硬盘,DAEOS磁盘柜指示灯熄灭后才可关闭DAE,SPE或DPE等盘柜的电源

3.停止所有对CX磁盘阵列访问的应用,以便所有的I/O能被从SP的写缓存写回到前5块盘上。

4.如果有UNIX服务器连接在CX磁盘阵列上,必须umountUNIX服务器所有与CX磁盘阵列相关的文件系统,Windows主机请关闭。

1.4.4磁盘阵列关机步骤:

1.关闭机柜最底部的两个电池开关并等待约3分钟直到CX存储写缓存中的数据完全写入到硬盘

上后,可看到电池的信号灯完全熄灭,且应看到因电池停止供电,SPE或DPE机箱及DAE-OS

磁盘机箱的电源灯熄灭。

2.由下至上,关闭所有DAE磁盘机箱的开关(机柜内部的PDU)

3.关闭机柜后面两侧机柜总开关

4.关机完成.

1.5Clariion主动性售后支持及call-home的介绍

1.5.1EMCPowerlink网站介绍

客户注册登陆后,可免费获取许多EMC相关的各类技术支持文档,界面和网址如下:

1.5.2CLARiiONProactiveSupportCall-home介绍

CALL-Home包括三项主要功能

a)错误检测功能(需工程师安装软件在监控PC上)

b)报错功能:

存储出错时,软件会自动拨出(Dialout)或自动发送电子邮件(Emailout)到EMC

的全球技术支持中心

c)远程诊断功能:

EMC的全球技术支持中心收到“Dialout”或“Emailout”或客户报修电话后,开始远程诊断

方法1:

通过客户提供的电话线路,远程拨入(Dial-in)

方法2:

通过客户提供给PC管理工作站的Internetaccess,由客户上WebEx网址申请,并允许

全球技术支持中心远程通过WebExIP连接访问PC管理工作站(可选)

1.5.3客户开通CLARiiONProactiveSupportCall-home所需要提供的条件

a)由客户提供管理工作站PC–必须是英文版WindowsNT4.0SP6A或Windows2000SP2

以上版本,或WindowsXP

b)调制解调器(shipswithClariionSystems)

c)电话直线路(不需打分机号码,由客户提供)

–PBXextension或新设直通线路

d)由EMC工程师在管理工作站上安装CLARAlert远程服务套件

–NavisphereManagerEventMonitor

–NavisphereHostAgent/CLI

–EMC远程主机及客户端

e)WebEx远程访问技术(可选,由客户提供internetaccess给PC管理工作站)

–MinimumWindowsRequirements

–Windows98andhigher

–WebBrowserSupport:

InternetExplorer5.xand6,Mozilla1.6,Netscape4.7

1.5.4CLARiiONProactiveSupport安全考虑事项

CLARalert软件套件安装在客户提供的工作站上。

这样,CLARiiONProactiveSupport的安全级别不仅取决于CLARalert的安全特性,而且也取决于您在应用程序、主机和网络级别实施的安全性

1.5.5CLARalert安全性

CLARalert具有强大的安全功能,并且在提供针对远程访问策略的选项方面也具有灵活性。

您可以随时查看与远程访问活动相关的信息以进行审计。

远程访问安全选项是由经授权的EMC人员代表客户设置的。

这些选项包括:

a)由客户指定的EMCRemote用户名和密码,这样它们就可以遵守您的与密码有关的策略

b)拨入尝试通知,您可以对每次拨入请求进行批准/拒绝

c)客户可以设定在EMCRemote发出身份验证失败消息之前可允许的重拨次数

d)禁用EMCRemote远程访问功能的能力

e)使用EMCRemote将所有登录和登录失败尝试记录到CLARalert工作站上的一个文件中

f)使用Navisphere响应日志和消息文件以记录拨出尝试和错误代码文本

EMCRemote是一种专用的客户端/服务器应用程序,服务器组件驻留在CLARalert工作站上。

这样,只有获授权的人员可以访问该客户端/服务器应用程序。

客户端/服务器通信使用一种专有的按会话性质而设立的40位算法加密。

在拨入时,会在拨号器和客户端软件之间执行特定的“握手”程序,此程序授权EMC客户服务人员连接到工作站上的EMCRemote

EMC支持专家的系统和CLARiiONProactiveSupport工作站之间的成功“握手”是建立任何会话所必需的。

“握手”过程中的协商是加密的,并且必须在协商成功后才能建立

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 农林牧渔 > 林学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1