EMCCLARiiON硬件及维护指南.docx
《EMCCLARiiON硬件及维护指南.docx》由会员分享,可在线阅读,更多相关《EMCCLARiiON硬件及维护指南.docx(29页珍藏版)》请在冰豆网上搜索。
EMCCLARiiON硬件及维护指南
一、CLARiiON硬件及维护指南
(一)-CX3/CX4基本部件介绍
CX3/CX4基本部件介绍
CLARiiONCX系列产品的基本构成
构成:
由SPS,DPE/SPE和DAE三部分组成
示例:
CX4
SPS:
StandbyPowerSupply,接DPE或者SPE+DAEOS,对WriteCache提供后备电源保护
SPE:
StorageProcessorEnclosure,包含两个全冗余的存储控制器
DPE:
DiskProcessorEnclosure,SPE和DAEOS在同一个Enclosure
DAE:
DiskArrayEnclosure,磁盘柜,包含15个硬盘槽位,磁盘ID从左至右为0-14
DAE-OS:
包含控制器系统(OS)的DAE,占用DAE从左至右前五块硬盘
注:
CLARiiON系列中采用DPE架构的有CX200/300/400/500,而CX600/700,3和4系列均为SPE架构
二、CLARiiON硬件及维护指南
(二)-状态指示灯
版本7
以CLARiiONCX4系列为例介绍SPE、DAE和SPS的基本部件及其状态灯。
1.CX4-120/240/480StorageProcessorEnclosure(SPE)基本部件及状态灯介绍
1.1SPE前视图
A0,A1,B0&B1:
电源模块
C&D:
CPU模块A和B
E:
CPU模块A电源和故障指示灯,黄色灯亮表示有故障
F:
CPU模块B电源和故障指示灯,黄色灯亮表示有故障
G:
存储系统电源和故障指示灯,黄色灯亮表示有故障
1.2SPE后视图
A&B:
管理模块和I/O模块
C:
电源/故障指示灯,黄色灯亮表示有故障
1.3SP细节图
A:
管理模块
B:
I/O模块上的后端端口,连接DAE
C&D:
I/O模块上的前端光纤端口和前端iSCSI端口,连接主机
2. CX4-960StorageProcessorEnclosure(SPE)基本部件及状态灯介绍
2.1SPE前视图
A1&A2:
电源模块A和B
B1-B4:
风扇模块
C:
磁盘柜系统故障指示灯
D:
系统电源指示灯
2.2SPE后视图
A&B:
电源模块B和A
C&D:
管理模块
E:
I/O扩展模块
2.3SP细节图
A:
电源指示灯,绿色,常亮
B:
故障指示灯,黄色,故障时亮
C:
勿拔提醒指示灯
D1-D4:
I/O模块
3. DiskArrayEnclosure(DAE) 基本部件及状态灯介绍
3.1DAE前视图
A:
硬盘状态灯--绿灯表示连接状态,绿灯闪烁表示磁盘活动状态,黄灯亮表示磁盘报错
B:
盘柜状态灯--绿灯表示供电正常,黄灯亮表示盘柜有报错
C:
插槽共5块DAE-OSVaultDrives (仅限于DAE_OS),从左至右,Slot0--Slot4
3.2DAE2P/3P后视图-适用于CX4-120/240/480/960
A:
电源模块,下面电源模块为PSA,上面为PSB
B:
LCC模块,下为LCCA,上为LCCB
C:
PRI端口,连接SP 后端端口(Backendport)或者上级DAE的扩展端口(EXPport)
D:
EXP端口,连接下级DAE端口
E:
磁盘柜标识(EnclosureID)指示灯
F:
环路标识(LoopID)指示灯
G:
电源与故障指示灯
4. StandbyPowerSupply(SPS) 基本部件及状态灯介绍
4.1 SPS型号1KWIU-适用于CX4-120/240/480
(1) 电源开关
(2&3) 交流电源输入和输出
(4)SPS 监测端口--连接SP的串口,用于SP与SPS之间的通讯和控制
(5) 状态灯 (从下至上)
内部监测灯—亮黄色表示SPS内部监测出错
更换SPS指示灯—亮黄色表示电池寿命已到或者自检出错
电池供电指示灯--当SPS给SP或DAEOS供电时亮黄色
电源灯--当SPS充满电后亮常绿,当SPS电池被充电时闪绿色
4.2 SPS型号2.2KW2U-适用于CX4-960
A&B:
交流输入和输出
C:
电源开关
D:
SPS监测端口--连接SP的串口,用于SP与SPS之间的通讯和控制
E:
状态灯 (从下至上)
内部监测灯—亮黄色表示SPS内部监测出错
更换SPS指示灯—亮黄色表示电池寿命已到或者自检出错
电池供电指示灯--当SPS给SP或DAEOS供电时亮黄色
电源灯--当SPS充满电后亮常绿,当SPS电池被充电时闪绿色
三、CLARiiON硬件及维护指南(三)-Navisphere图形管理界面
Navisphere图形管理界面适用于运行Flare版本19到29之间的CLARiiON。
在有多台CLARiiON的环境中,将所有CLARiiON加入同一个存储域(StorageDomain),选择其中一台作为域的主要节点(DomainMaster),即可用一个界面管理该域中所有的CLARiiON。
1.从Navisphere登录作为DomainMaster的CLARiiON,管理该存储域(StorageDomain)下所有的CLARiiON。
在Navisphere中,除了正常状态,还有以下四种常见状态:
T:
一个或者多个部件处于Transition状态,比如LUN正在重建Rebuilding。
F:
一个或者多个部件出现故障,注:
存储刚加电,由于SPS充电,也会出现F状态。
X:
存储系统不可访问,比如网络连接断开等情况。
?
:
当前Navishpere版本不支持对该存储系统进行管理。
2.在主机Hosts界面查看主机和存储之间的连接、注册情况。
3.在监控Monitors界面,配置具体监控哪些事件以及监控的方式Email、Paging或者SNMP。
4.选择CLARiiON的序列号右击,可以配置存储、监控运行、管理属性、复制数据并且分析性能。
4.1运行监测---错误分析报告
选择CLARiiON的序列号右击,点击Faults,查看系统错误分析报告。
4.2运行监测---磁盘概况
选择CLARiiON的序列号右击,点击DiskSummary,查看磁盘使用情况。
5. 选择CLARiiON的SP右击,可以查看SP事件日志、重启SP、收集SP日志spcollects并且分析性能。
选择CLARiiON的SP右击,点击ViewEvents,查看SP报出的事件日志。
四、CLARiiON硬件及维护指南(四)-Unisphere图形管理界面
Unisphere图形管理界面适用于运行Flare版本30及更高版本的CLARiiON。
在有多台CLARiiON的环境中,将所有CLARiiON加入同一个存储域(StorageDomain),选择其中一台作为域的主要节点(DomainMaster),即可用一个界面管理该域中所有的CLARiiON。
1.从Unisphere登录作为DomainMaster的CLARiiON,在控制板Dashboard界面可以查看该存储域(StorageDomain)中的所有设备。
2.在告警Alerts界面查看系统告警和错误,确认运行是否有异常。
3.在工具栏选择CLARiiON的序列号,即到该设备的管理界面。
选择系统System,点击系统信息SystemInformation,可以管理系统属性或者对控制器SP进行操作。
4.选择系统System,点击硬件Hardware,可以从网页界面查看硬件构造及各部件目前的状态。
5.选择存储Storage,可以创建RAID组或者存储池、绑定LUN、配置存储组SG。
6.选择主机Hosts,查看主机和存储之间的连接、注册情况。
7.选择复制Replicas,使用各种复制软件进行数据保护。
8.选择监控Monitoring, 查看系统错误报告和SP事件日志、分析性能、配置监控的方式Email、Paging或者SNMP。
9.选择支持Support界面,从EMC多种在线渠道获得信息和解决方案。
五、CLARiiON硬件及维护指南(五)-NaviSecCLI常用命令
NaviSecCLI常用命令
创建一个安全文件,这样下次登录时不用再输入用户名和密码。
安全文件是加密的,且与本机绑定:
naviseccli-AddUserSecurity-userxxxx-passwordxxxxx-scope0
注:
SecureCLI(naviseccli)在ClassicCLI(navicli)的基础上提供了身份验证、CLI事件审计、SSL加密等功能。
创建安全文件后就不必在每次执行naviseccli时再带上-user、-scope和-password参数。
显示系统中各组件状态:
naviseccli-hgetcrus
显示哪个SP是某个LUN默认和当前的主SP:
naviseccli-hgetlun-default-owner
显示指定行数的SPlog日志(如:
200行):
naviseccli-hgetlog-200
或将输出结果另存为本地文件:
naviseccli-hgetlog-200>getlog_spa.txt
确认SPAgent状态:
naviseccli-hgetagent
显示主机LUN和阵列LUN信息:
naviseccli-hstoragegroup-list
显示RAIDGroup基本信息:
naviseccli-hgetrg 0
显示磁盘信息:
naviseccli-h getdisk
naviseccli-h getdisk0_0_5
找出哪些LUN有DirtyCache:
naviseccli-hgetlun-luncache
显示Rebuild进度:
naviseccli-hgetlun[lun]-prb
收集SPCollects日志:
naviseccli-hspcollect
naviseccli-hmanagefiles-retrieve
列出哪些HBA登录了系统中:
naviseccli-hport-list
列出组件的部件号:
naviseccli-hgetresume
显示Cache是否启用及配置信息:
naviseccli-hgetcache
列出被启用的系统功能包:
naviseccli-hndu-list
Trespass某个LUN:
naviseccli-htrespass
发起一个后台sniffer检查命令:
naviseccli-hsetsniffer-bv-bvtimehigh-cr
获得Sniffer报告:
naviseccli-hgetsniffer
六、CLARiiON硬件及维护指南(六)-开关机步骤
CLARiiONCX系列开关机步骤
CLARiiON的开关机步骤可参照此帖内容:
开机前注意事项:
1.磁盘阵列在加电前,为确保磁盘柜散热和工作正常,请确认所有磁盘柜的每个槽位都已经插上硬盘和挡风板
2.开机前需确保SPE或DPE至少要有一个正常工作的SP,每个DAE都至少要一块正常工作的LCC
关机前注意事项:
1.请不要在关闭两个电池(SPS)的电源开关前,关闭 SPE、DPE、DAE等盘柜的任何一个电源,否则很可能会导致严重错误,并造成数据丢失!
(CX300可能只有一个SPS)
2.即使关闭两个电池(SPS)的电源开关后,也需要等待 3分钟直到CX存储写缓存中的数据完全写入硬盘,DAEOS磁盘柜指示灯熄灭后才可关闭DAE,SPE或 DPE等盘柜的电源
3.停止所有对CX磁盘阵列访问的应用,以便所有的I/O能被从SP的写缓存写回到前5块盘上
七、CLARiiON硬件及维护指南(七)-常见故障处理
常见的故障处理列举如下:
1. 如何获取当前存储系统运行的微码Flare版本?
方法一、通过NavisphereCLI命令行
C:
\ProgramFiles\EMC\NavisphereCLI>naviseccli-hgetagent
Name:
K10
Desc:
Node:
A-CK200072300124
PhysicalNode:
K10
Signature:
1912950
PeerSignature:
1912955
SCSIId:
0
SPIdentifier:
A
Revision:
3.26.40.5.016 (Revision查看微码Flare版本)
Model:
CX3-40c
ModelType:
Rackmount
PromRev:
3.58.00
SPMemory:
4096
SerialNo:
CK200072300124
Cabinet:
SPE3
方法二、登陆网页管理界面。
如果是Navisphere界面,右击存储,选择属性Properties, 在弹出的窗口中选择software选项卡。
如果是Unisphere界面,选择系统System下拉菜单中系统信息SystemInformation,然后点击属性Properties, 在弹出的窗口中选择software选项卡。
2. 存储开机后,SPE前面板故障指示灯亮,是否系统有故障?
Clariion存储的启动需要一些时间,等两个控制器SP启动完毕后,因为会测试SPS电池的有效性,在SPS充放电的过程中,系统故障灯会亮,请等待两块电池充满电后再检查系统故障灯状态。
3. 如果发现存储有部件显示故障指示灯,是否是部件松动,可以重新插拔么?
在系统工作过程中,排除外接电源问题,如果发现有部件故障指示灯亮,请不要自行插拔任何部件(包括硬盘),否则可能造成不可预知的故障,请及时联系EMC技术支持报修 。
4. 我们想测试磁盘RAID的容错性,可以带电插拔硬盘么?
我们强烈建议您不要这么做,RAID的容错性可以在系统的配置信息中确认,带电插拔硬盘有两个不利因素:
a) 当你拔出硬盘后,该硬盘所在的LUN会全部需要rebuild,这会降低您的磁盘读写性能
b) 磁盘属于机械设备,带电插拔,可能给磁盘带来潜在的或者不可预料的损害
如果需要测试,建议联系EMC技术支持用Navisphere命令行来执行磁盘离线测试 。
5. 忘记存储设备的管理IP该怎么办?
方法一、通过sniffer抓包程序,抓取来自控制器的以太网端口的TCP/IP信息,适用于所有机型。
方法二、利用EMC服务专用端口,只适用于ClariionCX3和CX4系列。
ClariionCX3和CX 4系列有EMC服务专用端口,可以用默认的IP登陆,然后右击存储,选择属性,在弹出窗口的General选项卡中会出现两个SP的IP地址。
注:
下图中D端口即是EMC服务专用端口,但需要注意一点,如果您想连接SPA,请连接靠近SPB的服务端口,即两边的服务端口是错位的(容错考虑),其默认IP如下
SPA:
128.221.1.250SubnetMask255.255.255.248
SPB:
128.221.1.251SubnetMask255.255.255.248
方法三、利用初始化工具NavisphereStorageSystemInitializationWizard(可从Powerlink上下载),会自动扫描到已经初始化过的存储,并显示IP配置信息。
方法四、利用串口线建立点对点拨号连接(PPP)登陆存储。
建立PPP连接的具体步骤请参考
如何与CLARiiON建立点对点PPP拨号连接?
PPP连接建立好之后在浏览器地址栏输入:
http:
//192.168.1.1/setup,即可出现如下界面,可以看到两个控制器的IP等详细信息
6. 如何修改Clariiion存储的管理IP地址?
具体步骤请参考
7. 忘记存储的帐号和口令怎么办?
具体步骤请参考
八、CLARiiON硬件及维护指南(八)-日志收集
当您的存储运行遭遇故障时,联系EMC技术支持之前若能收集以下日志将帮助您更快捷地获得更精准的解决方案。
1.收集CLARiiON存储日志
Clariion的SP日志(SPCollects)作为当前阵列配置和事件记录的快照,它所包含的信息向EMC的工程师提供了存储系统的完整配置概述。
最常用的两种收集SP日志的方法即通过网页管理界面(Unisphere或者Navisphere)或者命令行(NavisphereCLI)收集,整个过程大约需要15分钟左右。
1)登录Unisphere->分别在SPA/SPBtask栏下点击GenerateDiagnoisticFiles->等待约五分钟时间->getdiagnosticfile->找到以存储SN开头结尾是data.zip的文件->选中并点击Filetransfermanager传送到本地计算机
2)登录Navisphere->展开localdomain直至看到SPA/SPB两个节点。
分别右击两个节点并选择spcollects,接下去收集方法同上。
3)使用naviseccli-hspcollect生成日志文件,等待5分钟左右,使用naviseccli-hmanagefiles-retrieve找到并取得需要的文件。
注:
如果没有创建本地安全文件,Naviseccli必须包含-user-password-scope选项。
建议参考附有图解的详细步骤:
2.收集主机日志
在使用EMC存储的用户遇到的问题中,有很多是与主机有关的,例如主机无法访问后端磁盘、大量的LUN切换(LUNTrespass)、访问存储的性能突然变慢等等。
通过在主机上运行一个软件工具EMCReport或EMCGrab生成以tar结尾的文件,可以收集到主机在存储方面的配置、HBA卡、Powerpath等信息。
针对不同的操作系统,各种版本的工具和相应的使用说明Readme文件可以从FTP或者Powerlink上下载。
从FTP下载链接:
∙针对Windows主机 ftp:
//
∙针对Unix主机,例如AIX,HP-UX,Linux,Solaris,Tru64 ftp:
//
∙针对ESX主机 ftp:
//
∙针对ESXi主机 ftp:
//
∙针对开放VMS主机 ftp:
//
从Powerlink下载路径:
∙登陆Powerlink,到主页 > 支持 > 产品和诊断工具 >Grab应用工具
注解:
如果问题发生在集群服务器(cluster)上,您需要在集群中的每一台主机上收集此日志。
九、CLARiiON硬件及维护指南(九)-EMC售后支持及Powerlink网站介绍
EMC售后支持及Powerlink网站介绍
1.EMC售后支持
可通过下列方式联系EMC售后技术支持:
∙如用固定电话报修,请拔打800-819-0009
∙如用手机报修, 请拔打400-670-0009
∙如通过LiveChat报修,请登录Powerlink后点击上方导航栏中的实时聊天(LiveChat)
依照语音或菜单提示,选择相应的产品线进行报修。
注意:
必须事先准备好序列号,报修时需提供存储序列号,同时请提供具体的故障描述。
如果已知是部件故障,最好能提供故障部件的PartNumber(PN)或SPCollects日志,以便于服务人员准确快捷地为您准备更换部件。
2.EMCPowerlink 网站介绍
a) 注册成功后登陆Powerlink,可免费获取EMC产品相关的各类技术支持文档,界面和网址如下:
b)选择即时聊天工具联系EMC技术支持,下图为实时聊天工具LiveChat入口:
c)将保修需要的日志(如SPCollects,nar/naz日志)、故障的图片或者照片等上传到相应的SR附件中,大大提高诊断问题的效率。
下图为服务请求ServiceRequest管理页面(MySupport):
d)在MySupport中找到正在处理的服务请求号即SRNumber,点击后选择附件Attachments,点击上传: