T8000 Training Docs L24T8000 Release2服务器单板RAID1操作专题V100514B.docx
《T8000 Training Docs L24T8000 Release2服务器单板RAID1操作专题V100514B.docx》由会员分享,可在线阅读,更多相关《T8000 Training Docs L24T8000 Release2服务器单板RAID1操作专题V100514B.docx(25页珍藏版)》请在冰豆网上搜索。
T8000TrainingDocsL24T8000Release2服务器单板RAID1操作专题V100514B
资料编码
产品名称
T8000
使用对象
华为工程师、合作方工程师
产品版本
Release2
编写部门
集成产品部
资料版本
V1.0
T8000Release2服务器板RAID1操作专题
拟制:
王旭波
日期:
2007-05-11
审核:
日期:
审核:
日期:
批准:
日期:
华为技术有限公司
版权所有XX
修订记录
日期
修订版本
描述
作者
2007-5-11
V1.0
初稿完成
王旭波
目录
第1章板载SAS/SATA硬盘RAID1制作指导1
1.1预备知识1
1.1.1硬盘物理位置和SlotNum的关系1
1.1.2服务器板SCSI控制器与硬盘的兼容性2
1.2制作RAID之前的准备工作2
1.2.1检查BIOS的看门狗功能是否关闭3
第2章创建RAID7
2.1进入SAS控制器配置界面7
2.2对两块新硬盘或两块原先没有RAID关系的硬盘的情况8
2.3对一块硬盘有RAID信息而另一块没有的情况17
2.4对两块硬盘分别保存着不同单板RAID信息的情况17
2.5重新打开BIOS的看门狗功能23
第3章FAQ25
3.1删除已有的RAID关系后硬盘数据会不会丢失25
3.2同一块服务器板上能否同时使用SAS硬盘和SATA硬盘25
3.3服务器板是否可以支持RAID0模式25
3.4如何判断RAID1阵列的一块硬盘是否损坏25
3.5在线更换硬盘后如何判断Rebuild完成26
关键词:
RAID、SAS、SATA、Rebuild、USM
摘要:
本文指导工程师如何为BA22/BH22/BH23服务器板板载SAS/SATA硬盘制作RAID1。
缩略语清单:
RAID:
RedundantArrayofIndependentDisks
SAS:
SerialAttachedSCSI
SATA:
SerialATA
USM:
UniversalServerManager
参考资料清单:
《刀片服务器板载SAS(SATA)硬盘RAID1制作指导》,高晓燕
第1章板载SAS/SATA硬盘RAID1制作指导
1.1预备知识
T8000Release2产品共包含3款服务器板,即V200R021(又叫BH23)、V200R022(又叫BH22)、V200R023(又叫BA22),其中BH23前插板支持板载两块2.5寸SAS/SATA硬盘,而BH22和BA22前插板没有设计硬盘槽位,只有通过搭配BR25存储型接口板才能实现板载硬盘的功能。
1.1.1硬盘物理位置和SlotNum的关系
图1-1显示了服务器板BH23的硬盘物理位置和逻辑SlotNum的对应关系,图1-2指出了BR25存储型接口板的物理硬盘位置和逻辑SlotNum的对应关系。
硬盘SlotNum在后续创建RAID1的过程中会涉及到。
图1-1BH23服务器板硬盘位置说明
图1-2BR25存储型接口板硬盘位置说明
1.1.2服务器板SCSI控制器与硬盘的兼容性
BA22/BH22/BH23使用的磁盘控制器芯片是LSI公司推出的LSISAS1064,兼容SAS硬盘和SATA硬盘,SATA硬盘可以直接在BA22/BH22/BH23服务器板中使用,RAID1的制作方法和SAS硬盘相同。
下面以服务器板BH22和SAS硬盘为例介绍板载硬盘RAID1的制作过程,对于BA22/BH23服务器板及SATA硬盘,制作过程是类似的,只是BH23的两块硬盘的SlotNum不是2、3而是0、1。
1.2制作RAID之前的准备工作
T8000服务器板BMC支持看门狗WatchDog功能,在服务器死机或长期失去响应的情况下,BMC将尝试重启或关闭系统。
由于创建RAID1耗时比较长,在创建过程中,BMC会认为单板失去响应,因此可能自动重启服务器板,导致RAID创建失败。
因此进入LSI控制器配置界面创建RAID之前,应该首先进入服务器BIOS中关闭看门狗功能,待RAID创建完毕后再打开。
注意,BH22/BH23/BA22均支持硬盘热插拔,如果单板原本已经创建好RAID1,后续运行过程中硬盘损坏了,需要更换硬盘时,可以直接将故障硬盘拔出并插入一块状态良好的、没有包含别的系统RAID信息的硬盘,LSI控制器将自动在后台进行Rebuild操作恢复RAID1,不会影响业务,也不用重启操作系统进入LSI配置界面,因此也不需要关闭BMC看门狗。
1.2.1检查BIOS的看门狗功能是否关闭
参考如下步骤关闭BMC看门狗:
在刀片服务器板上电时,按照屏幕提示按“Del”键,如图1-3所示:
图1-1POST自检提示
待扫描完设备后进入BIOS配置界面,切换到“Advanced:
界面,如图1-4所示:
图1-2BIOS高级配置
在[Advanced->IPMI1.5Configuration]中将BMCWDTActionForPOST和BMCWDTActionForOSLoader设置为“Disable”,如图1-5所示:
图1-3BIOS看门狗配置
按“F10”键保存退出,如图1-6所示:
图1-4保存并退出BIOS配置
关闭看门狗之后,RAID1创建过程中系统就不会自动重启了。
第2章
创建RAID
本章分3种情况介绍BH22服务器板的RAID制作过程。
2.1进入SAS控制器配置界面
服务器板上电启动后,当屏幕打印如下图所示信息时,按下Ctrl-C键:
图2-1POST时显示SAS控制器
等待进入SAS控制器配置界面,如下图所示,
图2-2等待调用SAS控制器配置
稍候系统进入SAS控制器配置界面,如下图所示:
图2-3SAS控制器配置主界面
直接回车,显示SAS控制器的详细属性,如下图所示:
图2-4SAS控制器属性
在上图所示界面中按“↓”切换到“RAIDProperties”选项并回车,进入“RAIDProperties”界面,在此界面下即可完成RAID创建、删除等工作。
2.2对两块新硬盘或两块原先没有RAID关系的硬盘的情况
如果需要创建RAID的硬盘是两块新硬盘,或者是两块有数据,但之前没有创建RAID关系的硬盘,在图2-4中选择“RAIDProperties”回车后,将进入如下界面:
图2-1选择RAID模式
其中“CreateIMVolume”即表示RAID模式为RAID1。
选择“CreateIMVolume”回车,出现如下图所示界面,
图2-2硬盘选择
使用“→”将高亮区域切换到“RAIDDisk”项,如下图所示,
图2-3硬盘选择
此处必须先设置RAID的主盘。
如果两个硬盘都是新硬盘,则可以任意选择一个SlotNum为主盘;但如果两块硬盘中有一块数据需要保留,则必须先选择这块硬盘为主盘。
此时应注意SlotNum和硬盘物理位置的对应关系,不要把需要保留数据的硬盘设置为从盘了,否则需要保留的数据将会被覆盖。
本例中选择SlotNum为2的硬盘(也就是BR25接口板上面那一块硬盘,参考图1-2)为主盘。
在“RAIDDisk”列的“[No]”字符上按空格键,出现如下图所示提示:
图2-4保留或删除主盘数据警告
此处如果按“D”,将删除两块硬盘上所有的数据,创建一个新的RAID1。
这种方式没有初始化过程,因此速度比较快,如果是两块新硬盘创建新的RAID1,推荐选择这种方式。
如果按“M”,表示保留上一步选定的主盘上的数据,并将其同步到从盘,有初始化过程,速度相对比较慢,如果两块硬盘中需要保留某一块硬盘的数据并将其同步到另一块硬盘时,则需要采用这种方式。
本例中选择保存主盘上的数据,按“M”后返回硬盘选择界面:
图2-5选择硬盘
从“RAIDDisk”栏下面的“[Yes]”可以看到SlotNum为2的硬盘已经被选定为RAID1的成员盘,并且从后面“DriveStatus”栏下面的“Primary”可以看出该硬盘同时被设置为RAID的主盘。
使用“↓”切换到SlotNum为3硬盘的“RAIDDisk”选项,对SlotNum为3的硬盘进行设定。
将高亮区域移动到“[No]”字符上,按空格键,出现如下图所示提示:
图2-6数据覆盖提示警告
上图的警告表示上一步选定的从盘上面已经存在数据,如果创建RAID的话,从盘上的数据将丢失。
确认无误后,按下空格键,返回硬盘选择界面,此时主盘和从盘都已经选择好了。
图2-7硬盘选择(两块硬盘均已选中)
注意,SAS控制器可以自动检测硬盘状态,如果检测到硬盘存在故障,则无法建立RAID1,如下图所示,这时需要更换一块好的硬盘并重新创建。
图2-8硬盘选择(SlotNum为3的硬盘损坏)
如果两块硬盘都没有故障,根据图2-11界面下方的提示,按“C”建立RAID1,将出现下图所示提示,
图2-9确认创建RAID并保存设置
使用“↓”选定“Savechangesthenexitthismenu”,如下图所示,然后回车:
图2-10确认创建RAID并保存设置
保存配置后开始RAID创建过程。
下图显示正在保存设置的过程:
图2-11正在保存配置
稍等几秒钟后,系统自动跳转到“AdapterProperties”,如下图所示:
图2-12SAS控制器属性
此时选择“RAIDProperties”回车将显示同步状态,如下图所示:
图2-13正在同步状态
Status一栏显示了RAID同步的进度。
根据使用的硬盘型号和规格,同步时间会持续20分钟~1个小时(若采用的36GB的SAS硬盘,典型同步时间为20分钟左右)。
界面上还可以看到SlotNum为2的硬盘是Primary主盘,而SlotNum为3的硬盘状态是“NotSyncd”,表示尚未完成同步过程。
同步完成后,Array的Status栏会变成“Optimal”,并且主盘的状态显示为“Primary”,从盘状态显示为“Secondary”,表示RAID已经成功创建,如下图所示:
图2-14同步完成状态
连续按“Esc”键退回LSI控制器主界面。
选择“ExittheConfigurationUtilityReboot”回车,单板将重新启动,如下图所示:
图2-15退出SAS控制器配置界面
至此完成RAID创建过程,可以进行后续的操作系统安装等操作了。
创建RAID1过程中,也可以不等待RAID同步完成,直接退出LSIRAID配置程序,进行系统安装等操作,控制器会在后台自动同步硬盘,但在同步完成前,系统运行速度会比较慢,因此不建议这样操作。
2.3对一块硬盘有RAID信息而另一块没有的情况
如果想要创建RAID的两块硬盘中,有一块原先有RAID信息,另一块是新硬盘(比如原先两块硬盘创建了RAID1,但其中一块硬盘坏掉,或者被人为拔掉,插入了一块新硬盘),这时候不需要做任何操作,只需要把新硬盘直接插入原先拔掉的硬盘的槽位,LSI控制器会自动在后台进行Rebuild操作,直到RAID重新同步完毕。
同步过程中单板的操作系统不需要重启,业务也不会中断,但系统运行速度会比较慢。
注意,如果新插入的硬盘内有数据(但没有RAID信息),LSI控制器同样会执行Rebuild操作,将原有硬盘的信息同步到新插入硬盘,并覆盖新插入硬盘上面的数据。
2.4对两块硬盘分别保存着不同单板RAID信息的情况
在两块硬盘上分别保存了不同的RAID信息的情况下(比如A、B两块服务器板各有两块板载硬盘并且都作了RAID1,假设A板的一块硬盘坏掉了,从B板上直接拔出一块硬盘插入A板坏掉硬盘的槽位),此时由于两块硬盘上面的RAID信息不一致,LSI控制器无法判定用哪一块硬盘作为主盘,因此不会自动在后台执行Rebuild操作,需要用户进入LSI控制器配置界面中删除原有RAID关系,并手工指定主盘,创建RAID。
这种情况下,参考前面章节,进入LSI控制器的“RAIDProperties”选项后,显示界面如下:
图2-1SAS控制器属性
上图中可以看到,两块硬盘的“RAIDDisk”列均显示为“Yes”,可知两块硬盘本身都已包含RAID信息,但“DriveStatus”栏下面的硬盘状态中,有一块硬盘显示为“Missing”,这就是包含另一块服务器板RAID信息的硬盘。
此时选择“ManageArray”回车,出现如下图所示界面:
图2-2管理阵列
使用“↓”切换到“DeleteArray”选项,回车,出现如下图所示的提示信息:
图2-3确认删除原RAID信息
按“Y”,删除原来的RAID关系,出现正在删除RAID信息的提示,如下图所示:
图2-4正在删除原RAID信息
原RAID信息删除后,自动返回到“AdapterProperties”界面,如下图所示:
图2-5SAS控制器属性
再次选中“RAIDProperties”回车,出现下图所示界面:
图2-6管理阵列
接下来删除另外一块硬盘的原RAID信息。
选择“ManageArray”回车,显示如下图所示界面:
图2-7管理阵列
用“↓”切换到“DeleteArray”选项回车,出现下图所示提示,选择“Y”:
图2-8确认删除原RAID信息
显示正在删除第二块硬盘的RAID信息,如下图所示,
图2-9正在删除原RAID信息
两块硬盘的RAID信息都删除后,自动转换到“SelectNewArrayType”界面,如下图所示:
图2-10选择RAID模式
此时即可参照2.2节的指导,重新创建RAID1。
两块硬盘的RAID信息都被删除之后,硬盘上保存的数据并不会丢失,创建过程中仍然应该注意选择主盘,如果主盘设置错误,会导致需要的硬盘上的信息被覆盖!
2.5重新打开BIOS的看门狗功能
RAID创建完毕后,应该重新在服务器板的BIOS中打开WatchDog功能。
在处理器板上电时,按“Del”键,待扫描完设备后会进入BIOS配置界面,切换到“Advanced”界面,如下图所示:
图2-1BIOS高级配置界面
2、在[Advanced->IPMI1.5Configuration]中将BMCWDTActionForPOST设置为“ResetSystem”。
如图2-31和图2-32所示
图2-2BIOS看门狗配置界面
图2-3BIOS看门狗配置界面
打开WatchDog之后,按F10保存设置并退出BIOS,系统自动重启。
至此,制作RAID1的过程全部完成。
第3章
FAQ
本章介绍一些在创建RAID的过程中可能遇到的问题。
3.1删除已有的RAID关系后硬盘数据会不会丢失
如果单板上已经做过RAID1并且安装好了操作系统,然后在LSI控制器配置界面中选择“DeleteArray”删除了RAID,两块硬盘上面的数据均不会丢失,用任何一个硬盘都可以单独启动操作系统(如果两块硬盘都插在单板上,则从SlotNum比较小那块硬盘引导)。
因为“DeleteArray”操作仅删除两块硬盘的RAID关系,并不破坏硬盘数据。
3.2同一块服务器板上能否同时使用SAS硬盘和SATA硬盘
可以,SAS总线是兼容SATA设备的。
但要注意,由于SAS硬盘和SATA硬盘的型号、接口和容量都不相同,因此不能用这两块硬盘来创建RAID。
3.3服务器板是否可以支持RAID0模式
支持。
在图2-5的RAID模式选择界面中,选择“CreateISVolume”就是创建RAID0阵列。
但由于RAID0不支持冗余,一块硬盘损坏将导致阵列上所有数据丢失,因此在实际应用环境中不推荐使用RAID0。
3.4如何判断RAID1阵列的一块硬盘是否损坏
如果安装了USMV1R5软件,可以通过USM中的硬盘监控模块看到硬盘状态,如果状态显示为Optimal表示RAID状态正常,如果显示为Degraded则表示RAID降级,通常是硬盘故障所导致。
如果没有安装USM,有两种方法可以帮助判断硬盘是否损坏。
一是通过LSI控制器配置界面内的硬盘选择界面(如图2-12)查看硬盘状态,如果“DriveStatus”显示为“WrgType”则表示硬盘故障;二是通过观察服务器板前面板的HDD指示灯。
在正常情况下,有数据读写时,两个硬盘指示灯是同步绿色闪烁的,如果发现有一个硬盘指示灯长期不亮或一直亮/闪,则表示该硬盘很可能出现故障。
3.5在线更换硬盘后如何判断Rebuild完成
在LSI控制器配置界面中新建RAID1的话,可以看到同步进度,但如果是在线更换硬盘的情况(比如单板原先已经做过RAID1,并且安装了系统,后来一个硬盘坏掉了,直接拔出故障硬盘,插入新硬盘),可以通过USMV1R5软件的硬盘监控模块来查看具体同步进度。
如果没有安装USM,就只能通过服务器板前面板的硬盘指示灯来观察。
RAID1同步的时候,两个硬盘指示灯应该一直快速闪烁,同步完成之后,指示灯只有在读写硬盘的时候才会闪烁,两种情况比较容易区分。