存储及双活测试方案.docx
《存储及双活测试方案.docx》由会员分享,可在线阅读,更多相关《存储及双活测试方案.docx(28页珍藏版)》请在冰豆网上搜索。
存储及双活测试方案
融通基金
存储升级及双活数据中心项目
测试方案V1.0
深圳市桑威科技有限公司
2016年5月
文档信息
项目名称:
融通基金VPLEXMetro项目测试报告
文档版本号:
1.0
文档作者:
彭世华
生成日期:
2016年5月
文档审核者:
审核日期:
文档维护记录
版本号
维护日期
作者/维护人
描述
1.0
2016年5月12日
彭世华
创建初稿
目录
1.环境配置5
2.测试目的5
3.VPLEX测试环境的建立5
3.1.SANSwitch物理连线5
3.2.SANSwitch配置5
3.3.存储系统配置5
4.测试场景6
5.测试结论7
6.测试步骤及结果8
6.1.测试1:
VPLEX控制器高可用测试8
6.2.测试2:
VPLEX后端链路高可用测试9
6.3.测试3:
双活镜像测试9
6.4.测试4:
VPLEXMetro级联链路高可用测试_110
6.5.测试5:
双活仲裁测试_110
6.6.测试6:
双活仲裁测试_211
6.7.测试7:
双活仲裁测试_311
6.8.测试8:
双活仲裁测试_412
6.9.测试9:
双活仲裁测试_512
6.10.测试10:
双活仲裁测试_613
6.11.测试11:
双活仲裁测试_713
7.场景测试及结果14
7.1.测试场景1:
超算VNX5800故障14
7.2.测试场景2:
汉唐VNX5500故障14
7.3.测试场景3:
所有存储同时故障15
7.4.测试场景4:
Witness发生故障15
7.5.测试场景5:
vplex_1、vplex_2同时故障15
7.6.测试场景6:
vplex_1、vplex_2同时故障,后端存储也同时故障16
7.7.测试场景7:
Witness与vplex_1IP通信中断,其他正常16
7.8.测试场景8:
Witness与vplex_2IP通信中断,其他正常17
7.9.测试场景9:
Witness与vplex_1、vplex2IP通信中断,其他正常17
7.10.测试场景10:
vplex_1、vplex2IP通信中断,但是vplex_1、vplex2各自与witnessIP通信正常18
7.11.测试场景11:
4台FC交换机之间的裸光纤全部故障,其他正常18
7.12.测试场景12:
超算FC交换机故障19
7.13.测试场景13:
汉唐FC交换机故障19
7.14.测试场景14:
所有交换机同时故障20
7.15.测试场景15:
vplex_1与vnx5800光纤链路故障,其它正常20
7.16.测试场景16:
vplex_2与vnx5500光纤链路故障,其它正常21
7.17.测试场景17:
裸光纤全故障,外网LUN在超算起来,内网LUN从汉唐起来21
8.审计意见22
9.讨论反馈后备注22
1.环境配置
硬件:
设备
数量
微码/版本
备注
VPLEXVS2
2
5.5SP2
每个机房配置双引擎
建议安装版本5.5SP2
SANSwitchs
EMCDS6510B\5100B
4
7.2.1c1
用于连接EMCVPLEX和后端存储
现有5100微码需要升级
VNX5800\5400
2
5.33
我们使用全新的VNX5800和5400测试
2
测试主机(待定)
软件:
项目
版本
备注
虚化化
Esxi6.0
物理机
OL6.5
多路径软件
Esxi6.0自带、Powerpath6.0
2.测试目的
测试不同场景下,测试主机对EMC虚拟化存储的访问状况,从而测试EMCVPLEXmetro的高可用性。
3.VPLEX测试环境的建立
3.1.SANSwitch物理连线
完成测试主机到SANSwitch,SANSwitch到测试存储系统之间的光纤连接。
3.2.SANSwitch配置
完成测试主机与测试存储系统之间的ZONE配置。
3.3.存储系统配置
VPLEX将已封装的LUN分配给ESX主机及物理机
4.测试场景
vplex_1、Witness、vnx5800在超算机房,vplex_2、vnx5500在汉唐机房。
测试内容
说明
预期
测试1
VPLEX单个director故障
将一台VPLEX的一个director的光纤线全部断开,观察测试主机的IO路径和IO访问状况
虚拟机不受影响,主机的IO读写能持续进行
测试2
VPLEX后端链路高可用测试
VPLEX的后端链路部分中断
虚拟机不受影响,主机的IO读写能持续进行
测试3
双活镜像测试
后端存储VNX5800发生突然停机
虚拟机不受影响,主机的IO读写能持续进行
测试4
VPLEXMetro级联链路(裸纤)高可用测试_1
VPLEXWAN-com级联链路有一条故障
虚拟机不受影响,主机可以持续读写数据。
测试5
双活仲裁测试1
VPLEXWAN-com级联链路全部故障(Witness正常工作)
虚拟机不受影响,主机可以持续读写数据。
测试6
双活仲裁测试2
关闭VPLEX_2,观察测试主机的IO路径和IO访问状况(Witness正常工作)
虚拟机不受影响,主机可以持续读写数据。
测试7
双活仲裁测试3
关闭VPLEX_1,观察测试主机的IO路径和IO访问状况(Witness正常工作)
虚拟机不受影响,主机可以持续读写数据。
测试8
双活仲裁测试4
关闭Witness,观察测试主机的IO路径和IO访问状况
虚拟机不受影响,主机可以持续读写数据。
测试9
双活仲裁测试5
同时关闭VPLEX_2和Witness
虚拟机不能运行,主机IO挂起,需要在VPLEX_1上手动恢复IO访问
测试10
双活仲裁测试6
同时关闭VPLEX_1和Witness
虚拟机不能运行,主机IO挂起,需要在VPLEX_2上手动恢复IO访问
测试11
双活仲裁测试7
Witness和所有WAN-com(裸纤)全部同时故障
虚拟机不能运行,主机IO挂起,VPLEX_1和VPLEX_2都挂起,需手动选择恢复
测试12
超算VNX5800故障
超算VNX5800故障
测试13
汉唐VNX5500故障
汉唐VNX5800故障
测试14
所有存储同时故障
超算VNX5800与汉唐VNX5500同时故障
测试15
Witness发生故障
Witness发生故障,其它正常
测试16
vplex_1、vplex_2同时故障
vplex_1、vplex_2同时故障,后端存储存活
测试17
vplex_1、vplex_2同时故障,后端存储也同时故障
vplex_1、vplex_2同时故障,后端存储也同时故障
测试18
Witness与vplex_1IP通信中断,其他正常
Witness与vplex_1IP通信中断,其他正常
测试19
Witness与vplex_2IP通信中断,其他正常
Witness与vplex_2IP通信中断,其他正常
测试20
Witness与vplex_1、vplex2IP通信中断,其他正常
Witness与vplex_1、vplex2IP通信中断,其他正常
测试21
vplex_1、vplex2IP通信中断,但是vplex_1、vplex2各自与witnessIP通信正常
vplex_1、vplex2IP通信中断,但是vplex_1、vplex2各自与witnessIP通信正常
测试22
4台FC交换机之间的裸光纤全部故障,其他正常
4台FC交换机之间的裸光纤全部故障,其他正常
测试23
超算FC交换机故障
超算FC交换机故障全部故障
测试24
汉唐FC交换机故障
汉唐FC交换机故障全部故障
测试25
所有交换机同时故障
所有交换机同时故障
测试26
vplex_1与vnx5800光纤链路故障,其它正常
vplex_1与vnx5800光纤链路故障,其它正常
测试27
vplex_2与vnx5500光纤链路故障,其它正常
vplex_2与vnx5500光纤链路故障,其它正常
测试28
裸光纤全故障,外网LUN在超算起来,内网LUN从汉唐起来
裸光纤全故障,外网LUN在超算起来,内网LUN从汉唐起来
测试28
测试29
测试30
测试31
5.测试结论
测试内容
测试结论
测试1
VPLEX控制器高可用测试
测试2
VPLEX后端链路高可用测试
测试3
双活镜像测试
测试4
VPLEXMetro级联链路高可用测试_1
测试5
双活仲裁测试1
测试6
双活仲裁测试2
测试7
双活仲裁测试3
测试8
双活仲裁测试4
测试9
双活仲裁测试5
测试10
双活仲裁测试6
测试11
双活仲裁测试7
6.测试步骤及结果
6.1.测试1:
VPLEX控制器高可用测试
故障模拟:
其中一台VPLEX上的一个director(控制器)突然发生故障
测试方法:
直接rebootdirector或者disable该director在SAN交换机的端口模拟该director故障
此处采用disable端口
初始相关参数:
VPLEX:
auto-resume-at-loser=true
CG:
detach-rule=winnercluster-1after5s
步骤:
1,当前主机访问VPLEXMetro正常
2,确认VPLEX状态正常,确认当前无rebuild任务;
3,断开VPLEX_1的directorA的所有光纤线
4,登录VMWARE管理界面观察,记录结果
5,登录VPLEXGUI和CLI观察,记录结果。
故障恢复:
director重启或者enable交换机中主机与该director的zone模拟该director故障恢复
预期结果:
主机的IO路径中断一半,主机可以继续访问VPLEX_1
测试1记录:
测试1结论:
6.2.测试2:
VPLEX后端链路高可用测试
故障模拟:
VPLEX与后端存储直接的链路出现不稳定或故障
测试方法:
在交换机上disableVPLEX的后端端口(两边非同时)
预期结果:
主机可以继续访问VPLEX,被拔掉的一边后端存储显示失效。
测试记录:
步骤:
1,当前主机访问VPLEXMetro正常
2,确认VPLEX状态正常,确认当前无rebuild任务;
3,登录SAN交换机
4,找到一台VPLEX的后端端口
5,portdisable这些后端端口
6,登录VMWARE管理界面观察,记录结果
7,登录VPLEXGUI和CLI观察,记录结果。
结束时间:
测试2结果:
测试2结论:
6.3.测试3:
双活镜像测试
故障模拟:
VPLEX的后端VNX5800存储突然down机,模拟后端存储完全故障
测试方法:
把VNX5800的前端口在交换机上disable
步骤:
1,当前主机访问VPLEXMetro正常
2,确认VPLEX状态正常,确认当前无rebuild任务;
3,在交换机上将VNX5800存储的端口全部关闭。
4,登录VMWARE管理界面观察,记录结果
5,登录VPLEXGUI和CLI观察,记录结果。
预期结果:
主机正常访问VPLEX,主机端不受任何影响,虚拟机状态正常,虚拟化平台正常,磁盘扫描没有变化,主机到VPLEX路径全部都在
结束时间:
测试3结果:
测试3结论:
6.4.测试4:
VPLEXMetro级联链路高可用测试_1
故障模拟:
VPLEXMetro两个site的WAN-com(裸纤)级联链路出现不稳定
开始时间:
步骤:
1,当前主机访问VPLEXMetro正常
2,确认VPLEX状态正常,确认当前无rebuild任务;
3,断开VPLEX_1的的一个WAN-COM口的光纤线(或disable一条裸纤在交换机上的所有端口)
4,登录VMWARE管理界面观察,记录结果
5,登录VPLEXGUI和CLI观察,记录结果。
结束时间:
测试4结果:
测试4结论:
6.5.测试5:
双活仲裁测试_1
故障模拟:
VPLEXMetro两个site的WAN-com级联链路全部中断
开始时间:
步骤:
1,当前主机访问VPLEXMetro正常
2,确认VPLEX状态正常,确认当前无rebuild任务;
3,断开VPLEX_1的的两个WAN-COM口的光纤线
4,登录VMWARE管理界面观察,记录结果
5,登录VPLEXGUI和CLI观察,记录结果。
结束时间:
测试5结果:
测试5结论:
6.6.测试6:
双活仲裁测试_2
故障模拟:
当Witness工作正常时,模拟一个VPLEX群集故障
开始时间:
步骤:
1,当前主机访问VPLEXMetro正常
2,确认VPLEX状态正常,确认当前无rebuild任务;
3,断开VPLEX_2的的所有接口
4,登录VMWARE管理界面观察,记录结果
5,登录VPLEXGUI和CLI观察,记录结果。
结束时间:
测试6结果:
测试6结论:
6.7.测试7:
双活仲裁测试_3
故障模拟:
当Witness工作正常时,模拟另外一个VPLEX群集(VPLEX_1)故障
开始时间:
步骤:
1,当前主机访问VPLEXMetro正常
2,确认VPLEX状态正常,确认当前无rebuild任务;
3,断开VPLEX_1的的所有接口
4,登录VMWARE管理界面观察,记录结果
5,登录VPLEXGUI和CLI观察,记录结果。
结束时间:
测试7结果:
测试7结论:
6.8.测试8:
双活仲裁测试_4
故障模拟:
当Witness故障时,确认VPLEX群集是否工作正常
开始时间:
步骤:
1,当前主机访问VPLEXMetro正常
2,确认VPLEX状态正常,确认当前无rebuild任务;
3,关闭Witness
4,登录VMWARE管理界面观察,记录结果
5,登录VPLEXGUI和CLI观察,记录结果。
结束时间:
测试8结果:
测试8结论:
6.9.测试9:
双活仲裁测试_5
故障模拟:
一个VPLEX群集(VPLEX_2)和Witness同时故障
开始时间:
步骤:
1,当前主机访问VPLEXMetro正常
2,确认VPLEX状态正常,确认当前无rebuild任务;
3,同时关闭VPLEX_2所有端口和Witness
4,登录VMWARE管理界面观察,记录结果
5,登录VPLEXGUI和CLI观察,记录结果。
结束时间:
测试9结果:
测试9结论:
6.10.测试10:
双活仲裁测试_6
故障模拟:
另外一个VPLEX群集(VPLEX_1)和Witness同时故障
开始时间:
步骤:
1,当前主机访问VPLEXMetro正常
2,确认VPLEX状态正常,确认当前无rebuild任务;
3,同时关闭VPLEX_1所有端口和Witness
4,登录VMWARE管理界面观察,记录结果
5,登录VPLEXGUI和CLI观察,记录结果。
结束时间:
测试10结果:
测试10结论:
6.11.测试11:
双活仲裁测试_7
故障模拟:
所有WAN-com(裸纤)和Witness同时故障
开始时间:
步骤:
1,当前主机访问VPLEXMetro正常
2,确认VPLEX状态正常,确认当前无rebuild任务;
3,同时关闭所有裸纤在光纤交换机上的所有端口和Witness
4,登录VMWARE管理界面观察,记录结果
5,登录VPLEXGUI和CLI观察,记录结果。
结束时间:
测试11结果:
测试11结论:
7.场景测试及结果
7.1.测试场景1:
超算VNX5800故障
场景模拟:
超算VNX5800故障
测试方法:
在交换机上disableVNX5800前端口
预期结果:
主机可以继续访问VPLEX,超算VPLEX显示后端存储故障,所有超算端Volume出错。
测试记录:
测试场景1结果:
测试场景1结论:
7.2.测试场景2:
汉唐VNX5500故障
场景模拟:
汉唐VNX5800故障
测试方法:
在交换机上disable汉唐VNX5500前端口
预期结果:
主机可以继续访问VPLEX,汉唐VPLEX显示后端存储故障,所有汉唐端Volume出错。
测试记录:
测试场景2结果:
测试场景2结论:
7.3.测试场景3:
所有存储同时故障
场景模拟:
所有存储同时故障
测试方法:
在交换机上disableVNX5800及VNX5500前端口
预期结果:
VPLEX系统显示后端存储故障,主机虽然连接VPLEX,但无法读写数据
测试记录:
测试场景3结果:
测试场景3结论:
7.4.测试场景4:
Witness发生故障
场景模拟:
仅Witness发生故障
测试方法:
关闭Witness虚拟机
预期结果:
主机访问VPLEX正常,超算及汊唐Cluster正常,系统提示Witness连接中断。
测试记录:
测试场景4结果:
测试场景4结论:
7.5.测试场景5:
vplex_1、vplex_2同时故障
场景模拟:
vplex_1、vplex_2同时故障
测试方法:
在交换机上Disablevplex_1、vplex_2的所有前端及后端
预期结果:
VPLEX系统显示所有Cluster故障,主机访问中断。
测试记录:
测试场景5结果:
测试场景5结论:
7.6.测试场景6:
vplex_1、vplex_2同时故障,后端存储也同时故障
场景模拟:
vplex_1、vplex_2同时故障,后端存储也同时故障
测试方法:
在交换机上Disablevplex_1、vplex_2的所有前端及后端,Disable所有存储前端
预期结果:
VPLEX系统显示所有Cluster故障,主机访问中断。
测试记录:
测试场景6结果:
测试场景6结论:
7.7.测试场景7:
Witness与vplex_1IP通信中断,其他正常
场景模拟:
Witness与vplex_1IP通信中断,其他正常
测试方法:
拨出超算vplex_1的管理网线
预期结果:
主机访问VPLEX正常,超算及汊唐Cluster正常,系统提示Cluster1的Witness连接中断。
测试记录:
测试场景7结果:
测试场景7结论:
7.8.测试场景8:
Witness与vplex_2IP通信中断,其他正常
场景模拟:
Witness与vplex_2IP通信中断,其他正常
测试方法:
拨出汉唐vplex_2的管理网线
预期结果:
主机访问VPLEX正常,超算及汊唐Cluster正常,系统提示Cluster2的Witness连接中断。
测试记录:
测试场景8结果:
测试场景8结论:
7.9.测试场景9:
Witness与vplex_1、vplex2IP通信中断,其他正常
场景模拟:
Witness与vplex_1、vplex2IP通信中断,其他正常
测试方法:
在虚拟机上断开Witness的网卡连接
预期结果:
主机访问VPLEX正常,超算及汊唐Cluster正常,系统提示Witness连接中断。
。
测试记录:
测试场景9结果:
测试场景9结论:
7.10.测试场景10:
vplex_1、vplex2IP通信中断,但是vplex_1、vplex2各自与witnessIP通信正常
场景模拟:
vplex_1、vplex2IP通信中断,但是vplex_1、vplex2各自与witnessIP通信正常
测试方法:
断开vplex_1、vplex2之间的网络路由
预期结果:
主机访问VPLEX正常,超算及汊唐Cluster正常,系统提示WitnessVPN连接异常。
。
测试记录:
测试场景10结果:
测试场景10结论:
7.11.测试场景11:
4台FC交换机之间的裸光纤全部故障,其他正常
场景模拟:
4台FC交换机之间的裸光纤全部故障,其他正常
测试方法:
Disable所有DS6510与DS5100之间的所有级联端口
预期结果:
超算主机访问VPLEX正常,汉唐主机访问VPLEX故障,VPLEX系统显示ClusterPartition。
测试记录:
测试场景11结果:
测试场景11结论:
7.12.测试场景12:
超算FC交换机故障
场景模拟:
超算2台DS6510交换机故障
测试方法:
关闭超算2台DS6510交换机所有电源
预期结果:
汉唐主机访问VPLEX正常,超算主机访问VPLEX故障,VPLEX系统显示ClusterPartition。
测试记录:
测试场景12结果:
测试场景12结论:
7.13.测试场景13:
汉唐FC交换机故障
场景模拟:
汉唐2台DS5100交换机故障
测试方法:
关闭汉唐2台DS5100交换机所有电源
预期结果:
超算主机访问VPLEX正常,汉唐主机访问VPLEX故障,VPLEX系统显示ClusterPartition。
测试记录:
测试场景13结果:
测试场景13结论:
7.14.测试场景14:
所有交换机同时故障
场景模拟:
4台SAN交换机故障
测试方法:
关闭超算及汉唐4台SAN交换机所有电源
预期结果:
VPLEX系统显示所有Cluster故障,主机访问中断。
测试记录:
测试场景14结果:
测试场景14结论:
7.15.测试场景15:
vplex_1与vnx5800光纤链路故障,其它正常
场景模拟:
vplex_1与vnx5800光纤链路故障,其它正常
测试方法:
Disablevplex_1与vnx5800所在的SAN交换机端口
预期结果:
所有主机可以继续访问VPLEX,VPLEX系统显示ClusterPartition,Cluster1故障,所有超算端Volume出错,。
测试记录:
测试场景15结果:
测试场景15结论:
7.16.测试场景16:
vplex_2与vnx5500光纤链路故障,其它正常
场景模拟:
vplex_2与vnx5500光纤链路故障,其它正常
测试方法:
Disablevplex_2与vnx5500所在的SAN交换机端口
预期结果: