服务器大数据库维护方案设计Word下载.docx
《服务器大数据库维护方案设计Word下载.docx》由会员分享,可在线阅读,更多相关《服务器大数据库维护方案设计Word下载.docx(30页珍藏版)》请在冰豆网上搜索。
1)了解系统运行状况
2)解决客户系统软件问题
3)系统运行状况分析
4)客户同意前提下安装修正性软件(补丁)。
对于特定的系统安全性修正性软件以及
IBM紧急要求的系统修正性软件可能会被随时安装
5)提供与系统软件相关的技术支持及咨询
二、远程技术支持服务
@@将通过电话和/或其它远程方式帮助@@@集团解决或解答以下与系统有关的日常
运行、安装和使用等问题:
1)系统软件故障解决
2)系统软件使用问题解答
3)远程安装单个PTF或FixPack
4)远程在线诊断
三、现场技术支持
对于通过上述远程技术支持服务方式未能解决或解答的问题,@@将安排工程师提供现场支持。
四、提供修正性软件(PTF或Servicepack)
根据实际情况,为客户免费提供修正性软件(PTF或Servicepack)。
五、系统性能监测
应@@@集团要求,@@可以利用性能监测软件,每月或每季度为用户提供性能分析报告。
报告内容包括:
1)ExecutiveSummary
2)ManagementSummary
3)ResponseTime
4)ResponseTime,LocalTerminal
5)ResponseTime,PC
6)TransactionVolumes
7)TransactionAnalysis
8)Jobs
9)PrintOuts
10)ProcessorUtilization
11)ProcessorUtilization,Trend
12)Memory
13)DiskSpaceUsage
14)DiskArmsUtilization
15)CommunicationLines
16)AdditionalFacts
六、系统小版本(Release)升级
在@@@集团获得合法的系统升级软件后,@@软件将免费协助其进行系统小版本
(Release)升级。
七、其他服务内容
1)提供系统软件操作方面的24小时电话答疑
2)提供系统维护、调整及安全性设置等方面的技术支持
3)对系统软件的错误进行记录、分析,为操作系统做故障诊断
4)实施系统增强和修补程序(ServicePacks&
MaintenanceLevel)的分发、安装和测试
5)辅导掌握系统软件的基本操作,并给予技术支持
6)对系统软件运行实施定期预防性的维护和检查
7)提供系统优化和性能调整
8)提供设备维护、维修记录和报告
2.3数据库系统软件维护
数据库类型的软件维护内容主要包括:
4)客户同意前提下安装数据库补丁。
对于特定的数据库补丁以及紧急修正性补丁可能会被随时安装
5)提供与数据库软件相关的技术支持及咨询
1)数据库软件故障解决
2)数据库软件使用问题解答
3)远程在线诊断
四、提供数据库补丁
根据实际情况,为客户免费提供数据库补丁。
应@@@集团要求,@@可以利用性能监测软件,每月或每季度为用户提供数据库性能分析报告。
13)TableSpaceUsage
14)TOPSQLs
六、数据库小版本(Release)升级
在@@@集团获得合法的系统升级软件后,@@软件将免费协助其进行数据库小版本(Release)升级。
1)制定并执行数据库系统维护计划;
2)数据库系统维护;
3)数据库系统性能调优;
4)数据库平台的维护等;
5)数据灾难恢复;
6)数据库系统升级;
7)定期和不定期撰写数据库运行维护报告等。
2.4网络设备维护
网络设备的维护内容主要包括:
一、设备运行状况检查
1)了解设备运行状况
2)解决网络设备使用问题
3)设备系统运行状况分析
4)客户同意前提下升级网络操作系统或固件版本。
对于特定的IOS或firmware补丁以及紧急修正性补丁可能会被随时安装
5)提供与网络设备相关的技术支持及咨询
@@将通过电话和/或其它远程方式帮助@@@集团解决或解答以下与系统有关的日常运行、安装和使用等问题:
1)网络设备故障解决
2)网络设备使用问题解答
四、提供网络系统补丁
根据实际情况,为客户免费提供网络系统补丁或固件升级。
五、网络系统性能监测
3)ServiceCustomerReport
4)BusinessUnitReport
5)ServiceLevelReport
6)CommunicationsTransportReport
8)ProcessorUtilization
9)ProcessorUtilization,Trend
10)Memory
六、网络系统版本(Release)升级
在@@@集团获得合法的网络系统升级软件后,@@软件将免费协助其进行版本
(Release)升级。
1)维护计划制定;
2)网络设备安全性维护;
3)网络故障处理;
4)网络性能监测;
5)网络线路维护;
6)网络设备系统升级;
7)定期和不定期撰写网络系统运行报告等。
2.5系统巡检服务
@@软件依照用户要求,每周对@@@集团所有的维护服务对象,包括服务器、存储设备、网络设备和系统等各项软硬件进行巡检工作以保障系统稳定运行,提前发现问题和故障。
2.5.1服务器及存储硬件巡检内容
1.外部环境检查机房环境:
温度是否符合要求(10℃-40℃):
□符合要求□不符合湿度是否符合要求(8%-80%):
□符合要求□不符合
电源参数:
相电压:
□符合要求
□不符合
线电压:
零地电压:
2.系统硬件运行情况
控制面板是否正常:
□正常□不正常钥匙是否妥善保存:
□是□否
电源情况:
□正常□不正常
风扇转动情况:
是否有备份电池寿命报警:
□是□否检查设备故障灯是否有亮:
□有□无
有否异常情况(如硬盘、风扇异常的声音,电缆破损):
□有□无备注:
3.检查磁盘阵列(如:
DS4700)状况,并填写下表:
序列号硬盘数量硬盘容量硬盘微码有无HotSpare何种数据保护Fast-WriteCache是否打开
2.5.2操作系统巡检内容
Windows巡检内容
1.操作系统环境操作系统版本:
补丁(ServicePacks)版本:
系统软件包情况:
安装的病毒软件型号和版本:
运行的应用软件的型号和版本:
2.系统运行状态
CPU使用率是否持续大于70%:
硬盘使用率是否大于80%:
□是□否系统日志有没有需要修复的错误:
□是□否有否合符要求的系统备份:
□是□否
最近一次系统备份的时间:
检查各网卡的状态、IP地址、路由表等:
□正常□不正常检查通信状态:
□正常□不正常
病毒库是否最新:
□是□否应用服务是否正常:
□是□否
Administrator密码是否妥善保管:
□是□否是否连接磁盘阵列:
磁盘阵列空间使用情况:
AIX巡检内容
1.操作系统环境操作系统版本:
补丁(ServicePacks和MaintenanceLevel)版本:
系统软件包情况:
2.系统运行状态
有否硬件故障:
(硬件故障检测命令:
#errpt-dH-TPERM
)
有否软件故障:
有否发给root的错误报告:
□有
(软件故障检测命令:
#errpt-dS-TPERM
□无(检查命令:
#mail)
□是□否(检查命令:
#sar110)硬盘使用率是否大于80%:
是否大数据读写都集中在某些硬盘上:
#iostat1)
是否有“stale”状态的逻辑卷:
#lsvg–l<
vgname>
)交换分区使用率是否超过70%:
□是□否(检查命令:
#lsps–s)
有否合符要求的系统备份:
□是□否最近一次系统备份的时间:
磁带机是否需要清洗:
□需要□不需要
(“usr/lpp/diagnostics/bin/utape–cdrmt0–n”查看磁带机使用时数)
检查通信状态:
□正常□不正常(测试命令:
#ping[ipaddress])
3.检测诊断
机器shutdown后以慢启动方式作自检,启动后运行diag系统诊断程序。
系统板、CPU、内存、I/O板:
网卡、SCSI卡、SSA卡:
系统其他扩展卡:
□正常
□不正常
硬盘、磁盘阵列:
磁带机、磁带库:
诊断步骤:
1)#diag
2)Enter
3)选择DiagnosticRoutines4)选择SystemVerification5)选择AllResources6)按F7
输出判断:
结果应为Notroublewasfound。
AS400巡检内容
1.系统记录信息
ProblemLog中是否有必须处理的硬件故障记录
PAL中是否有必须处理的硬件故障记录
SAL中是否有必须处理的硬件故障记录
是否有其它异常信息
是否需要安装与硬件相关的PTF
2.操作系统环境操作系统版本:
PTF版本:
HIPERCUMDB2
是否建议安装新的PTF:
□是□否特许程序状况:
3.系统处理能力表现
CPU使用率是否持续大于70%□是□否
硬盘使用率是否大于80%□是□否系统临时空间的占用是否持续增长□是□否系统中总作业数是否过多□是□否
全部活动作业是否正常□是□否
系统作业是否有异常Joblog□是□否
Spoolfile的数量,建议清理?
□是□否处理器性能是否被收集?
4.系统备份和数据保护
是否有硬盘数据保护,如:
RAID/Mirror
□RAID□Mirror□无保护
是否有一年内,系统最后一次变化后的全备份□是□否是否有一年内,系统最后一次变化后的SAVSYS□是□否是否每天备份用户数据□是□否
是否备份系统配置□是□否
备份磁带是否异地保存□是□否
是否有双机备份,状态是否正常□是□否OS/400QSECOFR密码是否妥善保管□是□否SST/DSTQSECOFR密码是否妥善保管□是□否
2.5.3数据库巡检内容
DB2巡检内容
1.日常维护内容
检查管理服务器是否启动:
检查DB2实例是否启动:
□是□否表空间状态是否正常:
表和索引状态是否正常:
□正常□不正常磁盘空间是否正常:
存储管理软件是否正常:
数据库备份是否正常:
□正常□不正常归档日志是否正常:
缓冲池的命中率是否正常:
□大于95%□低于95%
当前运行最频繁的SQL命中率:
是否有死锁情况:
□是□否表是否需要重组:
2.月巡检内容数据库补丁级别:
DB2日志是否正常,有无Critical错误:
备份和日志是否保存完好:
□是□否数据库性能抓取:
Oracle巡检内容
检查Oracle实例是否启动:
检查OracleRac服务进程是否正常:
□正常□不正常数据库备份是否正常:
Oracle日志是否正常,有无Critical错误:
2.5.4网络设备巡检内容
交换机巡检内容
1.硬件设备检查项
引擎状态指示灯是否正常:
□是
□否
模块状态指示灯是否正常:
端口状态指示灯是否正常:
CPU利用率是否正常:
内存利用率是否正常:
Buffer分配是否正常:
Crash分析是否正常:
有无明显异常Log:
□正常□不正常冗余引擎是否正常:
□正常□不正常冗余电源是否正常:
□正常□不正常
2.交换机链路层检查项
Spantree配置是否正常:
□正常□不正常管理VLAN配置是否正常:
□正常□不正常Trunk配置是否正确:
□正常□不正常VTP配置类型:
交换机管理端口配置:
交换机管理界面是否正常访问:
配置信息备份和日志是否保存完好:
防火墙巡检内容
1.硬件设备检查项
2.防火墙检查项
NAT和静态路由配置是否正常:
□正常□不正常访问规则配置是否正确:
防火墙管理端口配置:
防火墙管理界面是否正常访问:
3巡检报告
3.1硬件环境巡检报告
机房地点用户名称
机柜数量服务器数量
外部环境:
温度是否符合□符合要求□不符合湿度是否符□符合要求□不符合电源参数:
检测项目结果参考值
相电压□符合要求□不符合
线电压□符合要求□不符合
零地电压□符合要求□不符合硬件运行情况:
控制面板是否正常□正常□不正常钥匙是否妥善保存□正常□不正常服务器电源情况□正常□不正常
风扇转动情况□正常□不正常是否有备份电池寿□正常□不正常检查设备故障灯是□正常□不正常
有否异常情况□正常□不正常如硬盘、风扇异常的声音,电缆破损
3.2服务器巡检报告
AIX小型机巡检报告
主机名业务范围
主机型号
序列号
硬件配置:
CPU、内存
硬盘
RAID方式
□RAID0□RAID1□RAID5
OS版本
系统环境检查表
检测项目
结果
参考值
硬件故障
□
有
□无
软件故障
root的错误报告
故障内容:
超额使用的文件系
交换分区使用率
CPU空闲
<
70%
>
20%
□>
□<
系统硬盘空间使用
80%
系统参数设置
系统日期
□正确
□错误
磁带机、磁带库
网络状态
补丁等级
□不正常返回结果:
PC服务器巡检报告
主机名
业务范围
电源冗余
□有
□没有
电源供电
□正常