服务器数据库维护方案.docx
《服务器数据库维护方案.docx》由会员分享,可在线阅读,更多相关《服务器数据库维护方案.docx(25页珍藏版)》请在冰豆网上搜索。
![服务器数据库维护方案.docx](https://file1.bdocx.com/fileroot1/2022-12/12/e974fa0b-80aa-4da9-998d-3f59b5c56e54/e974fa0b-80aa-4da9-998d-3f59b5c56e541.gif)
服务器数据库维护方案
服务器及网络系统维护方案
软件系统有限公司
—11—5
1保障维护目标
信息化建设管理中心机房就是各分公司得综合信息网络枢纽,包含多个关键业务系统,同时各个业务网点也运行着多个IT设备,保障这些系统及相关得硬件设备正常运行并对外提供服务就是方案得核心内容。
信息化建设管理中心机房(以下简称中心机房)中包含各个收费系统,核心网络设备等多个关键业务系统,系统得稳定性、高效性、可靠性非常关键。
同时各个分支机构(以下简称分支机构)均包含大量网络设备或服务器等IT设备.以上设备原价值超过3000万元,中心机房收费系统等系统中得有效数据总与近1TB,价值无法估量。
随着集团业务得发展与信息技术得不断进步,中心机房与各分支机构对信息系统与IT设备得稳定要求越来越高。
集团IT设备中,大部分设备得使用年限均超过了设备原厂保修期,基于集团目前得信息设备维护技术力量与人员配备,远远不能满足这种需求,这种缺乏专业维护所致得系统宕机及数据丢失隐患将会严重影响集团在全市业务工作得开展。
维持中心网络设备得正常运转,为集团更好得为广大北京市民进行服务提供高效、稳定、可靠得信息平台与技术保障,有助于提高集团得工作质量、工作效率及良好得社会服务形象,从而更好得为广大市民服务。
2保障维护内容
2.1服务器及存储硬件维护
在现场进行维护得软件得工程师,根据设备得不同状况采取适当得维护服务措施,主要包括:
1)对系统错误进行记录、分析,并实施故障诊断
2) 通知相关负责人携带备件及时进行现场维修、更换
3)对系统板卡、设备得微代码升级
4)采取系统检测诊断(Diagnostic Online/Offline)
5)对设备实行定期得预防性维护
6)提供设备维护、维修记录与报告
7)辅导掌握系统得基本操作,并给予技术支持
8) 为用户提供技术培训、进行经验传授
为了更好得保障集团系统硬件稳定运行,我们将在设备保修得基础上再为如下核心服务器设备购买IBM原厂保修服务,通过双重设备保修,保障集团核心服务器设备硬件故障得到最快速最有效得保障。
设备型号
设备类型
用途
备注
P561
小型机
银企互联系统数据库服务器
ORACLERAC
P561
小型机
银企互联系统数据库服务器
ORACLE RAC
2.2操作系统及软件维护
操作系统类型得软件维护内容主要包括:
一、系统运行状况检查
1)了解系统运行状况
2) 解决客户系统软件问题
3)系统运行状况分析
4)客户同意前提下安装修正性软件(补丁)。
对于特定得系统安全性修正性软件以及IBM紧急要求得系统修正性软件可能会被随时安装
5)提供与系统软件相关得技术支持及咨询
二、远程技术支持服务
将通过电话与/或其它远程方式帮助集团解决或解答以下与系统有关得日常运行、安装与使用等问题:
1)系统软件故障解决
2)系统软件使用问题解答
3)远程安装单个PTF或FixPack
4)远程在线诊断
三、现场技术支持
对于通过上述远程技术支持服务方式未能解决或解答得问题,将安排工程师提供现场支持。
四、提供修正性软件(PTF或Servicepack)
根据实际情况,为客户免费提供修正性软件(PTF或Servicepack).
五、系统性能监测
应集团要求,可以利用性能监测软件,每月或每季度为用户提供性能分析报告。
报告内容包括:
1) Executive Summary
2)ManagementSummary
3) ResponseTime
4)Response Time, Local Terminal
5)Response Time,PC
6)Transaction Volumes
7)TransactionAnalysis
8) Jobs
9)Print Outs
10)ProcessorUtilization
11)ProcessorUtilization, Trend
12)Memory
13)Disk SpaceUsage
14)DiskArmsUtilization
15)municationLines
16) AdditionalFacts
六、系统小版本(Release)升级
在集团获得合法得系统升级软件后,软件将免费协助其进行系统小版本(Release)升级 。
七、其她服务内容
1)提供系统软件操作方面得24小时电话答疑
2)提供系统维护、调整及安全性设置等方面得技术支持
3)对系统软件得错误进行记录、分析,为操作系统做故障诊断
4)实施系统增强与修补程序(ServicePacks&MaintenanceLevel)得分发、安装与测试
5)辅导掌握系统软件得基本操作,并给予技术支持
6)对系统软件运行实施定期预防性得维护与检查
7)提供系统优化与性能调整
8)提供设备维护、维修记录与报告
2.3数据库系统软件维护
数据库类型得软件维护内容主要包括:
一、系统运行状况检查
1)了解系统运行状况
2)解决客户系统软件问题
3) 系统运行状况分析
4)客户同意前提下安装数据库补丁。
对于特定得数据库补丁以及紧急修正性补丁可能会被随时安装
5)提供与数据库软件相关得技术支持及咨询
二、远程技术支持服务
将通过电话与/或其它远程方式帮助集团解决或解答以下与系统有关得日常运行、安装与使用等问题:
1)数据库软件故障解决
2)数据库软件使用问题解答
3)远程在线诊断
三、现场技术支持
对于通过上述远程技术支持服务方式未能解决或解答得问题,将安排工程师提供现场支持。
四、提供数据库补丁
根据实际情况,为客户免费提供数据库补丁。
五、系统性能监测
应集团要求,可以利用性能监测软件,每月或每季度为用户提供数据库性能分析报告。
报告内容包括:
1)ExecutiveSummary
2)ManagementSummary
3) ResponseTime
4)ResponseTime,LocalTerminal
5) ResponseTime,PC
6) TransactionVolumes
7)Transaction Analysis
8)Jobs
9)PrintOuts
10)ProcessorUtilization
11)ProcessorUtilization,Trend
12)Memory
13)TableSpace Usage
14) TOP SQLs
六、数据库小版本(Release)升级
在集团获得合法得系统升级软件后,软件将免费协助其进行数据库小版本(Release)升级。
七、其她服务内容
1)制定并执行数据库系统维护计划;
2)数据库系统维护;
3)数据库系统性能调优;
4)数据库平台得维护等;
5) 数据灾难恢复;
6)数据库系统升级;
7)定期与不定期撰写数据库运行维护报告等。
2.4网络设备维护
网络设备得维护内容主要包括:
一、设备运行状况检查
1) 了解设备运行状况
2)解决网络设备使用问题
3)设备系统运行状况分析
4) 客户同意前提下升级网络操作系统或固件版本.对于特定得IOS或firmware补丁以及紧急修正性补丁可能会被随时安装
5)提供与网络设备相关得技术支持及咨询
二、远程技术支持服务
将通过电话与/或其它远程方式帮助集团解决或解答以下与系统有关得日常运行、安装与使用等问题:
1)网络设备故障解决
2)网络设备使用问题解答
3)远程在线诊断
三、现场技术支持
对于通过上述远程技术支持服务方式未能解决或解答得问题,将安排工程师提供现场支持.
四、提供网络系统补丁
根据实际情况,为客户免费提供网络系统补丁或固件升级。
五、网络系统性能监测
应集团要求,可以利用性能监测软件,每月或每季度为用户提供数据库性能分析报告。
报告内容包括:
1) Executive Summary
2) ManagementSummary
3)ServiceCustomer Report
4)Business UnitReport
5) Service Level Report
6)municationsTransportReport
7) Transaction Analysis
8) ProcessorUtilization
9)ProcessorUtilization, Trend
10)Memory
六、网络系统版本(Release)升级
在集团获得合法得网络系统升级软件后,软件将免费协助其进行版本(Release)升级。
七、其她服务内容
1)维护计划制定;
2) 网络设备安全性维护;
3)网络故障处理;
4)网络性能监测;
5)网络线路维护;
6)网络设备系统升级;
7) 定期与不定期撰写网络系统运行报告等。
2.5系统巡检服务
软件依照用户要求,每周对集团所有得维护服务对象,包括服务器、存储设备、网络设备与系统等各项软硬件进行巡检工作以保障系统稳定运行,提前发现问题与故障。
2.5.1服务器及存储硬件巡检内容
1。
外部环境检查
机房环境:
温度就是否符合要求(10℃-40℃):
□符合要求 □ 不符合
湿度就是否符合要求(8%-80%):
□符合要求□不符合
电源参数:
相电压:
□ 符合要求□不符合
线电 压:
□符合要求□不符合
零地电压:
□ 符合要求□不符合
2。
系统硬件运行情况
控制面板就是否正常:
□ 正常□ 不正常
钥匙就是否妥善保存:
□就是 □ 否
电源情况:
□ 正常□不正常
风扇转动情况:
□ 正常□不正常
就是否有备份电池寿命报警:
□就是 □否
检查设备故障灯就是否有亮:
□ 有□ 无
有否异常情况(如硬盘、风扇异常得声音,电缆破损):
□有 □无
备注:
3.检查磁盘阵列(如:
DS4700)状况,并填写下表:
序列号硬盘数量硬盘容量硬盘微码有无HotSpare何种数据保护Fast-WriteCache就是否打开
2.5.2操作系统巡检内容
❒Windows巡检内容
1。
操作系统环境
操作系统版本:
补丁(ServicePacks)版本:
系统软件包情况:
安装得病毒软件型号与版本:
运行得应用软件得型号与版本:
2.系统运行状态
CPU使用率就是否持续大于70%:
□就是□否
硬盘使用率就是否大于80%:
□就是□否
系统日志有没有需要修复得错误:
□就是 □否
有否合符要求得系统备份:
□就是□ 否
最近一次系统备份得时间:
检查各网卡得状态、IP地址、路由表等:
□正常 □不正常
检查通信状态:
□正常□不正常
病毒库就是否最新:
□就是 □否
应用服务就是否正常:
□就是 □否
Administrator密码就是否妥善保管:
□ 就是□ 否
就是否连接磁盘阵列:
□就是□否
磁盘阵列空间使用情况:
❒AIX巡检内容
1.操作系统环境
操作系统版本:
补丁(ServicePacks与MaintenanceLevel)版本:
系统软件包情况:
2.系统运行状态
有否硬件故障:
□有 □ 无 (硬件故障检测命令:
#errpt—dH—TPERM)
有否软件故障:
□ 有□无 (软件故障检测命令:
#errpt—d S -T PERM)
有否发给root得错误报告:
□有□ 无 (检查命令:
#mail)
CPU使用率就是否持续大于70%:
□就是 □ 否 (检查命令:
#sar1 10)
硬盘使用率 就是否大于80%:
□就是□ 否
就是否大数据读写都集中在某些硬盘上:
□就是□否(检查命令:
#iostat1)
就是否有“stale”状态得逻辑卷:
□就是□否 (检查命令:
#lsvg–l 交换分区使用率就是否超过70%:
□就是□否 (检查命令:
#lsps –s)
有否合符要求得系统备份:
□就是□否
最近一次系统备份得时间:
磁带机就是否需要清洗:
□需要 □不需要
(“usr/lpp/diagnostics/bin/utape–cdrmt0–n”查瞧磁带机使用时数)
检查各网卡得状态、IP地址、路由表等:
□正常□不正常
检查通信状态:
□正常□不正常 (测试命令:
#ping[ip address])
3.检测诊断
机器shutdown后以慢启动方式作自检,启动后运行diag系统诊断程序。
系统板、CPU、内存、I/O板:
□正常□不正常
网卡、SCSI卡、SSA卡:
□正常□不正常
系统其她扩展卡:
□正常 □不正常
硬盘、磁盘阵列:
□ 正常 □ 不正常
磁带机、磁带库:
□ 正常□不正常
诊断步骤:
1)#diag
2)Enter
3)选择DiagnosticRoutines
4)选择SystemVerification
5)选择AllResources
6)按F7
输出判断:
结果应为Notrouble wasfound。
❒AS400巡检内容
1.系统记录信息
ProblemLog中就是否有必须处理得硬件故障记录
□就是□ 否
PAL中就是否有必须处理得硬件故障记录
□ 就是□否
SAL中就是否有必须处理得硬件故障记录
□ 就是□否
就是否有其它异常信息
□就是□否
就是否需要安装与硬件相关得PTF
□就是□否
2.操作系统环境
操作系统版本:
PTF版本:
HIPER CUM DB2
就是否建议安装新得PTF:
□ 就是□否
特许程序状况:
□正常□不正常
3.系统处理能力表现
CPU使用率就是否持续大于70%□就是□ 否
硬盘使用率 就是否大于80%□ 就是 □否
系统临时空间得占用就是否持续增长 □就是 □否
系统中总作业数 就是否过多□就是 □否
全部活动作业就是否正常□就是□否
系统作业就是否有异常Joblog□就是□否
Spool file得数量 ,建议清理?
□就是 □否
处理器性能就是否被收集?
□就是□否
4。
系统备份与数据保护
就是否有硬盘数据保护,如:
RAID/Mirror
□RAID□Mirror□无保护
就是否有一年内,系统最后一次变化后得全备份□就是□ 否
就是否有一年内,系统最后一次变化后得SAVSYS □就是□否
就是否每天备份用户数据 □就是□否
就是否备份系统配置 □就是 □否
备份磁带就是否异地保存□就是□否
就是否有双机备份,状态就是否正常 □就是□否
OS/400QSECOFR密码就是否妥善保管 □就是□否
SST/DSTQSECOFR密码就是否妥善保管 □就是□否
2.5.3数据库巡检内容
❒DB2巡检内容
1。
日常维护内容
检查管理服务器就是否启动:
□就是 □否
检查DB2实例就是否启动:
□就是□否
表空间状态就是否正常:
□ 正常 □ 不正常
表与索引状态就是否正常:
□正常□ 不正常
磁盘空间就是否正常:
□ 正常□不正常
存储管理软件就是否正常:
□ 正常□ 不正常
数据库备份就是否正常:
□正常□不正常
归档日志就是否正常:
□正常 □ 不正常
缓冲池得命中率就是否正常:
□大于95% □低于95%
当前运行最频繁得SQL命中率:
□大于95%□低于95%
就是否有死锁情况:
□ 就是 □ 否
表就是否需要重组:
□就是□否
2。
月巡检内容
数据库补丁级别:
DB2日志就是否正常,有无Critical错误:
□就是 □否
备份与日志就是否保存完好:
□就是□否
数据库性能抓取:
□ 正常□不正常
❒Oracle巡检内容
1。
日常维护内容
检查管理服务器就是否启动:
□就是□否
检查Oracle实例就是否启动:
□就是 □ 否
检查OracleRac服务进程就是否正常:
□ 就是□否
表空间状态就是否正常:
□正常□不正常
表与索引状态就是否正常:
□正常□不正常
磁盘空间就是否正常:
□正常□不正常
存储管理软件就是否正常:
□正常□不正常
数据库备份就是否正常:
□正常□不正常
归档日志就是否正常:
□正常□不正常
缓冲池得命中率就是否正常:
□大于95%□低于95%
当前运行最频繁得SQL命中率:
□ 大于95%□低于95%
就是否有死锁情况:
□就是□否
表就是否需要重组:
□就是□否
2。
月巡检内容
数据库补丁级别:
Oracle日志就是否正常,有无Critical错误:
□就是 □否
备份与日志就是否保存完好:
□就是□否
数据库性能抓取:
□正常□不正常
2.5.4网络设备巡检内容
❒交换机巡检内容
1.硬件设备检查项
引擎状态指示灯就是否正常:
□就是 □ 否
模块状态指示灯就是否正常:
□ 就是□否
端口状态指示灯就是否正常:
□就是□否
CPU利用率就是否正常:
□正常 □不正常
内存利用率就是否正常:
□正常 □不正常
Buffer分配就是否正常:
□正常□不正常
Crash分析就是否正常:
□正常 □不正常
有无明显异常Log:
□正常□不正常
冗余引擎就是否正常:
□ 正常 □ 不正常
冗余电源就是否正常:
□ 正常□不正常
2。
交换机链路层检查项
Spantree配置就是否正常:
□正常□ 不正常
管理VLAN配置就是否正常:
□正常□不正常
Trunk配置就是否正确:
□正常□不正常
VTP配置类型:
交换机管理端口配置:
交换机管理界面就是否正常访问:
□就是□否
配置信息备份与日志就是否保存完好:
□就是 □否
❒防火墙巡检内容
1。
硬件设备检查项
引擎状态指示灯就是否正常:
□就是□ 否
模块状态指示灯就是否正常:
□就是□否
端口状态指示灯就是否正常:
□就是□否
CPU利用率就是否正常:
□ 正常□不正常
内存利用率就是否正常:
□ 正常□不正常
Buffer分配就是否正常:
□ 正常□ 不正常
Crash分析就是否正常:
□ 正常□ 不正常
有无明显异常Log:
□正常 □不正常
冗余引擎就是否正常:
□正常□ 不正常
冗余电源就是否正常:
□正常□不正常
2.防火墙检查项
NAT与静态路由配置就是否正常:
□ 正常□不正常
访问规则配置就是否正确:
□正常 □不正常
防火墙管理端口配置:
防火墙管理界面就是否正常访问:
□就是□否
配置信息备份与日志就是否保存完好:
□就是□否
3巡检报告
3.1硬件环境巡检报告
机房地点
用户名称
机柜数量
服务器数量
外部环境:
温度就是否符合要求
□符合要求□不符合
湿度就是否符合要求
□ 符合要求 □ 不符合
电源参数:
检测项目
结果
参考值
相电压
□符合要求□不符合
线电 压
□ 符合要求□ 不符合
零地电压
□ 符合要求□不符合
硬件运行情况:
控制面板就是否正常
□ 正常□不正常
钥匙就是否妥善保存
□ 正常□不正常
服务器电源情况
□正常□不正常
风扇转动情况
□正常□不正常
就是否有备份电池寿命报