XX系统巡检方案-xxx年度xx巡检报告Word下载.doc
《XX系统巡检方案-xxx年度xx巡检报告Word下载.doc》由会员分享,可在线阅读,更多相关《XX系统巡检方案-xxx年度xx巡检报告Word下载.doc(15页珍藏版)》请在冰豆网上搜索。
2.2 应用服务器检查内容 7
2.3 应用服务器检查总结 9
3 XX系统业务检查 9
3.1 业务检查内容 9
3.2 业务检查总结 10
4 XX系统特色检查 11
4.1日终批次情况检查 11
4.2业务统计检查 12
5网络通讯部分 13
5.1网络通信检查内容 13
5.2网络通信检查总结 13
6热备/冷备部分 13
6.1热备/冷备检查内容 13
6.2热备/冷备检查总结 13
7系统性能评估 14
一、概述
合同名称:
合同编号:
巡检地点:
巡检人员:
巡检时间及安排:
2
巡检目标:
检查XX系统
本期巡检重点:
1、检查数据库参数,是否有问题。
2、检查应用服务器状况是否正常。
3、监控系统的日常运行,包括操作系统,数据库,应用服务,网络。
4、监控一线操作人员登陆业务系统,业务使用系统情况。
5、检查服务器可用资源,包括内存,CPU,磁盘的使用情况,以及数据的备份情况。
建议:
在非业务时间(19:
00-24:
00之间)操作
应用服务器(A、B机分别执行)ap.bat,
数据库服务器db.bat、db_stat.bat、yw.bat、ts.bat
二、巡检方案
1数据库方面
1.1数据库服务器(硬件)基本信息:
序号
项目名称
检查方法
参考值
实际结果
1
机器名
登录数据库服务器,执行db.bat脚本中的命令ipconfig/all,在网络信息中查看机器名
DongChanYW-db1
2
用途(生产,测试,开发)
生产
3
所在城市,物理位置(机房,远程)
机房
4
硬件供货商
IBM
5
型号
IBM,9133-55A
IBM,8233-E8B
6
操作系统
登录数据库服务器,执行db.bat脚本中的命令ver
Windows_NT
7
操作系统版本
登录数据库服务器,执行db.bat脚本中的命令echo%OS%
MicrosoftWindows[版本6.1.7601]
8
内存
登录数据库服务器,打开任务管理器,选择性能标签页
7936MB
8191MB
9
CPU个数
登录数据库服务器,打开任务管理器,选择性能标签页
10
剩余磁盘空间(in%)
登录数据库服务器,命令行打开diskmgmt.msc查看磁盘使用情况
卷文件系统状态 可用
C:
NTFS状态良好30%
卷文件系统状态 可用
NTFS状态良好30%
系统保留NTFS状态良好74%
E:
NTFS状态良好60%
11
处理器数(由实例使用)
打开SQLServer服务器面板查看
12
总服务器内存(KB)
3147776
13
可用性需求(系统使用时间)
正常
1.2数据库配置
生产库:
实例名
打开SQLServer服务器面板,查看实例名称
DONGCHANYW-DB1
数据库名
SCFDB
版本
打开SQLServer服务器面板,查看数据库版本
10.50.1600.1
表空间信息
执行db_stat.bat脚本
1.3数据库检查内容
检查项目方法
检查项目描述
打开sqlserver管理面板,选择日志,检查数据库日志文件中是否有系统错误信息。
查看sqlserverlog_日期.log文件中11月31日后是否有错误码,要查看错误码的相关解释可参考sqlserver帮助文档
检查表空间使用情况,评估数据库表空间的使用情况
方法:
执行命令后可查看到保留空间、使用空间、索引使用空间、未用空间
检查每晚的备份是否成功
目前采用虚拟机整机备份,检查备份是否正常
备份正常。
监控数据库性能:
执行db_stat_connection.bat,统计物理连接数情况,
执行db_stat_lock.bat,检查是否存在死锁,并解锁
主要关注以下几项:
1、查看物理连接数是否在正常范围内
2、检查是否存在死锁
在业务高峰期取6次快照得到以下结论:
1、当前连接的应用程序的最大连接数48在系统范围设置范围内(0-90)
2、未检测到死锁。
在业务高峰期取6次快照得到以下结论:
1、当前连接的应用程序的最大连接数23在系统范围设置范围内(0-103)
2、未检测到死锁
检查数据库配置信息:
执行db.bat脚本
通过提取的配置信息,结合数据库表空间使用情况,分析数据库是否满足目前的系统要求。
检查数据库基础数据方法:
执行base_data.bat脚本
通过提取的基础数据,结合业务配置流程等,分析基础数据是否满足目前的系统要求
经过检测分析得到如下结论:
查看业务繁忙时数据库cpu及内存使用情况
打开命令行,输入taskmgr.exe,打开任务管理器,选择“性能”标签项,并截图保存(根据统计语句获得业务系统统计的数据量得到每天的业务高峰时间段,在这个时间段内执行6次)。
cpu的平均使用率低于30%。
1.4数据库检查总结
通过对收集到的数据库信息分析得出以下结论:
1、关于数据库连接数,本系统web服务器was设置的最大数据库连接数为100个,而目前业务高峰期的数据库最大连接数为20个,也就是在当前业务高峰期间,数据库的最大连接数只占到系统设置的20%左右,完全满足系统业务需求。
2、未检测到有死锁现象,数据库运行良好。
2应用服务器方面
2.1应用服务器(硬件)基本信息:
参考值
登录应用服务器,执行ap.bat脚本中的ipconfig/all,在网络信息中查看机器名
DongChanYW-app1
登录应用服务器,执行ap.bat脚本中的命令echo%OS%
Windows_NT
登录应用服务器,执行ap.bat脚本中的命令ver
登录应用服务器,打开任务管理器性能标签
4095MB
NTFS状态良好79%
系统保留NTFS状态良好72%
NTFS状态良好94%
13*7
2.2应用服务器检查内容
检查所有应用服务器标准输出和错误输出日志。
查看错误日志(E:
/IBM/WebSphere/AppServer/profiles/AppSrv01/logs/server1/ScfOut.log)中是否有错误代码,如果存在,根据日志中错误信息检查
检查是否存在错误日志
查看业务繁忙时应用服务器的CPU以及内存使用情况。
打开命令行,输入taskmgr.exe,打开任务管理器,选择“性能”标签项,并截图保存。
根据统计语句获得业务系统统计的数据量得到每天的业务高峰时间段,在这个时间段内执行6次(根据统计语句获得业务系统统计的数据量得到每天的业务高峰时间段,在这个时间段内执行数次)。
打开任务管理器性能页面,查看系统资源使用情况是否正常
CPU的平均使用率低于30%。
查看应用服务器进程状态
执行ap.bat脚本中的
%SystemRoot%/system32/tasklist
查看当前是否有was进程在运行
主要参数/配置
1、Websphere服务器处理线程数。
打开管理控制台,依次打开目录树,应用程序服务器>
server1>
线程池>
WebContainer,查看最大大小
2、JVM虚拟机堆大小,服务器->
应用程序服务器->
server1->
进程定义->
java虚拟机,查看初始堆大小和最大堆大小的值
3、Web容器传输链,应用程序服务器>
Web容器传输链>
WCInboundDefault>
HTTP入站通道(HTTP_2),查看最大持久请求数
4、数据源->
MicrosoftSQLServerJDBCDriverApp1
查看连接数据库的服务器的IP地址,并点“测试连接”,连接成功;
点“连接池属性”,查看最大连接数
检查Web容器线程池大小、Java虚拟机堆大小、
每个连接最大持久请求数、数据库连接池最大连接数
1、Web容器线程池50
2、Java虚拟机堆大小256M-1024M
3、Web容器最大持久请求数100
4、数据库连接池最大连接数100
1、Web容器线程池50
2.3应用服务器检查总结
通过应用服务器检查分析得出以下结论:
应用服务器各项检查正常。
3XX系统业务检查
3.1业务检查内容
1、非业务时间(建议在19:
00之间),登录数据库服务器执行以下脚本:
: