1、系统健康检查服务方案设施健康检查计划XX企业股份有限企业2009 年序言 .错误 ! 不决义书签。1.服务概略 .错误 ! 不决义书签。客户名称 . .错误 !不决义书签。服务时间 . .错误 !不决义书签。服务设施 . .错误 !不决义书签。服务内容 . .错误 !不决义书签。2.服务先期准备工作 .错误 ! 不决义书签。巡检服务的先期准备工作: . .错误 !不决义书签。客户方的先期准备工作: . .错误 !不决义书签。两方待议论和磋商的问题: . .错误 !不决义书签。3.服务详细计划 .错误 ! 不决义书签。4.应急计划 .错误 ! 不决义书签。5备件计划 .错误 ! 不决义书签。6.
2、文档信息 .错误 ! 不决义书签。附录 .错误 ! 不决义书签。SUN系统巡检报告及有关命令说明.错误 !不决义书签。ORACLE数据库巡检报告及有关命令说明.错误 !不决义书签。系统配置信息 . .错误 !不决义书签。ORACLE数据库系统保护检查报告 . .错误 !不决义书签。序言感谢敬爱的广东 XXX用户选择了 XXX的服务, XXX企业秉着用户至上主旨,坚持以技术为先导,严格依据项目流程和规范管理服务项目 , 竭诚为用户供应一流优良的服务。本文档的主要内容是对客户信息系统进行系统健康检查 (简称:巡检)的计划安排。包含服务概略、服务先期准备工作、服务详细计划、应急计划等等。1.服务概略
3、客户名称广东 XXX服务时间待定服务设施见设施清单服务内容系统健康检测保护服务的目的在于认识被巡检系统截止到目前系统的性能状态和存在的隐患和运转风险;检查系统的运转状况、 系统配置和连结方式、 系统设置的状况、 系统使用环境的及系统的日记文件, 进行系统的自检和检测, 剖析已经发现的和潜伏的问题, 建议必需的举措,提升系统的可用性和靠谱性。内容包含以下:检查设施使用环境能否切合要乞降发生显着更改,包含湿度、电压、湿度、陈设地点等检查电源,信号线的连结能否坚固;检查、洁净、调理系统硬件,并为需要的设施改换元件;检查系统的硬件和系统环境配置及网络环境配置;针对客户系统现状,提出建讲和建议。查阅有关
4、系统信息,检查有无犯错信息,如发现犯错信息,想法认识问题原由,并后续给出问题的可能原由和解决建议。进行系统剖析和检测,实时掌握系统的运转和安全状况,发现系统潜伏问题,清除故障隐患和安全 ?破绽。在达成系统健康检测后, XXX服务工程师将会同 XXX技术专家团队一同剖析系统状况,并内向客户提交巡检剖析报告和有关改良举措建议。2.服务先期准备工作巡检服务的先期准备工作:1负责提交巡检方案,获取客户认同2负责准备巡检报告模板 2 份,巡检报告模板请见附录。(注:一机一份,巡检完成后,现场提交用户)3供应服务的工程师在约准时间准时抵达现场客户方的先期准备工作:1负责环境、场所、电源、网线、终端设施等准
5、备工作。2负责供应系统主机 Root 登岸口令(清单)。3负责供应系统设施 IP 地址(清单)。4负责下电设施的加电准备工作5负责确立下电设施加电后的连网状况两方待议论和磋商的问题:1Root 口令以何种方式供应一般可采纳两种方式,一是每台设施由客户来输入 Root 口令,此外一种方式是由客户预先暂时改正 Root 口令,供应给服务工程师,巡检完成后再由客户改回。2下电设施加电后,能否仍旧具备连网条件假以下电设施加电后不连结网络,则需要采纳串口直接连结主机的方式来进行巡检,可能会影响巡检整体速度。3确立巡检主机次序系统健康检测不会影响在线设施的运转。建议巡检次序为,第一用一台终端挨次检测全部连
6、网设施,包含加电后能连网的设施,其次检测全部加电后没法连网的设施。3.服务详细计划任务名称 XXX责任人 客 户 方 计划连续配 合 人时间员步骤 1.1服务工程师认识现场机房服务工程师约 40分钟现 场 环环境状况境 勘 察2服务工程师在开始实行巡服务工程师以 及 用检时,向客户认识自前一次户沟通保护服务以来所发现的异常和问题,并采纳必需的措施3在对系统采纳任何行动之服务工程师前,保证已经采纳必需的数据信息保护举措, 如系统的备份或数据转存等;步骤 2.4服务工程师采集与所服务服务工程师约一到二巡 检 服的系统有关的系统更改、 微个工作日务码公布、软件升级、软件PATCH公布和系统问题的信息
7、和资料5挨次依据巡检内容对系统服务工程师设施进行逐项巡检, 并填写巡检报告6巡检过程中假如发现任何服务销售系统问题,两方将协调办理7巡检过程中假如发现任何服务销售突发事件,请参照本文档 5。步骤 3.8提交现场巡检报告, 客户签服务工程师大概1个服 务 收字小时尾工作9请客户填写服务满意度评价表10两方沟通服务工程师11五个工作日内提交巡检分服务工程师-析报告4.应急计划本次巡检服务中的设施为在线系统, 理论上讲,巡检不过对系统状态进行查察, 自己不会对系统产生影响, 不过在很少量状况下, 系统自己已经有故障隐患, 由于巡检触发,可能会影响系统的运转, 一定经过预先充足准备 , 辨别可能的风险
8、 , 并进行躲避和控制。经过以下方法来尽可能减少风险:服务工程师在开始实行巡检时, 应第一向客户认识自前一次保护服务以来所发现的异样和问题,并采纳必需的举措在对系统采纳任何行动以前, 应保证已经采纳必需的数据信息保护举措,如系统的备份或数据转存等;服务工程师在巡检过程中记录操作步骤,一旦发生突提问题,也有据可查,方便问题的定位。服务工程师在巡检过程中假如发现设施有重要问题,一定赶快进行办理的事件,由现场巡检工程师向本次用户通告,由用户同 XXX服务销售进行磋商进行办理。5备件计划针对本次健康检查服务, 我方主要供应对 SUN系统以及 ORACLE数据库的检查服务为主,假如在检查过程中, 发现有
9、备件坏, 我们会第一时间跟用户通告, 并从 XXX广州备件库调相应备件进行改换;假如备件改换处于合同覆盖范围, 我们将不收取备件花费, 假如合同未覆盖, 我们将收取备件物料成本费;为此次检查服务准备的备件清单包含但不限于:型号描绘数目Sun V480 整机带 cpu, 内存 , 硬盘1X6805A,10000 RPM 硬盘4ST3310带控制器 , 无硬盘1XTA-SC1NC-73G10K73GB,3310 阵列硬盘4XTA-SC1NC-146G10K73GB,3310 阵列硬盘46.文档信息本文档由 XXX负责草拟附录SUN系统巡检报告及有关命令说明ORACLE数据库巡检报告及有关命令说明系
10、统配置信息SUN系统巡检报告日期: 年 月 日 报告编号:客户名称 检查地址主机型号 IP 地址主机 SN Host ID零件型号/ 数目零件型号/数目CPU主板配CPU/内存板内存硬盘I/O 板置显卡储存阵列电源磁带驱动器SCSI型号外扩网卡型号其余卡型号系统盘 Raid 状况管理软件名称版本RAID种类检查项目结果不正常请注明原由检查项目结果不正常请注明原由显示器正常不正光驱正常不正常常硬键盘正常不正软驱正常不正常常件鼠标正常不正线缆正常不正常常磁带机正常不正板卡正常不正常常检查项目内容结果不正常请注明原由系统指示灯状态Front Panel LEDS正常 不正常Power Supply
11、LEDSDisk LEDSSystem Controller Board LEDS(CPU/Memory 、I/O etc.)正常 不正常正常 不正常正常 不正常系统 messages 信 cd /var/adm系 息 grep WARN messages*grep error messages*grep panic messages*统/var/adm/messages/var/adm/var/adm/var/adm/var/adm/正常 不正常正常 不正常正常 不正常正常 不正常正常 不正常硬件运转状态/usr/platform/sun4u/sbin/prtdiag -v正常不正常文件系统
12、利用率df k/利用率%正常不正常/usr利用率%正常不正常df o i/var利用率%正常不正常其余分区正常不正常Ionde 利用率(能否有安闲)正常不正常Swap分区swap susedk availablek正常不正常CPU负载sar 1 10% idle正常不正常内存节余量vmstat 1KBytes正常不正常I/O 资源iostatEn正常不正常网络接口流量netstati 1正常不正常网口以及 IP 状态ifconfig -a正常不正常网络传输率ping 网关 (1 分钟)averagems正常不正常NTP状态ntpq -p正常不正常远程登录设置/etc/ftp开启封闭telnet
13、开启封闭进度总数ps ef|wc -l个进度核心 Patch 版本uname aDisk Suite状态metastat输出结果能否正常正常不正常冗( 没有的不填 )metadbMetadb 成立在有个备份余vxdisk list输出结果能否正常正常不正常软Volume Managervxdg list有磁盘组件状态(没有的不填)Vxprint -ht输出结果能否正常正常不正常高版本可scstat输出结果能否正常正常不正常用SunCluster状态性软备注件存外观及指示灯能否正常正常不正常储ST3310阵列show-config输出结果能否正常正常不正常固件版本SUN主机巡检有关命令及说明检查
14、项目使用的命令及有关目录内容及其说明外观检查无检查机器的指示灯状况、看有无故障指示主机的整体情经过该命令,能够查察到CPU的数/usr/platform/sun4u/sbin/prtdiag -v量、主频、 CACHE大小, 内存、 板卡、况电扇转速、环境温度等状况能够查察到文件系统的挂接、使用量等状况, 假如某个文件系统使用大于查察文件系统df -k85%,则要提请注意,大于90%则要挂接状况对其进行清理, 删除废文件, 假如根文件系统使用量达到100%,会造成系统崩溃grep panic /var/adm/messages*检查系统日记grep error /var/adm/message
15、s*文件grep WARN /var/adm/messages*检查 CPU使用sar 1 10状况互换分区使用swap -s状况内存使用状况 vmstat 1硬盘数目及容量format硬盘及其余存iostat -E储设施的状况网络状况netstat -i 1网络的 IP 设置ifconfig -a查察操作系统uname -a的核心版本主机的厂商 IDhostid号统计系统目前ps -ef |wc -l进度数目远程登录设置grep ftp /etc/greptelnet /etc/网络流通状况ping检查 SUNCLUSTER管理scstat的双机系统状态经过 Web方式管理 SUNCLUST
16、ER双机检查系统的日记文件, 看有无 panic 、 error 、WARN等和错误有关的重点字,此中, panic 重点字一般出此刻操作系统因软件或硬件故障崩溃的时候, error 则是系统因软件或硬件产生了错误, WARN则相对关注级别较低,属于警示, 这 2 种状况, 都要依据系统的日记提示, 进一步检查系统状况检查 CPU的 IDEL 值,越大越好,这里给出的命令是指间隔 1 秒,检查10次查察互换区 (即虚构内存) 的使用状况检查内存的使用状况, 特别检查此中的节余内存量, 如内存节余过少, 则要检查进度及应用的状况,如无异常,则意味着系统需要更多的物理内存经过该命令, 能够查察到硬
17、盘的容量大小、数目等状况,这个命令能够看到硬盘的运转状况,包含:厂商、序列号,有无运转错误等查察网络的包吞吐状况以及矛盾、 包错误率等状况查察系统中的 IP 地址设置该命令除了能查察到操作系统的核心版本外, 还能够查察到主机的硬件型号能够查察到厂商为主机设置的独一ID能够查察到系统目行进度数目能够查察系统的远程登录能否翻开ping 网络中的另一设施,往常是缺省网关, 以检查网络的流通延时状况该命令能够显示 SUNCLUSTER双机系统的和配置、状态有关的信息经过阅读其,输入主机的 IP 地址,端口号为 3000 ,能够经过 Web的方式管理 SUN CLUSTER双机系统系统储存及冗余软件有关
18、检查及其命令检查项目使用的命令及有关目录内容及其说明外观检查无检查机器的指示灯状况、看有无故障指示经过串行口连结到阵列的串口,利用其设置ST3x10 阵列检查无界菜单检查,详细的参数为:波特率38400,数据位 8,停止位 1,奇偶校验无,流控无ST3x10 阵列检查(经过连结了 ST3x10 阵列的主机, 假如安装了 scclishow-config工具,经过输入 sccli 命令,选择了控制器sccli 工具检查)后,在其界面下输入的命令用 Varitas Volume检查 Varitas Volume Manager管理下硬盘的Manager 管理的硬盘检vxdisk list状态查其管
19、理下硬盘的状态用 Varitas Volume检查 Varitas Volume Manager管理下磁盘组Manager 管理的硬盘检vxprint -ht的状态, 包含其区分的子磁盘的、所做的卷查其管理下磁盘组的状等的状态态关于用 Solstice DiskSuite( SDS,新的版本用 SDS管理软件管理的改为 Solaris Volume Manager,简称 SVM)metastat管理的磁盘,在操作系统下,输入该命令,磁盘及其虚构设施状态检查其管理的磁盘以及虚构磁盘(md)的状态关于用 Solstice DiskSuite( SDS,新的版本用 SDS管理软件管理的改为 Sola
20、ris Volume Manager,简称 SVM)磁盘,检查起状态数据metadb管理的磁盘,在操作系统下,输入该命令,库的状态检查其管理数据库(用户保留SDS的设置等)的状态ORACLE数据库系统保护检查报告用户基本信息用户名称:联系人:地址:应用系统名称:主机厂商 / 型号:CPU数/ 硬件内存:Oracle 产品 / 版本:系统运转状况检测序检测内容号报告编号:电话 / 传真:巡检时间:操作系统 / 版本:数据库服务器运转方式:检测指令 检测结果 建议1检查 alert 日记,能否有 ora 错误提示Alert 文件2数据库名3实例名4数据库版本5能否归档模式6安装组件7初始化参数8 SGA区SQLshow parameter db_name
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1