机房管理指南.docx
《机房管理指南.docx》由会员分享,可在线阅读,更多相关《机房管理指南.docx(11页珍藏版)》请在冰豆网上搜索。
机房管理指南
XXX
机房管理指南
编号:
密级:
内部
编制:
年月日
审核:
年月日
批准:
年月日
发布日期:
年月日
实施日期:
年月日
分发人:
分发号:
受控状态:
受控□非受控
版本及修订历史
版本
修订人
审核人
批准人
生效日期
备注
V1.0
新建
1目的
为了保证机房正常工作,确保计算机网络系统安全、良好地运行,充分发挥计算机系统的效益,做到信息传递的适时、准确和连续,使科学管理在组织中发挥重要作用,本文件对组织机房的管理范围、管理设备、安全管理、日常管理、保密管理、服务器及UPS启停操作管理及巡检管理进行规范,特制定该指南。
2适用范围
本指南适用于本医院自有机房管理,对于租用第三方机房的情况,应参考本文件对第三方的机房管理予以规范。
3职责
3.1信息科
a)是本指南的归口管理部门;
b)负责本指南的修订、解释和说明及协调实施工作。
3.2机房负责人
机房负责人由信息科运维组负责人担任,其主要责任是确保机房能够正常运行,保证组织业务的正常运转。
3.3机房管理员
机房管理员由信息科负责人任命,主要负责机房的日常维护及机房配套设备的维护等。
4管理流程及内容
4.1机房管理的设备
机房管理的设备主要有:
UPS设备、机房空调、小型机及存储设备、微机服务器、备份系统设备及附属设备等。
4.2机房安全管理
4.2.1物理环境安全管理
a)严禁在机房内吸烟及使用电热器具或明火操作,机房内使用的测试仪器、吸尘器等电器设备,用毕后必须及时切断电源并带出机房;
b)严禁将易燃品、易爆品、含有腐蚀性的物品、强磁物品及其他与机房工作无关的物品带入机房,维修中使用酒精等易燃物品时,必须有人在场,用完后必须剩余部分应立即带出机房;
c)机房落实专人进行定期检查放火、防水、防盗、防尘设施,并按指南更换,并保持良好状态
4.2.2设备及系统安全管理
a)建立完整的计算机运行日志、操作记录及其他有关的资料保存机制;
b)定期检查安全保障设备,确保其处于正常工作状态;
c)机器带电运行时严禁开启机箱维修,拆卸机器附件时,必须采取防静电措施;
d)对不能停机的主机必须按指南配备定额容量的UPS等设施;
e)计算机设备必须有可靠接地,接地电阻不大于相应设备的技术要求,并装置必要的防雷设施;
f)可用性要求较高的计算机系统,配置必要的备份设备,以便保障时切换使用。
对于重要系统和数据应定时做好备份;
g)做好定期的查病毒工作,对于重要的应用和服务应建立防病毒体系。
4.3机房日常管理
4.3.1机房环境条件
a)按有关指南控制机房的温度和湿度;
b)机房地板、墙壁应完整无损,防止各类小动物进入;
c)凡与机房无关的任何物品不得存放在机房内。
4.3.2机房卫生要求
a)机房应保持清洁,每周清扫一次,每月大扫除一次;
b)进入机房应更换鞋套,并要定期清洗,不准在机房外使用;
c)机房内不准吸烟,不准用膳,不准会客,不准存放食品。
4.3.3机房出入要求
a)任何人必须经过授权,并填写《机房出入授权申请单》,方可进入机房;
b)经授权人员进入机房必须填写《机房出入登记表》;
c)外单位进入机房时,须经机房负责人同意,并报信息科负责人审批通过,在由机房负责人指定人员的陪同下进行相关活动。
4.3.4机房设备操作指南
a)机房管理员如需对机房设备进行操作,必须严格遵守操作规程,确保人身、设备安全,认真填写《服务器与网络设备检查记录单》;
b)操作中发现异常情况应立即报告机房负责人,及时采取相应措施;
c)任何人不得擅自移动机房内的一切设备。
4.3.5故障处理
机房主要设备,如主机和网络设备等,发生故障时,应及时向机房负责人报告,由机房负责人通知相关运维人员进行简单故障排查,并填写《服务器与网络设备故障报告单》。
若简单故障排查无法解决问题,则应该启动相关应急响应程序。
4.4机房保密管理
4.4.1权限管理
严格权限管理,机密数据按权限查阅,机房管理员不准利用工作方便,查看超越自己权限范围的机密数据。
4.4.2口令管理
系统口令应落实到人,并定期进行修改,严禁泄露用户口令及机密数据。
具体参见《密码管理制度》。
4.4.3文档管理
应保密的软件、文档资料、数据等不准随意打印、复制和转移,确因工作需要时,需经过相关领导批准后方可办理。
4.5设备启停操作管理
4.5.1设备启停原则
组织服务器所运行的系统为24h运转系统,正常情况下不得停机。
如出现异常、增减设备或检修维护而必须停机的,须提前提出申请,经相关领导同意后,在指定时间内完成。
4.5.2设备启停需遵循的规则
a)启停程序必须由运维人员协同完成;
b)停机前24h需对网上用户发出停机通知,紧急停机须提前半小时通知;
c)在服务器停机前须由机房管理员确认网上无用户,停止数据库运行后,停止操作系统运行,然后关机;
d)服务器停机后,再停止网络设备运行;
e)网络系统停止运行后才可停止UPS的运行,然后切断电源,通知有关人员进行停机后的各项工作;
f)在工作完成后,检查所有设备的接地、电源及各连线正常后,开启电源,启动UPS;
g)确认设备状态正常后启动网络设备,检查网络是否正常;
h)在网络正常启动后,确认服务器状态正常后开启服务器,判断服务器自测结果正常后启动操作系统,观察是否正常;
i)在服务器操作系统正常启动后,启动数据库系统,观察是否正常。
在数据库正常启动后,通知用户恢复使用;
j)以上各步骤中如有异常,必须立即停止,协同解决后继续,如有重大事件必须及时反映汇报,不得隐瞒。
4.6机房巡检管理
为保证机房内信息系统能够正常工作,确保计算机网络系统安全、良好地运行,充分发挥计算机系统的效益,做到信息传递的适时、准确和连续,必须进行机房巡检。
4.6.1巡检范围
对各机房内的所有网络设备(路由器、交换机、集线器)及信息设备(服务器、小型机)等进行巡检。
4.6.2巡检规程
a)严格按照各机房巡检路线(巡检路线由信息科制定)进行巡检;
b)检查各信息设备的运转情况,检查是否有异常的声音,各指示灯是否正常;
c)检查各网络设备(路由器、交换机、集线器)指示灯是否正常,可对照设备的常态指示灯来巡检;
d)对于重要的设备,应按照各系统操作规范,在客户端进行应用测试以验证服务器状态是否正常。
4.6.3巡检结果
由当天的巡检人员填写《机房巡检记录表》,如各项都正常则在相应的栏目中填写“正常”,否则在相应的栏目中填写“不正常”,并在备注栏中填写出现的情况。
如发现突发性系统故障严重影响系统的正常运行,应立即启动相应的应急预案并根据应急预案进行汇报,不得隐瞒或谎报。
5
附件
5.1附件1:
机房出入授权申请表
机房出入授权申请单
编制部门:
记录表号:
记录顺序号:
申请人
申请日期
被授权人
信息
正式员工
○实习生○第三方人员
○其他
姓名
联系方式
工作单位
申请期间
自开始至结束
申请原因
备注
审核人意见
签名:
日期:
年月日
批准人意见
签名:
日期:
年月日
5.2附件2:
访客登记表
访客登记表
记录表号:
记录顺序号:
No.
进入时间
姓名
单位
人数
事由
联系方式
离开时间
接待人
是否携带PC
备注
1
2
3
4
5
6
7
8
9
10
5.3附件3:
服务与网络设备检查记录单
服务与网络设备检查记录单
巡检人:
巡检时间:
网络设备类型:
序号
巡视内容
检查项目说明
巡视情况说明
设备名:
安装位置:
管理IP地址:
用途:
01
检查设备周边环境
检查周边和设备内外是否有变形、变色、异味等现象;
环境的温、湿度情况;
3.加电后,注意部件、元器件及其它设备是否变形、变色、异味、温度异常等现象发生。
1、正常口
2、异常口
02
检查电源情况
1.检查网络设备电源接合是否正常,设备加电是否正常。
1、正常口
2、异常口
03
比对配置文件
1.配置文件以最近保存的配置文件为准,查看是否经过改动或者缺少配置文件。
1、正常口
2、异常口
04
查看所有接口状态
1.是否是正常的UP/DOWN
1、正常口
2、异常口
05
查看板卡信息
1.板卡信息是否为正常。
1、正常口
2、异常口
06
查看日志有没有报错信息,并记录错误日志
1.日志报错信息需有所记录,并根据日志提供信息查看对应的端口或者IP地址进行排错。
1、正常口
2、异常口
07
设备可靠性检修
1.流量发生器接入设备,双电源断接、关键冗余模块重新插拔,检查交换流量是否正常。
1、正常口
2、异常口
08
安全配置检查——SSH服务启用
1.采用ssh服务代替telnet服务管理网络设备,提高设备管理安全性;关闭AUX端口使用;加强console端口对设备管理的帐号与口令强度,提高通过console管理设备的安全
1、正常口
2、异常口
09
安全配置检查——用户账号与口令安全
1.采用servicepassword-encryption加密;采用secret对密码进行加密;对本地用户认证密码进行加密,登录控制3分钟;允许同时并发3个登录请求;密码长度为8个字符
1、正常口
2、异常口
10
安全配置检查——SNMP安全控制
配置snmp访问控制列表;更改SNMPCommunity
1、正常口
2、异常口
11
其他配置变更情况
1、正常口
2、异常口
5.4附件4:
服务与网络设备故障报告单
设备编号
设备名称
设备型号
事故发生时间
事故发生地点
设备故障发生经过及损坏情况:
事故报告人
事故当事人
技术等级
事故性质及类别
修理费
停机台时
停机损失
事故原因分析
违反操作规程
擅离工作岗位
超负荷运行
分析主持人:
日期
未按期检修
忽视安全措施
检修质量问题
设备先天不足
润滑不足
原因不清
防止事故措施及处理意见:
综合部意见:
日期:
日期:
信息科意见:
使用部门意见:
日期:
日期:
5.5附件5:
机房巡检表
机房环境
检查项
检查结论
详细说明
检查项
检查结论
详细说明
温度
□正常□异常
℃
湿度
□正常□异常
%
痕迹
□正常□异常
异味
□有□无
异向
□有□无
周边设备
检查项
检查结论
详细说明
检查项
检查结论
详细说明
UPS
□正常□异常
消防
□正常□异常
空调
□正常□异常
网络运行
□正常□异常
注:
痕迹检查地面、墙壁、天花是否有裂痕、水渍,机房内是否有鼠患、蚁患、蟑螂活动的痕迹,正常室温:
21~25℃