云计算机房管理手册例Word格式文档下载.docx
《云计算机房管理手册例Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《云计算机房管理手册例Word格式文档下载.docx(13页珍藏版)》请在冰豆网上搜索。
3.口令管理
网络管理人员统一管理,注意保密;
定期修改口令并符合保密要求。
第4条日常维护和定期维护的规定
1.日常维护应在每天早上和下午分两次进行,发现不正常情况应及时处理并详细记录,处理不了的问题,应立即向主管人员报告;
2.定期维护一般分为半年检查和年检查等。
精密设备的定期维护后,应有详细记录,并由主管负责人签字。
第三节值班与交接班制度
第5条机房值班制度
1.机房必须实行周期值班制,且每天必须进行两次以上日常巡检,实时掌握机房内所有通信设备动态运行情况。
2.值班人员在岗时应随时留意设备有无异常告警、异味和异声,若发现不正常情况,应急时处理,认真记录查找,并立即上报。
3.遵守障碍处理的规定,准确、迅速地处理障碍,及时上报、传报和校对,不得借故推迟障碍处理的时间。
4.及时、完整、准确地填写值班日志和各种规定的记录。
5.不得任意加、甩、倒换设备;
不得任意瞬间中断电路;
不得任意变更路由。
6.不得隐瞒和谎报故障。
第6条对值班人员的基本要求:
1.应按时进行巡检,进出机房必须做好记录,写好操作日志。
2.全面了解本机房内部的各种设备的工作原理、技术标准、应急处理办法。
3.严格执行交接班制度,作到手续清楚,上下衔接。
第7条机房值班人员职责:
1.值班人员必须参加上岗培训,要熟悉机房设备的性能,设备、电路的开放情况。
2.掌握监控设备的一般操作技术,充分利用监控设备进行日常维护和故障处理。
3.值班人员在值班时间内要坚守岗位,恪尽职守,保持设备和电路正常运行,配合相关维护站进行业务处理。
4.值班时不得任意切断或清除告警,发现异常情况,应马上做相应记录和处理并及时通知有关人员。
5.参加设备和电路的开通、停闭、调度和故障修复后的测试工作。
6.及时、准确、完整地填写值班日志及各种规定的记录。
7.严格遵守通信纪律、安全保密制度和其他各项规定制度。
8.配合外来人员工作时,要填写入室登记本,注意安全操作,防止影响电路质量或造成障碍。
9.巡视设备与环境安全,保持设备与环境清洁,在值班期间对设备与环境负责。
第8条交接班的主要内容
1.检查网络、设备、线路的使用、调度、通阻情况,发现问题尽快处理并记录故障的起止时间。
2.查看值班记录和系统维护终端的输出报告,了解电路、设备的远行情况。
3.检查机房电源、空调设备是否正常。
温度、湿度是否符合要求;
防火装置及灭火器是否齐全、良好,告警装置是否正常。
4.查阅上级新布置的通知和规定事项。
第9条在交接班时所发现的问题均应记入交接班记录本内,并由交接双方签字。
交接班时发生故障,或正在进行调度处理时,不得进行接班,接班人应协同处理至通信恢复或告一段落时再进行交接。
属于漏交造成通信中断的,由交班人负责。
由于未认真进行接班而造成的问题,由接班人负责。
第四节大型维护作业计划
大型维护作业指大型软件硬件设备增加、升级、灾难抢修、厂商定期维护等必须由厂家人员与本单位相关部门人员同时进行的作业计划。
第10条维护作业计划应先由机房管理员报告上级部门,获批准后才能正式执行,作业计划必须严格按照所列项目和周期进行,不得随意进行计划外的作业。
第11条维护作业进行时必须由机房管理员与厂家工程师共同参与,机房管理员应极积配合厂家工程师工作。
第12条作业计划完成后,必须详细记录完成情况和测试前后和数据,并将发现的问题摘要记录,测试报告由厂家和运维部门一式两份妥善保管。
第13条公司相关领导可对维护人员执行作业计划情况,作业质量和记录进行现场检查,运维部门应对维护作业计划执行情况进行定期检查并汇总上报。
第五节故障处理制度
第14条建立日常维护工作汇报制度,如发现重大故障,应立即逐级向上级汇报。
第15条定期召开质量分析会,遇到较大故障应及时召开质量分析会。
经常组织技术交流学习,以提高维护人员的技术维护水平和工作能力。
第16条故障处理的基本原则
1.先出口后网内;
先高端后低端。
2.先重点后一般;
先调通后修理,故障消除后立即复原。
第17条对下述情况应及时发现并逐级向上汇报至院务处:
1.机房总电源故障历时4小时以上;
2.节点设备阻断达6小时以上;
3.出口网线中断、服务器机组严重损坏、大型精密设备一级警报、消防警报,
立即报告部门领导。
第18条重大障碍处理完毕后,三日内写出书面专题报告,将故障的现象、原因、处理过程、经验等逐级报告到院务处。
第六节技术档案和原始记录的管理制度
第19条技术档案、资料和原始记录是进行维护管理的依据,必须建立健全制度,专人保管,及时修订,方便使用。
第20条档案和资料项目如下:
1.系统设备的说明书、图纸、维护手册;
2.机房布线系统图,包括各种布线系统图;
3.机房内机架及设备所在位置图;
4.工程技术设计、施工、竣工资料和验收记录等;
5.电源、配线设备的接线记录;
6.电路和用户资料;
7.应急处理方案;
8.系统重大故障报告和原始记录;
9.年度检修测试记录;
10.各种规章制度:
技术规范和维护指标;
技术文件和有关规定等。
第21条机房的原始记录的项目如下:
1.值班日志;
2.人员出入登记本;
3.障碍记录和质量统计分析资料;
4.大型作业计划;
5.测试记录及电路电气特性记录;
6.配线资料;
7.设备搬迁、更新的有关资料和测试记录;
8.现有机器设备和主要测试仪器机历卡;
9.工作记录和其他原始记录。
第22条机房在工作上必要的其他资料项目如下:
1.设备的开机、停闭和调度时间表;
2.各种机线设备和电路发生故障时抢修处理顺序,调通办法;
3.电路路由表;
4.有关技术人员联系方式表;
5.各节点机房、链路提供商、链路经过的关键站点和有关领导的联系方表。
第23条技术档案和资料的管理规定如下:
1.专柜存放,专人管理,定期检查清理。
2.不得随意带出机房,如确因需要临时借出时,应经领导同意,由值班人员登记,按时归还。
3.使用时应珍惜爱护,不得抽页、涂写,有破损时应立即修补。
4.设备调动时,原随机的技术资料应随机转移,使用过程中建立的资料,可择其重要性予以复制,一并列出清单,随机转移。
第24条凡公司规定的维护报表、定期测试记录、质量分析报表、值班记录和其他原始记录等,均应按季分月整理成册,集中存放,专人保管(或输入计算机保存),在经过适当长时期后如这些资料确已失去利用价值,经公司有关负责人批准后可以销毁或删除。
第七节安全保密制度
第25条安全规定:
1.联网设备必须采取必要的安全措施,以保障网络的设备安全及所承载业务的信息安全。
2.维护人员应严格遵循相关的安全防火规定。
3.当机房的交流供电系统停止工作时,维护人员应立即向相关主管部门报告;
在计算机UPS蓄电池的直流工作电压降至最低前,应即时关机。
4.雷雨季节应加强对机房内部安全设备、地线及防护电路的检修。
5.非电气人员不准安装电气设备和线路,不准带电工作。
测试电气设备的电源是否正常应使用相应的测试工具,禁止用手触及电气设备的带电部分和使用短路的方法进行实验。
第26条保密规定:
1.未经批准不得将有关网络通信设备、网络组织、电路开放等机密资料抄录、复制和擅自带出机房,并不得对外泄密。
2.凡外部人员进入机房必须有上级有关部门的批准,履行入室登记手续,并由相关人员陪同。
厂方人员入室工作,应由机房管理人员陪同,明确工作内容和工作范围。
入室登记应详细记录进出机房的人员的姓名、时间、批准人及工作状况。
第二章设备管理
第一节通则
第27条凡是已经开通投入运行的主备用设备和即将投入业务或研发运行的设备,均属于维护和管理的范围。
网络设备主要包括:
高速核心路由器、业务接入路由器、防火墙、局域网交换机、接入服务器、应用服务器、网管工作站和相应的连线等。
第28条各类设备,在工程施工合格,技术指标良好,设计施工文件、图纸、技术资料完整准确,经公司验收合格后,经上级同意,即应开始执行本规程有关管理和维护规定。
第29条网络设备管理应严格遵循下列原则:
1.所有网络设备严格执行专人负责制。
2.未经相关领导同意,不得随意拆卸、硬件调试等操作。
3.有关人员应全面、及时地向主管领导反映设备运行情况。
4.各有关人员应该相互配合协作,严格执行本规程规定的设备维护操作示。
第30条按规定的考核标准加强管理,以确保设备的完好。
设备完好的主要标准为:
1.各类设备的电气和IP性能应符合相应的技术指标要求。
2.结构完整,部件、备品(备盘)及备份软件齐全,设备清洁。
3.运行正常,使用良好。
4.技术资料齐全、完整、图纸与设备相符。
第31条设备的调拨、停用、报废、拆除、转让等应经院务处批准方可进行。
第32条待用设备及备用盘、附属器件、技术档案、资料和原始记录均应完整无缺。
第二节设备的更新
第33条设备更新的条件:
1.设备长期使用(已超过设计使用年限),性能严重下降,经常接触不良或多次故障难以修复的可以更新。
2.设备的某些重要性能下降,多次调整修复仍不能达到指标的,可以更新。
3.设备陈旧,电路开放不多,可由其他技术先进的设备代替的,可以停用。
第34条设备更新前,应对设备现状进行详细调查,提出更新的理由,根据规定编制计划报上级审批。
第35条设备更新后,应组织有关人员进行验收,并有详细的测试调整记录,各种资料归档保管。
第三章机房管理
第一节机房环境
第36条机房环境要求
1.机房工作人员应备有工作服和工作鞋,进入机房要更换。
2.机房门窗要严密,室内要防尘和清洁。
3.机房的温度一般保持在21±
5°
C,相对湿度一般保持在30~75%,有特殊要求的设备,以该设备说明书要求安排。
第37条机房环境维护
1.例行维护
●每天进行机房及周边环境的卫生检查
●每两周进行机房及周边环境的卫生清洁
●每天对机房日常维护指标进行检查并记录
2.紧急维护
●及时进行相关的紧急自处理
●即时向救护部门申请救助:
公司领导、火警-119、匪警-110
●通报相关部门及相关领导并备案
第二节机房日常运行维护管理
第38条对机房设备维护的要求
1.机房应备有防静电手镯,维护人员插拔设备模块时要带防静电手镯。
2.维护终端使用的软盘要有严格的防病毒措施,严禁安装、使用未经批准的软件。
3.各种通信设备外壳,应良好接地。
使用220伏及其以上交流电源工作时,必须注意人身安全和设备安全。
4.机房内严禁使用可能引起火灾的取暖设备。
机房内要备灭火器,灭火器要放在固定位置,并指定专人管理,定期检查,保证良好。
要求每一维护人员熟知其使用方法和火警电话号码。
5.室内所有设施要建立固定资产管理目录,并有专人负责。
定期核对。
第39条对机房操作人员的要求:
1.机房内严禁吸烟、饮食、睡觉、闲谈、娱乐。
2.所有出入机房的人员必须更换指定拖鞋或穿上防尘鞋套,方可进入机房。
3.机房管理人员进出机房应尽量更换拖鞋,同时节俭室内资源;
如:
防尘鞋套、纸张、文具、电能等。
4.除机房管理员外,其他部门和外单位人员,需经有关领导批准,并由机房管理人员陪同方可进入机房。
5.机房管理员应按规定的时间,对环境、湿度、温度、电源电压,设备运行等进行记录和监视。
6.人员应会熟练使用灭火器材。
出现火警时应立即报告保卫部和火警台。
第三节主机系统管理
第40条“主机系统管理”的目的是保证《广东电子工业研究院有限公司》网络内的主机正常运行和各种网络服务的高效运作,确保网络安全,提高《广东电子工业研究院有限公司》的服务质量。
主机系统的管理目标包括:
1.外观状态
2.Power状态
3.CPU利用率
4.硬盘空间
5.进程状态
6.日志检查
7.网络接口状态
8.TCP端口使能状态
9.UDP端口使能状态
10.安全状态
第41条系统备份管理
1.Email/Vhost/DNS服务器:
每周做一次增量备份;
每月做一次全备份。
备份数据保存6个月以上。
2.视频监控/环境监控/门禁控制服务器:
每次修改配置文件后,做一次全备份。
第42条系统安全管理
1.UNIX/window主机用户密码制定和维护规则
(1)任何账号生成后,禁止使用缺省密码作为密码使用;
长度应大于6位,且应该是字母(大小写)﹑符号﹑数字混合使用;
(2)避免使用自己(或亲属﹑朋友)的姓名﹑生日等易被人猜到的信息作为密码;
避免使用与自己的用户名相关的信息作为密码;
(3)使用人员要妥善管理自己的账号/密码,密码严禁被他人使用(若有需求,可以在“机房管理员”的同意下开临时账号)。
(4)由于主机使用人员自己的账号/密码管理不善,造成系统安全性问题(如,口令过于简单,被黑客猜到,进入系统),由该密码的所有者负相应的责任。
(5)当用户登录主机(输入密码)的时候,应让他人回避,以避免密码泄露。
(6)应在每天上班后前两个小时内检查系统的log文件,发现任何可疑的问题,对事件的“现象描述”和“解决过程”以及“结果”做详细的记录。
(7)对所有的主机进行不定期的安全检查,发现问题后立即解决,并做好详细的记录。
(8)除客户应用主机外,所有主机的帐号与密码必须由“机房管理员”掌控发放,使用人员不得随意更改主机密码,如须更改必须由“机房管理员”同意下才能更改,并做好存档。
2.主机操作规程
(1)每次登录主机要用自己的账号;
完成工作要退出系统。
(2)操作人员离开机器10分钟以上,应在退出系统后离开。
(3)操作过程中若有事离开10分钟之内,应锁屏幕后离开;
办完事情及时返回。
(4)用户在输入口令的时候,在场的其他人应回避,(用户有权要求其他人回避)。
(5)在已提供信息服务或作研发使用的主机上,使用人员不得下载安装即时通信、音乐、游戏、BT工具等无关软件。
3.路由器、防火墙安全操作规则
(1)任何管理员不得擅自修改路由器、防火墙配置,须经相关人员讨论后方可进行。
(2)对路由器、防火墙做任何配置的修改之前要对配置做备份,抄送同事人员。
(3)对路由器、防火墙做任何配置的修改,只有检查无误之后方可确认生效。
(4)修改路由器、防火墙的任何设置需在值班日志上详细记录,交接班时做必要说明。
(5)在路由器、防火墙有业务承载的情况下,路由器、防火墙的重新启动,需先做备份再经相关人员讨论后方可执行。
第四章网管系统管理
第43条网络管理维护的目的是监测网管系统本身的运行状况,并按实际情况对相关管理系统进行优化升级,以确保网管系统高效、安全、稳定地工作。
网管系统包括:
服务器系统、服务器监控系统、UPS电力系统、消防监控系统、空调控制系统、环境监控系统、视频监控系统、门禁控制系统等。
第44条网管系统的管理目标包括:
⏹网管应用系统的运行性能统计
⏹网管系统应用功能开发
⏹网管系统运行效率
第二节网管系统的日常管理
第45条机房管理人员必须掌握网管系统的配置,使用权限及管理范围的详细情况。
第46条网管系统平时放至监视状态。
第47条为提高网管系统的真实性和可靠性,对无效告警予以确认,并有效控制。
一旦发生告警,应在本班次内予以处理,解决。
不得以任何方式拖延故障处理时间。
第48条要求每班次认真填写《维护操作记录本》。
第49条每日应统计所发生的告警,并加以分析,作到三清,即“原因清、时间清、地点清”。
每月底对发生的故障进行全面分析,完成故障统计分析报表,提出整改意见。
第50条厂家需对各级网管系统进行操作时,必须经主管部门批准方可进行。
附件一网络设备维护管理记录
1、网管日志
2、设备机历本
网管日志
年月日星期天气:
时间
处理情况
值班人
维护员
大
事
记
上午:
下午:
故
障
录
处理过程
云机房设备机历本
设备名称:
产品编号:
安装时间:
放置点:
填写人姓名
年月日
故障
记录
插板
更换
系统
升级
备注