运维服务项目技术方案.docx
《运维服务项目技术方案.docx》由会员分享,可在线阅读,更多相关《运维服务项目技术方案.docx(14页珍藏版)》请在冰豆网上搜索。
运维服务项目技术方案
技术服务方案
1.1前言
信息网络中心于2013年8月在原网络管理中心基础上建立,是教育信息化建设与管理的职能部门。
在学院信息化领导小组和分管院长的直接领导下,负责
全院教育信息化的规划与建设、校园网络的建设与管理维护、现代教育技术的管理和设备维护等工作,积极为我院的教学、科研和管理工作提供完善的网络环境支持和服务。
目前,信息网络中心下设技术科、教学资源科两个部门。
技术科职责:
负责校园主干网络的建设与管理维护;
负责校园网络主干网络设备的运行、维护和保养工作;
负责学校主干网络的畅通和正常运行;
负责校园网网络安全。
教学资源科职责:
负责教学资源库的建设和应用;
协助相关部门开展网络教学工作,提供技术支持;
负责学院各项活动的摄影和摄像工作,灯光、音响等设备的安装调试和控制;
配合教学工作进行精品课程策划、录制、编辑等工作;
促进精品课程和示范性专业建设,促进重点课程和精品课程建设。
为了保证校园网业务的7X24小时运行,所有的系统和软件均要求得到良好的维护,所有的硬件设备均要求保持良好的工作状态,出了问题也要在第一时间修复,不能影响整个系统的运行。
校园网的技术维护服务主要实现以下目标:
1、通过日常维护,保证校园网的正常运行。
2、通过专业的技术服务,保证所有的服务器系统、数据库系统、存储系统、安全系统和网络系统的正常运行;保障机房基础设施本身的稳定运行。
3、通过紧急应急措施,及时解决系统故障,将故障影响降低到最小程度,
恢复系统的正常运行;
4、对本系统提供一年的技术维护服务。
1.2技术服务内容
1.2.1运维服务对象
为全部校园网相关设备提供运行监控、告警、故障受理、故障排查、故障处理、设备设施的日常维护服务、互联互通及相关技术劳务服务等,包括校园网机房运行环境的主要设施设备、校园网线路链路及设备设施、网络运行相关软件,以及技术服务和培训工作。
1、全部校园网设备:
a.校园网网关设备;
b.校园网链路接入设备;
c.校园网安全设备;
d.校园网监控设备;
e.校园网流量控制及行为管控设备;
f.校园网认证设备;
g.校园网日志设备;
h.校园网交换及路由设备;
i.校园网各种服务器及虚拟服务器系统;
j.校园网各种存储及存储附属交换传输设施设备;
k.校园各种远程监控操作及执行系统;
l.校园网各种重要应用及服务;
m.校园网各种数据库;
n.校园网管理及学校重要PC终端;
2、校园网机房运行环境的主要设施设备:
a.机房电源输入、输出各种开关和监控及传感设施设备;
b.机房UPS及相关传感、监控设施设备;
c.机房各种电力线缆,传感及控制线缆;
d.机房电池及相关传感、监控设施设备;
e.机房各种防雷及地线等相关设施设备;
3、校园网线路、链路及设备设施:
a.校园网各种线缆、光缆、跳线及配线架、理线架、跳线架相关设施设备;
b.校园网光传输设备及附属设施。
4、网络相关运行软件以及技术服务:
a.网络系统软件;
b.数据库软件;
c.相关应用软件;
d.技术服务和培训。
5、其他相关服务内容
a.配合学校及校园网管理部门为学校的各种活动及建设提供技术支持;
b.结合校园网的发展建设提供新增设备与原有设备的集成与互联互通技术服务;
c.在服务过程中需接受学校及校园网管理部门的管理,并在服务过程中和过程后
提供各种相应服务文档;
d.在校园网管理部门的安排下对学校网络运行的各种工作进行劳务支持。
e.维保服务不局限于目前现有的校园网相关设备、设施,同时包含维保期内新增
相关设备、设施维保。
1.2.2设备运维内容
校园网网络及服务器设备清单:
序号
资产名称
品牌型号
单位
数量
1
岀口防火墙
网神NSG7500-TV10M
台
1
2
核心交换机
华为S7706
台
1
3
服务器接入
交换机
华为S5700-24TP-SI
台
2
4
WEB防火墙
网神W5000-U020M
台
1
5
服务器机柜
深圳图腾普通加深型
套
1
6
数字式KVM
KL1516Ai
套
1
7
接入交换机
神码5960
台
14
8
服务器
华为RH2280
台
4
9
磁盘阵列
华为存储OceanStorS2600
台
1
10
KVM
D-LINKDKVM-1516H
台
1
11
UPS电源
山特C10KS
台
1
12
台式服务器
dellvostro410
套
1
13
服务器
DELL
台
2
14
服务器
曙光天阔A620-G
台
3
网络运维内容
网络硬件设备出现故障时,排除故障;若是保修期内,协助产品供应商和生产厂家解决问题,保修期外负责协调备件,硬件更换费用由学校承担。
月度巡检:
提前做好预防维护措施,由专责工程师每月到现场进行设备常规检查,检查系统的运行状态和系统日志。
提供网络设备的技术支持;解决网络运行过程产生的问题,保障网络正常运行。
每月进行一次网络性能测试,必要时进行一些参数调优。
负责实现北塔网络管理软件的配置和维护等工作,为用户系统提供统一的管理和监控平台。
在后续的新建项目中,网络方面的规划、设计、方案指定与审定等。
进行日常维护:
对上述维护范围内的设备配置资料备份、漏洞检测和修复、
定期日志检查和分析。
根据业务的要求,进行网络的性能参数调整,同时定期进行必要的网络状况测试,给出测试、修正报告。
保证为进行一次全面的网络系统性能调整,以及根据用户需求对网络VLAN
进行调整、生成树调整、VRRP协议、CSS协议调整和预留IP地址规划的优化服务。
协助管理校园内的全部汇聚和接入交换机,并对具体的接入交换机的使用进
行配置和维护。
系统恢复:
系统故障诊断和修复以及灾难恢复等。
技术支持:
提供相关的技术支持服务。
服务器运维内容
定期检查主机房内上述服务器的指示灯状态、主机的事件纪录。
我公司定期对主机巡检、维护,并通过网络测试服务器网卡状态及服务端口的状态,做好维护纪录。
对服务器的配置文档(处理器、内存、硬盘、网卡、光纤卡、电源、IP地址、主机名、物理位置)做好跟踪记录,及时归档及存档。
负责服务器操作系统的安装和维护,定期检查系统日志并进行分析,服务器的资源(处理器、内存、虚拟内存、磁盘空间、网络、进程)使用情况进行搜集,定期对主机运行情况进行分析、评估。
在服务器硬件出现故障时,负责协调原厂家进行更换,并负责调试和更改周边的比如存储、光纤交换机、网络交换机等相关设置。
存储系统维保内容
检查所有存储硬件的运行情况,HBA卡、硬盘、SFP模块、控制器、后备电源等。
检查所有存储的空间使用情况,根据实际需求及时调整空间分配情况。
检查所有主机到存储的链接情况,线路质量情况,定期进行读写测试。
检查光纤交换机的zone划分情况,运行配置情况以及级联拓扑情况。
数据库系统维保内容
数据库是用户的数据存放地,其运行情况直接关系到应用系统的工作状态和工作效率,因此,保持数据库正常、安全、高效运行是维护工作的重点。
我公司保证现场提供ORACL和SqlServer数据库技术服务的工程师都具备丰富的实践经验,并且通过ORACL数据库高级认证。
数据库补丁升级服务:
我公司技术工程师将时刻关注数据库的各种升级信息和补丁信息,对于免费的升级内容,公司将协助用户完成升级工作;提供ORACL和SqlServer数据库软件升级服务,定期提供软件修补包,补丁包时间以patch发布时间为准。
电话支持和远程登陆。
在遇到紧急状态时,我公司可通过远程登陆可以随时监控用户数据库的运行状态,发现潜在的故障隐患,并做出及时的处理。
日常维护。
数据库技术工程师将协助用户进行数据库的恢复步骤、安装、应用、运行效率、性能调整等检查,进行面对面的技术交流和探讨,从而了解数据库系统的功能和限制,最大限度地降低潜在的数据丢失、宕机、性能降低、资源限制抢救无效等风险。
故障诊断。
对于用户使用中的数据库系统,由于硬件、操作系统或应用等原因出现问题,导致数据库的异常状态,影响了业务的正常运转,我公司承诺4小时内解决相应问题。
对于突发事件或人为等各种原因造成的客户系统不
能正常工作,影响正常的生产的故障,按照合同约定第一时间派出技术专家
到达客户现场,解决客户系统故障,恢复客户系统的正常运转。
灾难恢复。
如果发生意外停机或数据丢失,用户可能会付出沉重的代价,为此,我公司技术工程师将协助用户根据具体的业务要求制定详细的数据库备份与灾难恢复策略,并在故障实际发生时,公司将以最快的速度完成数据的恢复,有效化解用户的风险。
数据库备份与恢复:
防止数据丢失和Oracle和SqlServer崩溃的最后一道防线是备份,备份是将数据copy到同一个或者另外一个存储中,当oracle和SqlServer发生灾难或者丢失数据的时候,可以从这个copy中恢复回来。
Oracle和SqlServer的备份分为:
物理备份和逻辑备份;而物理备份又分为热备份和冷备份。
备份需要考虑备份窗口、备份策略、备份有效性等因素,同时要对存储进行有效的规划,防止最后一道防线出现问题。
我公司根据多年Oracle和SqlServer经验,为客户oracle和SqlServer系统备份制定有效的策略,同时充分考虑备份过程可能出现的问题,为备份做出定时检验,保障客户Oracle和SqlServer系统安全。
监控数据库的数据表空间、UNDO表空间、TEMP表空间、裸设备、系统逻辑卷,逻辑卷组的使用情况,必要时对其进行扩展,以保证数据库空间的正常使用。
根据用户数据库的具体情况,优化数据库参数配置,数据库服务器SGA内存
设置、PGA设置、IO相关参数等。
定期对用户数据表、索引、视图、过程、DBlink等进行有效性检查。
协助用户调整优化现有的备份策略和备份方式,确保备份的完整性和可恢复性。
收集分析性能指标,根据实际情况给出相应改进建议。
关注数据库补丁程序的发布,在必要的情况下提醒并协助用户安装补丁程序。
分析用户日志、后台日志以及跟踪文件第一时间发现问题,并消灭隐患。
数据库性能调优:
数据库应用的类型是复杂的,有大量用户同时更新数据库的联机事务处理应用、对海量数据进行查询并生成报告的数据仓库应用、在互联网上大量用户同时查询和更新数据的联机事务处理应用等等,为了满足
与适应不同的应用系统及不断增长的数据需求,我们要通过对系统的诊断和
调整提高系统的运行效率。
系统运行效率相关要素诸多,涉及服务器硬件、网络结构、操作系统、数据库系统、应用系统、并发用户数等,都将影响系统的运行效率,具有很高的不确定性。
因此,我们的工作目标是在现有硬件条件、软件条件下,通过调整系统结构、调整数据库对象结构和系统资源的物理再分配,消灭性能瓶颈,使其达到总体性能的综合平衡,实现性能的最大化。
数据库数据迁移:
数据迁移主要是指通过切实可行的方法,在充分考虑数据安全性和完整性的情况下,将数据库系统从一台服务器迁移至另一台服务器中,保证数据的完整性和可用性。
数据库定期检查:
服务期内,我公司提供以月度为单位周期对生产数据库进行健康状况检查,及时发现生产数据库已经存在的或潜在的问题,确保数据库正常运行。
检查系统和数据库的可用性、完整性和性能。
安全系统维保内容
负责所有硬件设备的巡检和正常运行,故障时协调厂家现场维护。
根据用户需求和实际工作环境,调整和细化安全策略,严格控制外界访问服务器的权限,最大限度做到内网的安全。
任何安全设备的使用问题,我公司均远程或者现场协助解决。
不同的安全域之间,制定详细的策略和维护方案,巡检内容如下:
不同安全域间的线缆插接控制,不同区域间的计算机移动控制,不同区域间的外联设备控制,如不同安全区域计算机的无线网卡等,不同区域间的设备本身安全性,不同区域间的设备访问控制列表合理性。
定期评估服务器的安全漏洞。
使用评估软件定期发现服务器上的问题,以及重点客户端的问题。
定期检查上述安全设备的日志信息,以发现管理问题以及安全问题。
整理业务系统,暂时使用业务系统内部账号,对于可以整改的系统,将业务系统所使用账号整改为使用身份认证帐号管理体系。
数据服务连接中,严格禁止使用数据库管理员账号,对于数据库同步等账号均采用最小化权限管理,对其账号的权限范围限制在其关联的数据库之上。
对于业务系统无关的服务进行卸载或者禁止。
对于需要的服务要逐一价差配置,保证其安全性。
每季度做一次漏洞评估和扫描,提交漏洞分析报告和解决建议,帮助用户建立安全意识。
协助用户做好安全制度的执行、落实和检查。
机房基础设置维保内容
负责检查和维护UPS电源的运行情况,负载情况和后备电池的工作状态,确保机房电力供应正常。
负责检查和维护空调系统的运行情况,确保机房内的温度和湿度符合计算机机房的要求。
负责机房内的网络线缆,光纤线缆的跳线,更改和维护,根据用户需求负责及时快速的调整路由和拓扑,并同时做好维护标识。
负责机房监控系统的正常运行。
1.3技术服务方式
1.3.1现场和驻场服务标准
专业化技术服务体系中包含为用户提供重大故障及项目实施的保障,该项服务是专业化服务中针对性最强的一类服务项目,它是针对核心的核心数据库,以及复杂的系统环境而提供的紧急性质服务项目。
当系统出现各种意外情况(如系统崩溃、硬件损坏、电源掉电等)造成数据库不能正常使用情况,针对情况不同,我们将全程协助,参与机器或数据库恢复过程,在数据库有完善的备份情况下,根据用户的实际需要,我们将对数据库进行恢复或异机恢复,最大可能的保障数据的完整和一致性。
驻场服务:
派驻1名技术人员,按照的作息时间进行现场服务,快速解决网络运行中遇到的问题。
驻场工程师每天定时检查所有主机系统的性能负载、存储容量变化和运行状态,进行预防式维护、及时处理检查中发现的问题,确保24
小时有效响应、快速解决问题。
每天至少检查1次所有数据备份和各种高可用备份措施,保障重点业务应用不中断。
应急现场服务:
我公司针对提供应急响应服务,提供7X24小时电话和邮件支持,已经快速的现场服务。
对于一二级故障,我们的技术工程师可以在2小时到场处理故障,并在12小时内解决问题。
故障类型
故障定义
故障特征
一级故障
指设备在运行中出现系统瘫痪或服务中断,导致设备的基本功能不能实现或全面退化的故障,造成业务中断30分钟以上或导致关键业务数据丢失的故障。
业务中断30分钟以
上:
业务数据丢失
二级故障
指设备在运行中出现的直接影响服务,导致系统性能或服务部分退化的故障;设备在运行中出现的故障具有潜在的系统瘫痪或服务中断的危险,并可能导致设备的基本功能不能实现或全面退化,如冗余设备单侧故障等;系统设备或操作系统故障,造成业务中断但不满4小时的,如系统复位等。
冗余设备单侧故障
三级故障
指设备在运行中出现的,影响系统功能和性能,但关键业务不受影响的故障,如磁带机
业务不受故障影响
故障类型
故障定义
故障特征
故障。
四级故障
产品功能、安装或配置方面需要信息或支持,
对业务运作无影响。
对业务运作无影响
1.3.2巡检
服务期内,我公司将派遣高级工程师提供以月度为单位周期进行整体系统的健康状况检查,按照既定的巡检方案执行,巡检方案根据相关的作业指导书来制作,同时依据客户提交的报告来进行重点补充,巡检方案明确后,由相关工程师及质检人员组成的巡检组按巡检程序实施巡检,及时发现目前软件产品和生产数据库已经存在的或潜在的问题,确保整套系统正常运行,并在每次巡检结束后出具巡检报告。
巡检安排:
月度,每次不低于2个工作日
巡检结论:
《系统巡检报告》
1.3.3热线
公司提供7*24小时服务以及指定技术支持电话服务,在国家法定节假日,公司将提供技术支持工程师的联系电话,确保随时能够进行有效沟通和咨询。
当客户发现系统异常、故障或遇到难以解决的系统问题时,首先应由我公司的技术服务工程师对故障现象、故障信息进行详细的观察记录,然后将观察记录及时通报客户,由客户技术人员与我公司技术服务工程师一起进行故障会诊,确认合适
的解决方案,然后指导客户技术人员进行现场操作,排除故障。
1.3.4远程
对于需要查看故障现场,而又无法快速到达现场的情况下,经用户授权我们可通过Internet远程登录到用户网络系统进行免费的系统优化、参数调整、故障诊断和故障排除。
为了保证系统和用户的安全,此方式可以临时申请或使用,
并在故障排除后即刻退出系统或取消权限。
远程方式也可以通过MSr远程协助,QC远程协助等方式进行。
远程方式也可以通过用户提出的方式进行。
1.3.5邮件
对于在热线电话中无法解决,需要以电子文件的方式交互的问题,或者是关于本系统的其他技术问题通过E-mail向我公司咨询,所有客户的E-mail咨询应发至我公司的如下E-mail地址。
我公司在收到以上咨询后的12小时内予以解答。
Email响应的内容一般包括:
非紧急情况下的升级或更新软件的提供,用户需要的产品说明、操作指南等文件。
1.3.6技术咨询
专业化服务提供专业化的IT技术咨询服务,针对客户需求和实际情况,对客户提供帮助和支持,使客户获得效率和效益。
针对用户需求的高级别咨询类服务是专业化服务中最有特色的服务项目,此服务能以中立的角色,从用户业务角
度,对信息化策略、信息中心管理规划、体系的建立、硬件资源规划、数据库设计等等进行分析并提供咨询,同时,还将根据用户的需求,随时向用户通报与用户系统相关的技术发展趋势及方向。
1.3.7建立维护档案
公司将为所有维保设备建立完整的维护服务档案。
该档案包括以下内容:
系统设备的运行情况、配置信息等。
公司及有关服务信息、联系人、联系电话等。
工程师每次维修、维护服务记录。
每次系统预防性维护服务的报告。
1.3.8定期反馈
公司定期对服务进行总结分析,对不足的地方加以改进,以确保提供给高质量的服务。
同时将定期与客户举行系统维护服务质量会议,回顾系统维护服务情况,征求客户意见,以满足客户需要,使我们能够更好的为客户提供优质服务。
1.3.9特殊时段值守服务
在一定特殊和关键时期,如学校迎新、考试、重大政治活动等时段,为了保证信息系统更加安全稳定运行,能够保证特殊时期和关键时期的运行,公司在技术人员配备、响应、调集等方面有更高的实效,提供客户所在地7X24小时驻场值守服务,在故障发生时,立即响应,快速定为故障原因,迅速排除故障。
1.3.10设备搬迁服务
根据实际需求,维护方需在服务期限内提供维保设别的搬迁服务,要参与搬迁方案的制定、具体实施以及设备搬迁后的的调试。
1.3.11主机安全加固服务
完成主机系统的安全性进行审计,如:
用户登录认证、访问控制、用户密码策略,按需配置安全加密传输,提供系统安全相关补丁列表等。
1.4维保方式
派驻技术员驻场服务及后台服务团队支持服务。
1.5维保时间响应
1.5.1基本时间
基本时间要求:
提供服务期内每周5天*9小时一名工程师驻场服务,每个工作日24小时的全天候随时响应服务。
提供7X24小时畅通的热线联系电话。
响应时间指学院
发现问题或在巡检当中发现问题时开始计算,在1小时内完成以下内容的初步判定:
问题级别、影响范围、解决所需资源、解决时长,并尽快完成故障排查和故障处理。
如果需要协助更换备件或者驻场工程师无法进行故障处理时,二线工程
师现场处理时,协助学院完成相关工作及人员的调配安排。
1.5.2二线工程师到达现场时间
当用户要求我方提供二线工程师现场支持服务时,从我方接到用户电话请求开始,我方工程师在4小时内到达现场,并立即开始现场不间断工作支持服务。
1.5.3现场不间断工作支持服务
在用户校园网设备、设施及相关业务及应用系统发生故障、重大事件、关键
时点或重大活动及紧急工作等情况下,我方派相应级别且能解决问题的二线工程师到达用户现场,按用户要求,立即开始不间断服务,直至系统能够满足用户业务及工作正常进行的要求。
1.6维保人员
1.6.1驻场工程师资质
驻场工程师具有计算机或网络相关专业专科以上毕业,有两年以上工作经
验。
具体如下:
工程师:
王继富HCN—华为认证网络工程师;
提供以上人员相关证书。
1.6.2二线服务人员资质
网络工程师1:
时现科HCIE、HCD—华为认证互联网专家、华为认证数据通信资深工程师;
网络工程师2:
金林辉一思科CCIE
网络工程师3:
王宏宇HCIE-华为认证互联网专家(路由交换方向);
虚拟化工程师1:
黄明宏一VMwareVCP;
虚拟化工程师3:
周水东一VMwareVCP;
数据中心工程师:
丁彦胜一华为认证互联网专家(存储方向);提供以上人员相关证书。
1.7维保期限
服务期限为壹年,从合同签订之日起计算。
1.8维保相关工作管理
1.8.1驻场工程师人数及上岗
提供一名长期驻场运维人员岗位,驻场人员5*9小时在岗。
驻场运维人员由客户方管理,不得临时更换和或长期不在岗,如需更换驻场运维人员,必须征得学院主管部门同意。
1.8.2对我方所提供服务的管理
我方所提供的各种服务及派驻的工程技术人员严格遵守学校与网络管理部门的各项管理及规章制度。
所提供的各种服务及派驻人员接受网络管理部门的直接管理,配合网络管理部门的各项工作。
由网络管理部门对相关服务及驻场人员进行考核、监督及评价。
我方派驻人员服从管理。
1.8.3日常设备设施巡检及维护
提前做好设备巡检等日常维护措施,由驻场专责工程师每天到现场对所有设备进行巡检,检查系统的物理运行环境及运行状态和系统日志。
我方提供书面校
园网设备巡检日志。
并向网络管理部门汇报巡检情况。
1.8.4校园网业务或设备设施出现故障后的紧急处理
解决网络设备设施和基础环境设施运行过程产生的问题,保障各项系统正常运行。
根据故障现象对设备进行故障分析定位、测试、诊断,并制定业务恢复和故障解决技术方案,我方保证优先实施业务恢复,在恢复业务的前提下,再进行彻底的故障修复。
技术方案经招标人网络管理部门批准后,由我方的技术人员具体实施方案;或在用户主管人员允许的情况下,由我方的技术人员进行具体实施。
如果硬件设备出现故障时,排除故障;若是保修期内,协助产品供应商和生产厂家解决问题,保修期外协助招标人协调备件,费用由用户承担。
我方提供书面故障处理日志、软硬件及设备配置变动日志和故障分析报告。
1.8.5根据校园网运行提供5*9小时值班服务
我方根据招标人校园网运行提供5*9小时驻场值班服务,提供书面值班日志。
1.8.6协助用户进行系统升级、扩充和优化服务
根据用户系统的运行使用情况,我方及时向用户提出系统安全及系统优化的合理建议,确保用户系统安全正常运行。
当用户的各项系统或设备出现与其它系统或设备或第三方厂家系统或产品需要协调的问题时,我方根据网络管理部门要求派工程师到现场协助协调、解决问题或提出合理化建议。
根据网络管理部门的应用要求,重新配置、优化系统资源,包括网络、服务器、存储、安全设备