信息系统运维服务项目技术方案613doc.docx
《信息系统运维服务项目技术方案613doc.docx》由会员分享,可在线阅读,更多相关《信息系统运维服务项目技术方案613doc.docx(60页珍藏版)》请在冰豆网上搜索。
信息系统运维服务项目技术方案613doc
2018年信息系统运维服务项目
技术方案
XXXX有限公司
2018-6
一、运维方案
1.1运维服务定位和目标及服务范围
通过专业运维服务,进一步加强信息系统运行维护,对信息系统运行维护流程提供先进的管理理念与流程,并通过专业的技术支持为信息系统运行维护工作提供专业的技术平台,满足信息系统软硬件的维护要求,可以满足多种基础设施环境稳定的要求,可以满足软件及信息资源高效、可靠和安全运行的要求,可以满足运行设备统一管理、及时的故障恢复的要求,可以保证在信息系统构建的应用系统和数据集中运行的设备平台正常运行,达到高效、稳定、安全和高扩展性的要求,可以提供运维保障之外的管理咨询要求,为实现省本级信息化建设的可持续发展奠定集中统一的设施基础。
1.2运维服务内容及运维重点难点分析
1.2.1运维服务内容
依据现网普遍的信息系统设备及常用软件清单,我公司对提供如下服务内容:
基础设施维护
业务系统
服务项
保证措施办法
小型机、服务器、PC、多媒体系统、
网络设备、存储系统、信息安全设备等
现场驻点服务(如需)
5×8小时
到达客户现场时间(应急响应)
30分钟内
电话后响应时间
90分钟内
备件到达现场时间
24小时
配件维修、更换服务
提供
高级工程师现场支持
提供
检查设备各部件的状态灯;
提供
检查并处理设备的错误日志;
提供
硬件设备的全面检查;
提供
网络配置的检查及测试;
提供
定期升级配套软件的版本;
提供
系统重部署及调试:
新机上架协助及系统移位协助;
提供
针对重要设备,实时监控运行状况,及时发现故障、排除故障;
提供
操作系统性能分析;
提供
小型机、网络设备、信息安全设备配置信息,根据需要调整配置;
提供
设备的微码版本检查;
提供
存储设备运行情况检查;
提供
提交详细的预防性维护报告和总结;
提供
对检查结果综合分析,并形成分析报告;
提供
协助采购人制订安全策略,定期检查、排除风险,保障设备及网络环境安全;
提供
协助采购人规范硬件管理维护标准化工作;
提供
周期性全面巡检(与采购人协商、合同约定)
提供
系统运行环境检查:
包括机房温度、湿度和零地电压、零火电压等
提供
机房空调运维
设备故障恢复时间
48小时内
周期性全面巡检(与采购人协商、合同约定)
提供
坏件更换
提供
日常清理及更换过滤网和加湿罐等耗材
提供
定期清理机房空调的室外机;检修机房内各供水管路及排水管路,杜绝漏水,保证管路畅通。
提供
配备机房专业知识的人员对机房实行5X8小时值班(如需)
提供
UPS设备运维
故障恢复时间
72小时内
周期性全面巡检(与采购人协商、合同约定),巡检时检查蓄电池使用情况,并且进行充放电;
提供
坏件更换
提供
配备机房专业知识的人员对机房实行5X8小时值班(如需)
提供
备件保证
备件库
提供
备件更换
现场更换
技术服务
驻点服务:
1.提供7×24小时免费故障检测与维修换件现场服务2.预防性维护服务
提供
远程技术支持服务:
1.提供7×24小时的故障响应电话支持2.每周一次与客户沟通交流
提供
培训服务:
1.专业知识培训2.日常运维管理
提供
远程诊断
远程拨入系统分析
提供
远程故障解决
提供
远程系统性能监控
提供
软件及信息资源维护
系统软件、数据库、中间件
现场驻点服务(如需)
5×8小时
到达客户现场时间(应急响应)
60分钟内
要求完整、详细、真实的维护记录文档,按月、季、年度提交规范的维护报告。
提供
维护文档
提供
每日监控系统运行情况,协助应用系统的升级以及各种安全补丁的升级工作
提供
BUG管理、系统故障检测及排除
提供
应用系统功能、数据库优化、调整服务及少量的二次开发
提供
系统软件安装、数据库安装、配置管理
提供
存储管理
提供
根据备份策略定时进行系统及数据的备份,对重点数据要求能够进行定时备份
提供
协助采购人规范计算机终端软件安装标准化工作
提供
周期性全面巡检(与采购人协商、合同约定)
提供
解决数据库运行中出现的各类故障
立即响应
文档提交
提供
技术服务
驻点服务:
1.提供7×24小时免费故障检测与维修换件现场服务2.预防性维护服务
提供
远程技术支持服务:
1.提供7×24小时的故障响应电话支持2.每周一次与客户沟通交流
提供
培训服务:
1.专业知识培训2.日常运维管理
提供
远程诊断
远程拨入系统分析
提供
远程故障解决
提供
远程系统性能监控
提供
信息系统安全服务
信息系统安全服务
现场驻点服务(如需)
5×8小时
到达客户现场时间(应急响应)
60分钟内
漏洞扫描服务:
制定安全扫描计划,对信息系统的服务器、网络设备、安全设备和应用系统进行安全漏洞扫描,包括系统漏洞扫描、数据库扫描、应用安全扫描
提供
安全加固服务:
根据漏洞扫描所发现的弱点和安全隐患,对信息系统的服务器、网络设备、信息安全设备进行安全加固服务,提高系统与服务器与系统平台运行的安全性、可靠性
提供
应急预案和演练服务:
针对可能发生的重大事件,制定对应的应急预案,并通过应急演练发现应急过程中存在的问题,进而对应急预案和演练进行优化
提供
信息系统安全测试服务
提供
技术服务
驻点服务:
1.提供7×24小时免费故障检测与维修换件现场服务2.预防性维护服务
提供
远程技术支持服务:
1.提供7×24小时的故障响应电话支持2.每周一次与客户沟通交流
提供
培训服务:
1.专业知识培训2.日常运维管理
提供
远程诊断
远程拨入系统分析
提供
远程故障解决
提供
远程系统性能监控
提供
运维管理咨询服务
运维管理咨询服务
IT服务管理现状数据与信息收集;
提供
建立服务台,配置相关服务人员;
提供
协助部署IT服务管理软件、设计管理制度和流程;
提供
IT服务管理流程设计(应包括事件管理流程、问题管理流程、配置管理流程、变更和发布管理流程)。
提供
技术服务
驻点服务:
1.提供7×24小时免费故障检测与维修换件现场服务2.预防性维护服务
提供
远程技术支持服务:
1.提供7×24小时的故障响应电话支持2.每周一次与客户沟通交流
提供
培训服务:
1.专业知识培训2.日常运维管理
提供
远程诊断
远程拨入系统分析
提供
远程故障解决
提供
远程系统性能监控
提供
1.2.2运维重点难点分析
网络规模的发展和扩大,使得应用产品技术日渐多样和复杂,越来越多的企事业单位的生产业务和日常工作将实现信息化,并通过提高信息化水平实现对内提高经营水平、对外提高服务水平的目的。
各企业事业单位业务的展开越来越依赖IT系统的正常运转,生产业务日渐依赖IT部门提供的系统服务,IT部门正由“成本中心”转变为“服务中心”、“效益中心”。
随之而来的问题是运维部门将如何通过管理为企事业单位提供更好的、可度量的、符合业务需求的服务?
同时,这些服务需要能够适应业务需求以及新技术带来的影响,为新业务系统的运行提供支撑,让运维管理成为企事业单位成长的助力。
运维管理包含内容
IT运维是IT管理的核心和重点部分,也是内容最多、最繁杂的部分,主要用于IT部门内部日常运营管理,涉及的对象分成两大部分,即IT业务系统和运维人员。
其管理内容又可细分为七个子系统:
第一、设备管理:
对网络设备、服务器设备、操作系统运行状况进行监控,对各种应用支持软件如数据库、中间件、群件以及各种通用或特定服务的监控管理,如邮件系统、DNS、Web等的监控与管理;
第二、数据/存储/容灾管理:
对系统和业务数据进行统一存储、备份和恢复;
第三、业务管理:
包含对企业自身核心业务系统运行情况的监控与管理,对于业务的管理,主要关注该业务系统的CSF(关键成功因素CriticalSuccessFactors)和KPI(关键绩效指标KeyPerformanceIndicators);
第四、目录/内容管理:
该部分主要对于企业需要统一发布或因人定制的内容管理和对公共信息的管理;
第五、资源资产管理:
管理企业中各IT系统的资源资产情况,这些资源资产可以是物理存在的,也可以是逻辑存在的,并能够与企业的财务部门进行数据交互;
第六、信息安全管理:
该部分包含了许多方面的内容,目前信息安全管理主要依据的国际标准是ISO17799,该标准涵盖了信息安全管理的十大控制方面,36个控制目标和127中控制方式,如企业安全组织方式、资产分类与控制、人员安全、物理与环境安全、通信与运营安全、访问控制、业务连续性管理等;
第七、日常工作管理:
该部分主要用于规范和明确运维人员的岗位职责和工作安排、提供绩效考核量化依据、提供解决经验与知识的积累与共享手段IT运行维护管理的每一个子系统中都包含着十分丰富的内容,实现完善的IT运维管理是企业提高经营水平和服务水平的关键。
IT运维管理面临的难题
IT运维管理是一门探讨如何提高网络应用性能的课题,怎样利用网络管理做到企业IT基础设施建设的管理、合理分配网络资源、保障生产业务、对网络规划和新业务上马提供支撑,而其最核心的目的是保障企业生产业务。
日常IT运维管理面临诸多难题,具体体现在以下多个方面:
网络设备
在企业IT基础设施的搭建过程中,底层的网络设备厂商和类型多样且复杂。
随之而来的问题是:
如何将不同厂商的网络和应用管理产品在界面级、消息级和数据级集成起来实现统一管理?
如何让IT管理员了解到整个网络全局的运行情况、发展趋势和可能存在的故障隐患点,以便及时采取相应措施,实现事前管
理。
科学的运维管理思路告诉我们,首先需要解决的是对IT基础设施的管理,管理范围要能覆盖到机房所有硬件设备。
这一点是前提和基础。
其次,才是对各种应用系统做到很好的监控。
最后,才能为业务系统提供足够的保障。
网络流量
在绝大多数的企业网络中,存在不同程度的网络延迟,造成重要业务和应用时断时续,这直接成为企业业务的杀手。
另外,网络的带宽也是企业关心的重
点。
比如,哪个时间段很拥挤,哪个时间段很空闲,有没有规律,怎么样去调查拥塞的原因,网络带宽都是被谁占用了,是被哪些客户端、哪些应用或者异常应用所占用了。
这些都是摆在每一个企业运维管理领域中很实际的问题。
该如何很好的解决这些问题呢?
根据多年的运维管理经验得出,对于这种情况,需要采用流量分析的方式。
通过对出口流量或者监控对象进行采集,进行24小时实时的监控和分析,可
以对流量进行多角度多层次的挖掘分析,比如按照流量、数据包个数、连接数、协议等类别分析当前网络的负载情况,为网络的优化配置提供参考。
通过报表分析展现流量特征,让IT管理员明白流量被谁、被何种应用、被何种异常行为占用得怎么样。
IT运维管理怎么样帮助IT管理员判断和控制安全问题,也就是作为与防病毒、防火墙、IPS等安全产品不同的角色,从网络的整体情况要能够判断未知的安全问题,并提供修复方案,在不影响正常网络运行状况下将安全问题防患于未然。
如果IT管理员能针对异常行为的特征建立自动告警,在某些安全攻击出现前发现故障隐患,并提供连动的判断和处理机制,这样IT管理员可以及时采取了措施避免业务遭受损失。
如果能在对问题特征自动告警的同时,自动记录问题的原始数据以供事后分析,这样IT管理员可以再现数据异常行为、捕捉网络数据异动入侵记录,对症下药制订策略防止问题的再次发生。
业务系统
针对日益复杂的业务系统,现有的运维管理系统更多的强调的是功能的展现。
比如,从业务主机负载、数据库服务器负载、数据库、中间件、应用系统、
网际流量、进程状况等等不同角度实施联合监控,强调的是性能参数指标的多少,或者是界面的美观程度。
当然,这是落实业务系统管理环节所采用的方法。
但事实上,作为企业自身来说,无论采用哪种监控也好,IT管理手段或者运维管理系统也罢,其核心总是需要围绕保障和改进企业的业务系统。
这就提出一个问题,如何来保障又如何改进企业的业务系统呢?
首先,需要了解清楚业务系统所涉及的具体环节,针对每一个环节进行管理落实。
按照科学运维管理的建设思路,分为:
用户-网络-硬平台-软平台-业务系统这五个环节。
需要从这五个环节所涉及到的五个方面去做工作。
这五个方面分别是:
全局的性能管理、故障和事件管理、资源的使用状况管理、安全管理和
数据分析管理。
其次,通过性能和历史数据的反映,又可以做到对业务系统提供改进决策的指导。
当然,对于如何保障和改进业务系统这个问题,目前业界众说纷纭,没有统一的标准。
但有一点是肯定的,就是需要从企业用户的角度出发,通过明确的管理思路作为指引,使用软件+服务的方式和企业用户共同探索和研究,最终达到对业务的保障和改进。
当前IT运维管理的任务
在企业网络运维早期,IT运维管理侧重于网络、硬件等设备。
随着业务系统涉及的环节日益增多,单一的网络管理已经不足以满足管理需求,越来越多的企业已经将关注点从单一网络转变到当前的业务系统,落实保障业务系统的各个环节成为重中之重。
1.3运维人员组织架构及管理制度
1.3.1运维组织结构介绍
我公司将在此运维项目中投入业务水平高、技术能力强的运维人员和质量控制人员,采用公司严格规范的运维管理模式,进行全方位管理。
为了进一步确保运维项目的进度与质量,公司在项目运维阶段、质量管理、技术文档等方面进行严密规范的部署。
公司的运维队伍组成包括:
Ø运维项目总负责人(常务总经理兼任);
Ø运维管理委员会(项目经理、甲方代表、监理代表);
Ø运维驻点服务小组;
Ø技术支持专家组;
Ø备品备件供应小组;
Ø文档管理小组
1.3.2运维组织管理制度
运维部工作职责
根据维保项目实施推进和发展目标,负责系统信息协同管理及协同数据交换策略研究的整体架构、应用系统等技术开发方案制定和组织开发,保障基础设施平台的稳定性和先进性。
信息系统基础设施设备和软件操作规程和应用管理制度的制定,并负责监督执行。
信息系统基础设施设备和软件安装、调试和验收,使用培训和维修保养。
信息系统基础设施日常运行过程中信息安全和技术问题的协调解决,保障系统24小时安全稳定运行。
主要管理制度一览表
项目名称:
招标编号:
企业名称:
序号
管理制度名称
执行起始时间
备注
1
机房基础设施及硬件运维管理办法
2016.1
2
信息类设备运维管理办法
2016.7
3
主机运维管理办法
2017.3
说明:
表格中列出目录即可,主要规章制度的具体内容可在下方提供图片或者截图。
附:
各类制度图片或截图:
1.3.3运维成员职责
项目经理职责:
项目经理受公司总经理任命和委托,全权负责运维项目合同的各项条款的履行。
对运维项目的优质、高效、安全负全责。
运维工程师职责:
1、负责对基础设施维护(如服务器与存储设备、网络和信息安全设备、机房基础设备及环境、桌面设备、多媒体设备等),软件及信息资源维护(如系统软件、工具软件、业务系统及数据等)相关的申报事件进行处理和解决。
2、负责对基础设施维护(如服务器与存储设备、网络和信息安全设备、机房基础设备及环境、桌面设备、多媒体设备等),软件及信息资源维护(如系统软件、工具软件、业务系统及数据等)提供日常性能和运行状况监控,对故障进行分析处理及建立完善预警机制。
3、负责保障基础设施正常运行,遵循用户的安全保障管理要求。
4、接受用户对信息系统维护事件的督办、检查,协助服务台完成对用户意见进行回访和事件统计、分析。
对服务过程和反馈的意见进行改进,同时接受服务台的绩效考评工作。
5、及时提供信息新系统运行和问题处理情况,并向用户负责,并按周、月、季、年提交运维运维服务工作进度总结和计划。
6、负责整理和归纳服务器日常维护知识库,提交至运维服务平台。
7、负责整理和提交信息系统运维过程资料和相关配套维护文档。
技术支持专家职责:
1.为客户提供7×24小时的故障响应电话支持。
2.接听客户服务热线电话和接收(电话/Email/Fax等)客户服务请求;
3.通过网络或电话为客户提供即时的远程技术支持,包括软硬件故障的诊断和排除,客户端软件的安装和设置。
4.协调多方服务团队,及时跟进未完成的服务请求并及时更新系统信息和状态;
备品备件管理员职责:
1.组织实施备品备件的订购、运输及入库工作
2.负责汇总待料备件,及时采购或调拨,并主动向项目经理说明待料原因、追踪处理。
1.3.4运维成员组织结构
针对单维保项目我公司配备了4-5名专职人员具体如下表:
序号
分派职位
数量(人)
姓名
获得证书
1
项目经理
1
项目管理师资格证
2
运维工程师
1
专业化证书
3
技术支持专家
1
厂商认证证书
4
备件管理员
1
5
文档管理员
1
备注:
人员证书附下页:
项目名称:
招标编号:
企业名称:
序号
姓名
年龄
文化程度
专业
获得资格证书情况
入职本单位时间
岗位安排
业绩说明
其他说明
……
说明:
1.上述人员必须是本企业在职职工,应与本单位近期社保缴纳证明一致,否则不予认可。
2.岗位安排指在具体运维项目中可担任的岗位,如技术支持专家、项目经理、现场维护人员、其他服务人员及是否可安排驻场等。
3.业绩说明:
指在以往运维项目曾经担任的岗位,如技术支持专家、项目经理(负责人)、现场维护人员、其他服务人员等。
附相关学历证书:
1.4运维质量保证措施及服务承诺
1.4.1质量控制管理
按照相应的ISO9001:
2000国际质量体系标准及国家规定进行质量控制,还以相应的规范要求对设计质量,施工质量、材料和设备质量进行管理、要求、控制。
公司的施工阶段性内部验收制度,是质量控制管理的有利保证。
工程的每一个阶段完成时,公司技术支持部门都要按有关部门规范和要求进行严格的内部验收。
验收标准整体上高于用户验收标准。
1.4.2进度控制管理
针对普遍客户的需求做出如下运维计划:
序号
名称
人员
周期
1
小型机、存储系统巡检报告
运维工程师/技术支持专家
每周
2
PC服务器、存储系统
运维工程师/技术支持专家
每周
3
多媒体系统
运维工程师
每周
4
网络设备、信息安全设备
运维工程师/技术支持专家
每周
5
机房空调巡检报告
运维工程师
每周
6
UPS巡检报告
运维工程师
每季
7
数据库系统运维
运维工程师/技术支持专家
每周
8
中间件系统运维
运维工程师/技术支持专家
每周
9
问题报告
运维工程师/技术支持专家
问题解决后
10
信息系统安全服务
运维工程师/技术支持专家
每半年
11
月总结报告
运维工程师
每月
12
季度总结报告
运维工程师/技术支持专家
每季度
13
年总结报告
运维工程师/技术支持专家/项目经理
每半年
14
运维管理咨询服务
运维工程师/技术支持专家
每周
15
定期培训
技术支持专家
每季度
1.4.3服务承诺
1.系统定期巡检是指我司安排现场工程师对应用系统实施现场检查,及时发现系统运行中出现的隐患,减少系统发生故障的概率,保证系统的稳定运行。
在系统巡检过程中发现的问题,依据我司故障分类标准,由现场技术服务工程师进行相应的故障排除。
本项目中巡检服务主要指软件检查,内容包括:
数据完整性检查、性能指标检查、告警功能检查、软件可用性与安全性检查等。
2.电话故障诊断是指用户在遇到使用中的疑难问题或者系统出现不正常状态,通过电话或传真向我司寻求技术支持和帮助,我司在确认用户的服务请求后,将安排技术人员在规定的时间内(即响应时间)通过电话帮助用户进行故障定位,并提出解决方案,最终指导用户排除设备故障。
表:
故障性质定义
用户在维护系统过程中,当出现技术故障的时候,应对故障现象进行仔细认真的调查和记录,然后通过服务热线向我司提供故障的详细情况、服务请求时间、联系人和联系电话等。
我司服务热线提供每周5天、每天8小时的电话故障诊断,如热线电话号码需要更改,我司至少提前三天以书面形式(含传真)通知用户。
用户应及时反馈解决方案的有效性,以便我司是否进一步采取技术支持措施。
3.远程故障诊断是指用户在遇到使用中的疑难问题或者系统出现不正常状态,通过电话或传真向我司寻求技术支持和帮助,我司在确认用户的服务请求后,通过服务项目不能解决系统故障问题的情况下,或在进行的同时,根据需要并征得用户同意后,采用远程拨号技术,将用户系统与工程师所在地终端连通,在远端对用户设备进行诊断,提出解决问题的方案,并最终指导用户解决问题。
我司工程师负责进行远程故障诊断,即只查看数据,寻找故障原因,不对数据进行修改,具体故障排除由工程师指导用户现场维护人员进行。
用户应按我司的要求提供必要的配合和协助,确认并反馈方案的有效性。
我司还可以通过远程故障诊断对用户数据进行检查,进行远程巡检。
我司提供每周5天,每天8小时的远程故障诊断。
1.5运维流程及服务方式
1.5.1服务方式
针对本次项目我公司为保证各系统的稳定可靠的运行我公司根据该项目的具体要求提供三种方式的技术支持服务,分别为:
现场服务、远程技术支持服务、针对甲方运维人员的技术培训服务。
现场服务
对客户的系统进行现场维护和巡检,运维工程师对各个应用系统完成定期巡检,同时输出巡检报告提交给客户,驻点工程是还应对客户的故障设备进行维修和更换备件服务。
为了让客户得到更及时和更快的服务,运维工程师还提供7×24小时的故障响应电话支持。
远程技术支持服务
远程技术服务主要是通过电话或其他方式受理客户和运维工程师的疑难问题,通过沟通来指导客户或运维工程师解决问题,同时远程技术服务工程师还通过电话或者其他方式与客户主动沟通来提高客户管理和运维能力。
技术培训服务
为提高客户的运维人员的技术水平及运维管理能力,我公司将派遣具有丰富实施经验的技术专家定期对客户进行相关专业(主机、存储、数通、网络、安全、机房环境等)的培训。
培训可以采用灵活多样的方式如面对面交流、课堂授课、邮件沟通等。
1.5.2运维流程
我公司除培训服务外,为本项目提供两种服务方式:
一种为技术人员现场值守,另一种是定期巡检结合故障现场服务。
1