ImageVerifierCode 换一换
格式:DOCX , 页数:12 ,大小:22.76KB ,
资源ID:4983278      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/4983278.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(软件平台运维技术方案1总体方案.docx)为本站会员(b****3)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

软件平台运维技术方案1总体方案.docx

1、软件平台运维技术方案1总体方案软件平台运维 技术方案总体维护方案全面保障招标人信息、应用系统平稳运行及有效应用,总体目标如下:建立系统运维机制。 提供全程运维服务, 出现故障应能及时告警。 必须建立完善的运维机制, 包括运维团队、运维方案、运维制度、应急预案等:不发生六级及以上通信设备事件。不发 生因云平台环境原因造成的系统故障、停机等事件。信息安全。 运维人员严格遵守有关信息安全与保密管理规定, 运维期不得发生六级及以上信 息安全事件。运行指标要求。主机系统(包括存储)可用率不低于 %。主机系统可用率 =(总时间 - 主机计划外停机时间) / 总时间 *100%。应用系统可用率不低于 %。应

2、用系统可用率 =(总时间 - 计划 外停机时间) / 总时间 *100%。网络可用率不低于 %。信息网络可用率 =(总时间 - 计划外网络 中断时间) / 总时间 *100%服务满意度。服务态度端正,有问必答,用语规范,态度诚恳,耐心解答用户疑难,虚心听 取用户意见,处理业务不拖拉,不推诿。客户服务满意度达到 99%以上。客户服务年投诉次数小于 4 次。问题响应效率。从开始处理后 3 个小时内解决的问题占全部问题的比重不得低于 80%;在一个小时内响应的问题占全部问题的比重不得低于 95%;客户端、 网络、 用户管理、 权限变更、操作类问题一个工作日内解决,业务流程、系统配置、权限设计类问题视

3、问题的情况,一般 在 5 个工作日内解决, 系统变更业务审批在 5 个工作日内完成, 新需求、 开发类问题需视开 发及测试情况尽快解决。恢复措施。 具备自动或手动恢复措施, 以便在发生错误时能够快速地恢复正常运行。 软件系 统故障时,自动恢复时间 30 分钟,手工恢复时间 4 小时。信息资产统计服务此项服务为基本服务, 包含在运行维护服务中, 帮助我们对用户现有的信息资产情况进行了 解,更好的提供系统的运行维护服务。服务内容包括:后台管理系统数据信息统计记录 门户网站信息发布安全管理 系统新增功能接口对接及研发 软件产品型号、版本和补丁等信息统计记录 网络结构、网络路由、网络 IP 地址统计记

4、录 其它附属数据的统计记录网络、安全系统运维服务从网络的连通性、 网络的性能、 网络的监控管理三个方面实现对网络系统的运维管理。 网络、 安全系统基本服务内容:序号服务模块内容描述1云服务器配置配合用户进行,云服务器后买,安装部署,调试等工作2系统故障诊断按服务级别: 724 小时5 8 小时3电话远程技术支持7 24 小时4系统问题管理对遇到的问题进行汇总和发布1)用户现场技术人员值守* 公司可根据用户的需求提供长期的用户现场技术人员值守服务, 保证网络的实时连通和可 用,保障系统正常运作。 现场值守的技术人员每天记录信息系统是否存在安全性及健壮性问 题, 网络的转发和路由是否正常进行, 进

5、行整体网络性能评估, 针对网络的利用率进行优化 并提出网络扩容和优化的建议。现场值守人员还进行信息系统的日常运行状态的监控, 对各种安全设备的日志检查, 对重点 事件进行记录,对安全事件的产生原因进行判断和解决,及时发现问题,防患于未然。 同时能够对信息系统的运行数据进行记录, 形成报表进行统计分析, 便于进行网络系统的分 析和故障的提前预知。具体记录的数据包括:配置数据性能数据故障数据(2)网络运行分析与管理服务网络运行分析与管理服务是指 * 公司工程师通过对网络运行状况、网络问题进行周期性检 查、分析后,为客户提出指导性建议的一种综合性高级服务,其内容包括:服务内容服务优点向客户提供网络专

6、家电话号码。保证重大问题第一连线至网络专家。网络专家与客户进行电话技术交流以最小成本保证及时解答客户关心的技术问 题,并就某一领域技术问题展开深层次沟通。向客户提交网络问题汇总分析报告使客户了解网络历史故障情况以及故障预防建议,最大程度减少网络故障隐患,更高效的进行网络管理。3)重要时刻专人值守服务* 公司深刻知道保证重要时刻系统稳定运行对客户成功尤为关键, 因此,* 公司可对客户提 供重要时刻的专人现场值守支持,包括政府客户的重大会议期间、金融客户的年终结算日、 运营商客户的生产网重大割接或其它任何客户认为可能对其业务运营产生重大影响的时刻。如需专人值守, 客户需至少提前 3 周与授权服务商

7、客户服务经理联系。 对每位合约客户, 授 权服务商均需按事先合同约定提供专人值守服务。 客户如需超出合同约定范围的更多值守支 持,需额外支付相应人力和差旅费用。云服务器运维服务* 公司提供云服务器运维服务包括: 存储设备的日常监控, 设备的运行状态监控, 故障处理, 操作系统维护,补丁升级等内容。云服务器基本服务内容:序号服务模块内容描述1云服务器配置配合用户进行,云服务器后买,安装部署,调试等工作2补丁服务消除软件漏洞给系统带来的安全隐患,并对安装补丁 所引起的系统连锁反应进行合理的平衡。3升级服务对系统进行软件或硬件的升级,以改进、完善现有系统或消除现有系统的漏洞。4系统故障诊断按服务级别

8、: 7 24 小时5 8 小时5电话远程技术支持724 小时6系统问题管理对遇到的问题进行汇总和发布7系统优化对客户系统的存储设备、操作系统、提供优化服务。* 公司现场值守人员可进行监控管理的内容包括:CPU 性能管理;内存使用情况管理;硬盘利用情况管理;系统进程管理;服务器性能管理;监控硬盘运行状态;监控网卡状态;系统文件系统管理;监控存储交换机设备状态、端口状态、传输速度; 监控备份服务进程、备份情况(起止时间、是否成功、出错告警) 对存储的性能(如高速缓存、光纤通道等)进行监控。服务器巡检作业计划书系统管理单位:设备名:设备型号设备序列号管理 IP :检查内容参考标准检查结果状态是否正常

9、巡检方法描述巡检周期运行状态CPU 状态正常 异常内存状态正常 异常磁盘状态正常 异常网卡状态正常 异常系统 检查系统日志正常 异常文件系统,包括磁盘卷剩余空间正常 异常交换分区正常 异常固件版本正常 异常补丁包版本正常 异常系统镜像正常 异常存储磁盘正常 异常存储驱动正常 异常进程状态正常 异常系统 性能 检查CPU利用率正常 异常内存利用率正常 异常磁盘 I/O 性能正常 异常服务器巡检作业计划书系统管理单位:设备名:设备型号设备序列号管理 IP :检查内容参考标准检查结果状态是否正常巡检方法描述巡检周期数据 库运 行状 态数据库安装目录正常 异常数据库进程状态正常 异常集群 检查集群进程

10、状态正常 异常集群日志正常 异常存储 检查存储环境状态正常 异常系统故障报告正常 异常短信平台维护服务应用系统在运行期间, * 公司需要有专人职守,定期检测,保证短信平台能够正常运行。 维护要求为: 通过对短信平台的维护, 分析用户的不断更新的需求, 分析应用系统对服务平 台性能的要求,提出系统优化扩容解决方案,保障应用系统的处理服务性能。主要维护内容包括:短信数据维护;短信数据备份;日常维护; 软件更新服务;对短信平台健康状态检查与分析报告;对系统用户信息进行维护和修改,添加系统用户、更改系统用户信息、权限, 负责系统中管理人员、操作人员、监督人员名单的调整,以及数据同步。系统运行保障服务(

11、1)从运行值班人员及时了解应用系统的运行状况,配合日常运行监测,处理突发事件, 组织编写事故报告、查明事故原因。(2)对应用系统出现的故障进行及时处理;对用户使用过程中存在的技术问题提出可行的 解决方案。(3)研究制定系统的应急预案,并安排相关人员定期演练;(4)负责编写规划、计划系统运行情况的总结;(5)建立联络机制,做好和系统实施单位以及原厂商的沟通;(6)对应用系统运行中出现的问题及时与系统实施单位和原厂商联系支持解决,以保持系 统的稳定运行。基本要求(1)日常运维服务针对 招标公司的工作日制度,为客户提供系统级的日常维护、定期巡检、性能测试、 故障排查等服务。具体内容包括:a. 工作日

12、服务主要指现场值守服务, 维护团队需要指派 3 名资深服务技术服务工程师长期值守在现场, 负 责对现场设备运行状态进行监视、 管理和维护以及工作终端的管理和维护, 通过对系统运行 日志的分析提前发现并排除可能发生的潜在故障, 并在全部维护服务团队支持下, 在 1 小时 内排除普通故障, 2 小时内排除较大故障, 4 小时内排除重大故障, 24 小时内排除特大故障。维护期内提供技术人员进行现场监控服务。b. 故障响应服务维护期内提供电话、传真、电子邮件等方式的咨询和支持服务。主要系统设备出现故障时, 15 分钟内响应,当现场维护工程师或节假日值班维护工程师无 法排除故障时, 1 小时内中心派专业

13、工程师赶赴现场进行故障诊断及处理,在 1 小时内排 除普通故障, 2 小时内排除较大故障, 4 小时内排除重大故障, 24 小时内排除特大故障。 一般故障,正常工作日内响应。(2)其他时间及夜间服务当系统在非工作日出现异常时, 维护团队现场人员将在 1 小时内赶赴现场并排除系统普通故 障,特大故障将在 24 小时内处理完毕。具体联系方式包括: 通过维护团队提供的 724 小时响应服务热线; 现场维护人员通过移动 通信网络 (当运维管理系统具备短信故障报警通知功能时) 接收到系统报警信息; 或维护人 员接到服务请求电话时。(3)临时保障服务 当遇到重大活动需要提供临时保障服务时,维护团队须在需要

14、保障服务的前三天进驻现场, 并对所有设备进行临时性安全检查,排除安全隐患,以做到万无一失。(4)月度检查 每月对各系统及设备进行检查,进行安全系统、防病毒系统检查,进行漏洞扫描,并对检查 中存在的故障及安全隐患进行处理。每月第一周向用户单位提交上月的月度巡检报告 , 报请用户单位审批签署。(5)季度检查每季度对由维护团队的专业维护队伍对所有设备进行安全评估和风险分析, 提交完整的安全 状况评估报告,分析存在的安全漏洞情况,提出整改方案和建议 。(6)年度检查每年由维护团队组织相关的专家 (含硬件和软件) 对整个系统进行安全检查, 对每个硬件设 备使用状态进行风险评估, 并对下一年可能存在的问题

15、进行风险预测, 对每个设备的状态出 具使用报告。服务要求服务队伍要求维护团队拥有强大的技术支持力量, 拥有稳定的专业化的技术支持服务队伍, 完善的技术支持服务体系。现场服务人员负责网络的监控、简单故障的解决,接听技术热线。现场服务人员按照计划对现场工作终端、楼层设备、机房及机房设备等进行例行巡检。技术专家负责重大故障的处理,定期对运行情况进行分析,并提出整改或优化方案和建议。服务响应(1)日常服务响应时间由于针对本项目采用的驻留现场服务方式, 维护团队需指派驻 3 名资深工程师采取同步的作息时间,因此,现场服务的响应时间为及时响应。2)事故分级响应服务时间各级故障事件的最晚响应时间为:确认时间

16、一级故障事件二级故障事件三级故障事件四级故障事件1 小时技术服务人员4 小时专业工程师技术服务人员24 小时技术支持专家专业工程师技术服务人员48 小时服务项目经理服务项目经理专业工程师技术服务人员故障事件等级划分如下:一级故障事件: 现有的网络或系统停机, 或遭到严重攻击行为或安全事件, 对信息系统的业 务运作有重大影响;二级故障事件: 现有网络或系统的操作性能严重降级, 或由于网络性能失常或安全事件严重 影响信息系统用户业务运作;,但大三级故障事件:网络或系统的操作性能受损,安全事件(例如病毒在小范围内发作) 部分业务运作仍可正常工作;四级故障事件:在网络、服务器、存储、安全设备功能、安装

17、或配置方面需要调整或优化。 本级故障事件对信息系统的业务运作几乎无影响,或影响很小。依据事故重要性和紧急性的原则, 每一级事故严格定义升级时间为 2 小时,其中在二级事故 和一级事故应急处理过程中, 要及时考虑替代恢复方案, 尽可能在最短的时间内恢复业务系 统。其中三级事故的处理, 驻场服务人员在事故响应 1 个小时内, 如果不能快速判断问题所 在,可以寻求整个服务团队的支持。在一、二级事故判断中,服务人员在监控中发现问题, 一方面应迅速将问题向部门领导进行反应, 一方面须快速判断问题和收集事故信息, 涉及到 具体产品提供商或服务商内, 及时告知客户协调相关厂商现场支持。 为保障业务平台的正常

18、 运行,除对突发故障的应急支持外, 要充分保障日常对业务系统软硬件的应急灾备恢复预案, 并通过定期的演练加强应对突发事故的意识和流程。服务报告维护团队定期提供服务报告, 服务期结束前应提供服务年报, 并对每一次重大故障和问题的 原因、解决方法、完成情况等形成专门报告,及时报送用户部门和服务管理部门。在运维服 务过程中将产生不限于以下的记录和报告:日常维护报告系统巡检日志系统维护记录系统优化记录各类优化的管理制度故障分析处理记录故障整改方案和建议交接班登记表重大故障记录报告运维保障资源库建设在运维工作开展前期, 把有助于用户运维的相关资料进行收集整理, 以确保在实际运维过程 中不会由于缺少沟通或

19、者遗漏部分环节导致的问题处理延迟,具体保障资源如下:主机设备相关资料收集:整理各设备相关管理人员联系方式、 设备物理位置等, 书面文档与电子文档相结合, 以确保 出现设备故障或需要远程支持时能在第一时间联系到具体负责人, 及早完成设备故障处理工 作。设备操作文档收集:整理设备有关的操作文档, 并整理成册, 书面文档与电子文档相结合, 辅助工程师处理相关 问题。设备配置库整理汇总: 整理所有设备原始配置资料,整理入库,且在修改设备配置后及时对录入的数据进行更新, 以确保设备配置的准确性及安全性。运维知识库的建立和维护: 收集维护过程中出现的各类资料,进行分类整理入库,为维护工作提供知识库。其他要

20、求项目管理维护团队应派遣一名具有专业知识的资深管理人员负责本项目的项目管理,统筹相关工作, 项目监督与情况汇报, 控制工作质量和预算, 执行变更和应急情况管理, 并根据实际状况调 整服务方人员安排,以保证此项目的正常高效运作。质量管理维护团队应根据本项目要求提出服务质量管理及监控具体措施, 并对所提供的服务质量和标 准做出明确可量化的承诺。技术交流及培训维护团队应提供必须的服务技能培训, 并对相关技术问题进行充分交流, 以提高用户技术水 平, 使用户能熟练使用现有系统。 培训包括不定期或面对面培训, 并提供对部分用户简单故 障排除方法培训。云平台及网络环境搭建平台服务器云服务器配置清单应用说明CPU内存操作系统数据盘网络数量说明应用服务器 18H16GCentOS 64 位200G20M1续期应用服务器 28H16GCentOS 64 位200G20M1续期应用服务器 38H48GCentOS 64 位300G01续期应用服务器 48H16GCentOS 64 位200G20M1新增应用服务器 58H16GCentOS 64 位200G01新增应用服务器 68H16GCentOS 64 位200G20M1新增企业应用防火墙1新增保底带宽 10Gbps1新增主机安全检测与防御 HIDS1新增

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1