ITSS云运维资质申请资料1.docx

上传人:b****2 文档编号:2054594 上传时间:2022-10-26 格式:DOCX 页数:15 大小:455.68KB
下载 相关 举报
ITSS云运维资质申请资料1.docx_第1页
第1页 / 共15页
ITSS云运维资质申请资料1.docx_第2页
第2页 / 共15页
ITSS云运维资质申请资料1.docx_第3页
第3页 / 共15页
ITSS云运维资质申请资料1.docx_第4页
第4页 / 共15页
ITSS云运维资质申请资料1.docx_第5页
第5页 / 共15页
点击查看更多>>
下载资源
资源描述

ITSS云运维资质申请资料1.docx

《ITSS云运维资质申请资料1.docx》由会员分享,可在线阅读,更多相关《ITSS云运维资质申请资料1.docx(15页珍藏版)》请在冰豆网上搜索。

ITSS云运维资质申请资料1.docx

ITSS云运维资质申请资料1

数据监控实现方案

目录

1、Dashboard概览3

●展示多个实例的监控数据走势3

●展示多个监控项的数据对比4

●展示实例的资源消耗排序4

●展示多个实例的监控数据实时分布5

●展示多个实例某一监控项的聚合数据6

●全景盯屏展示6

2、主机监控7

●应用场景7

●混合云监控解决方案7

●企业级用户的监控解决方案7

●监控能力8

●报警能力8

3、报警服务8

●主机监控报警规则8

●云服务报警规则8

●自定义监控报警规则8

4、日志监控9

●面临的困难9

●传统架构9

●日志监控解决方案10

●日志监控闭环10

●我们的优势11

1、ARMS自应用监控,前端监控,和定义监控使用解析12

●应用监控:

面向分布式应用的实时监控12

应用拓扑的自我发现13

常用诊断场景的指标下钻分析13

异常事务和慢事务捕获13

事务快照查询13

●前端监控:

用户体验实时监控方案13

高时效性13

多维度监控分析13

页面异常监控13

●自定义监控:

深度定制业务监控13

丰富的数据源13

灵活的实时计算和存储编排13

灵活的报警和大盘对接13

●报警和大盘:

统一的报警和大盘能力。

13

灵活的报警配置功能13

丰富的实时大盘展现能力14

1、应用发布与管理14

2、数字化剖析系统监管应用运行状态14

3、构建分布式系统15

4、构建闭环式的研发运维体系15

5、精心打造的功能16

●支持集群的实时弹性伸缩功能16

●Java应用异常状态监测16

●应用发布与全应用生命周期管理16

●灵活的应用发布方式16

●一站式完成应用生命周期的管控16

●弹性伸缩16

●提供SpringCloud和Dubbo的商业解决方案16

●服务鉴权16

●角色与权限控制17

●立体化监控与数字化运营17

●全面兼容ApacheTomcat容器17

●分布式服务17

随着高速发展的信息化建设,云计算中心作为是云计算服务商主要提供的平台涉及云计算、云存储技术广泛应用等等,在此平台中新一代的云计算数据中心,不仅仅只是单一的动力和IT设备的集成,还包括绿色能源的整合应用、系统的智能控制、运维管理的自动化、数据的冗余热备等一系列新技术新产品的集成。

而对于相关的各类资源、各类应用、各类组件等都需要进行有效的管理和监控,才能使用平台运行的更高效、更稳定、更安全。

我们平台将针对不同的场景、环境、应用提供多种数据监控实现方案:

一、云监控

云监控(CloudMonitor)是一项针对资源和互联网应用进行监控的服务。

云监控服务可用于收集获取资源的监控指标,探测互联网服务可用性,以及针对指标设置警报。

1、Dashboard概览

使用云监控的Dashboard,您不仅能够查看服务概貌,还可以查看监控细节,并排查故障。

●展示多个实例的监控数据走势

例如您的一个应用部署在多台ECS实例上,可以将部署了相同应用的多台ECS实例监控信息添加在同一张监控图表中,查看相关多台机器的监控数据变化趋势。

例如在一张图表中同时展示ECS多个实例各自的CPU使用率的时间序走势。

●展示多个监控项的数据对比

云监控可在一张图表中展示一个ECS实例的CPU使用率、内存使用率、磁盘使用率等多个指标。

●展示实例的资源消耗排序

例如您有20台机器,通过表格展示可以查看20台机器的CPU使用率从大到小的排序。

快速了解资源消耗情况,更合理的使用资源,减少不必要的花费。

 

●展示多个实例的监控数据实时分布

例如通过热力图,展示一组ECS实例的CPU使用率分布情况,知晓每台机器的CPU使用率和其他机器相比,处于什么水平。

点击色块,可以查看该机器一段时间内的监控数据走势。

 

●展示多个实例某一监控项的聚合数据

例如在一张图表中查看ECS多个实例的CPU使用率的平均聚合值,从而了解整体的CPU使用率水位,判断是否各个实例资源使用不均。

 

●全景盯屏展示

Dashboard支持全屏展示和自动刷新,您可以将各类产品指标添加到监控大盘,在运维大屏上全屏展示。

2、主机监控

云监控主机监控服务通过在服务器上安装插件,为用户提供服务器的系统监控服务。

目前支持Linux操作系统和Windows操作系统。

●应用场景

无论您的服务器是本平台服务器ECS,还是其他云厂商的服务器或物理机,都可以使用主机监控服务。

主机监控服务采集丰富的操作系统层面监控指标,您可以使用主机监控服务进行服务器资源使用情况的查询和排查故障时的监控数据查询。

●混合云监控解决方案

云监控通过插件采集用户服务器监控数据,该插件支持安装在非ECS服务器上,解决您云上、云下双重环境的基础监控问题。

●企业级用户的监控解决方案

主机监控提供应用分组功能,支持将不同区域的服务器分配在同一分组中,真正从业务角度管理服务器。

同时提供分组维度的报警功能管理能力,一次规则设置可以作用全组,极大提升您的监控运维效率和管理体验。

●监控能力

云监控会提供CPU、内存、磁盘、网络等三十余种监控项,满足服务器的基本监控运运维需求。

●报警能力

云监控对以上所有监控项提供报警功能,您可以选择在单台服务器、应用分组、全部资源三个角度设置报警规则。

从业务角度的不同角度出发使用报警功能。

您可以直接在主机监控列表中使用报警功能,也可以将服务器添加到应用分组后,在分组中使用报警功能。

3、报警服务

用户可以对主机监控中的监控项、站点监控中的探测点、云服务监控中的实例和自定义监控中的监控项设置报警规则。

用户可以在全部资源、应用分组和单实例维度设置报警规则。

●主机监控报警规则

用户可以对主机监控中的全部监控项设置报警规则,云监控提供的报警探测频率最小为每分钟1次。

站点监控报警规则

用户可对站点监控中的探测点创建报警规则。

站点监控中报警规则的统计周期和探点的探测周期是一致的。

即您创建了1个探测周期为5分钟的探测点,则报警规则的统计周期也为5分钟,会5分钟监测一次探测点返回的数据,对比实际值是否超过了阈值。

●云服务报警规则

用户可对云服务监控中各产品的实例设置报警规则。

各个产品的监控项均可设置报警规则。

●自定义监控报警规则

用户创建监控项后,可对探测点的响应时间、状态码、丢包率等监控项设置报警规则。

报警规则的统计周期和创建监控项时的统计周期一致。

报警服务支持短信、邮件、事件订阅等等方式。

支持PC端报警消息推送。

如果您安装了APP,也可以通过APP接收报警通知。

4、日志监控

在企业级的业务运维和运营场景中,日志正扮演着越来越重要的角色。

业务日志的简单本地化存储,很难挖掘日志背后真正的数据价值。

将日志存储到集中的服务端后,将其处理成指导运维、指导运营的指标,成为企业日益迫切的需求。

●面临的困难

虽然日志处理、可视化和报警是很多业务都迫切需要的,但是将日志处理成真正有价值的数据,却决非易事。

比如以下问题:

✧日志格式的多样性,数据采集处理的逻辑复杂。

✧海量日志数据的分析能力。

✧处理结果的存储。

✧数据的可视化。

✧与报警服务的打通、自动化运维的实现。

✧与服务器等基础监控数据的整合。

一般来说,基于日志的监控分析服务,需要解决以上所有问题,才能形成业务闭环,完美解决企业的监控运维与运营诉求。

●传统架构

日志监控的经典方案是ELK,相信大家都不陌生。

ELK是成熟的日志监控方案,有着配置简单,前端展示绚丽,开源等诸多特点。

但ELK对一般企业来讲投入成本依然比较大:

✧架构、技术栈复杂,开发运维成本高。

✧只能解决日志监控中的一部分问题。

无法解决报警、数据整合等其他重要需求。

●日志监控解决方案

鉴于ELK投入成本大,但企业日常的日志处理场景大都比较简单,比如

✧对日志中的关键字报警

✧统计单位时间内的QPS、RT

✧统计单位时间内的PV、UV

传统的企业用户如果使用传统架构去解决这些常用的简单需求,投入大量时间和人力搭建庞大的攻城武器、付出沉重的运维成本,确实有些得不偿失。

针对上述问题,平台云监控和日志服务结合,推出了非常轻量级,但全面、易用的解决方案-日志监控。

云监控-日志监控的目标,是将复杂的传统日志监控功能实现,转化为鼠标的几次轻轻点击。

●日志监控闭环

使用流程概览

 

1.通过日志服务收集日志。

2.授权日志给云监控可读权限,查询您的日志。

3.使用日志监控定义监控指标的日志数据处理方式。

4.为监控指标设置报警规则、定义图表展示(可选)。

●我们的优势

✧简单易用、好上手。

✧免开通,随时用(只需要开通日志服务,将本地log收集日志服务),复杂的底层技术细节对您全透明。

✧完美结合云监控的主机监控、云服务监控、站点监控、应用分组、Dashboard、报警服务,形成完整的监控闭环。

提供您一个完整统一的视角,洞悉关于监控的一切。

✧基于平台Monitor服务,给您稳定可靠的体验。

✧全SaaS服务,几乎无运维成本。

✧成本优势:

几乎无时间和人力成本,帮您更快速的完成日志监控需求。

二、业务实时监控服务ARMS

业务实时监控服务(ApplicationReal-TimeMonitoringService,简称ARMS)是一款APM类的监控产品。

用户可基于ARMS的前端、应用、自定义监控,快速构建实时的应用性能和业务监控能力。

1、ARMS自应用监控,前端监控,和定义监控使用解析

●应用监控:

面向分布式应用的实时监控

应用拓扑的自我发现

通过对链路(Tracing)信息进行动态分析、智能计算,自动生成分布式应用间调用关系。

常用诊断场景的指标下钻分析

根据应用响应时间,请求数,错误率等指标下钻分析,按应用/事务/数据库多维度查看。

异常事务和慢事务捕获

基于调用事务(trace)的超时和异常分析,并有效自定关联到对应的接口调用如SQL,MQ等。

事务快照查询

智能收集基于调用链(trace)的问题事务,通过排查详细明细数据掌握异常或错误来源。

●前端监控:

用户体验实时监控方案

高时效性

实时感知用户实际访问网站的响应时间和错误率。

多维度监控分析

基于地区,运营商,浏览器等多维的用户访问速度和错误分析。

页面异常监控

针对应用大量的异步数据调用的性能和成功率进行监控和诊断。

●自定义监控:

深度定制业务监控

丰富的数据源

支持各类实时数据源如日志,SDK,MQ,Loghub等。

灵活的实时计算和存储编排

支持用户根据指定维度和计算方式自行编排实时计算和存储方式。

灵活的报警和大盘对接

监控数据集可快速对接ARMS报警和大盘平台,以提供各类场景的监控能力。

●报警和大盘:

统一的报警和大盘能力。

灵活的报警配置功能

支持基于各类数据集的自定义同比环比、指标维度的报警策略配置。

丰富的实时大盘展现能力

基于监控内容的各类丰富图标展示,可用于在线分析和大屏展示等不同场景。

三、企业级分布式服务EDAS

企业级分布式应用服务(EnterpriseDistributedApplicationService,简称EDAS)是一个围绕应用和微服务的PaaS平台,提供多样的应用发布和轻量级微服务解决方案,帮助用户解决在应用和服务管理过程中监控、诊断和高可用运维问题。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 人文社科

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1