网站慢综合分析报告模板.docx
《网站慢综合分析报告模板.docx》由会员分享,可在线阅读,更多相关《网站慢综合分析报告模板.docx(10页珍藏版)》请在冰豆网上搜索。
网站慢综合分析报告模板
X市X区信息委
X网站慢问题综合分析报告
项目名称
X区信息委安全运维项目
实施地点
X区X200号
响应单位
X信息技术有限公司
响应时间
X年3月5日
文档修订情况
版本
修订记录
日期
准备
修订
审核
v1.0
正式发行
X-03-16
X
V1.1
更新网络拓扑图和棱镜系统分析图
X-3-19
X
1问题背景
故障地点:
X区信息委(X200号)
故障现象:
领导反映打开X网站缓慢。
故障详细描述:
打开XX网站较慢,打开的时候会停留在空白页面5-7秒钟,之后才能完全显示网站内容,这种情况无论是在内网(科委内),还是在外部网络访问,都存在这种问题。
2概述
2.1工作目的
通过采取一系列的问题分析和排查步骤,能够定位问题所在并能够根据测试信息提供可以优化或改善系统性能的建议方案。
2.2工作计划
在接到X信息委的应急通知后,X制定以下工作计划以响应网站速度慢这个问题。
表2-1:
工作计划
时间安排
工作内容
人员安排
3月5号
初步了解了一下问题情况,熟悉了整体网络架构。
、
3月6号
在网络出口分析网络流量,排查设备配置情况。
3月8号
内网扫描网站服务器和网络恶意代码扫描
3月12-16号
外网访问X网站性能体验检测与分析
3月14号
内网访问网站性能分析,提取网站应用日志
、
3月20号
内网链路性能及响应时间分析
2.3工作内容
关于网站慢,这个问题是个系统性的复杂问题,需要持续跟进并逐项对可能的原因进行分析和排查。
为了分析网站慢的根本原因,在定位问题的初步阶段,X依照以下方面展开工作。
1、从因特网外部对服务器进行扫描;
2、从内部对服务器进行扫描;
3、网络出口带宽分析
4、服务器日志分析(请着重保留此网站服务器的日志,最少1-3个月的日志量)
5、网络架构安全与性能分析(需要有问题涉及的详细网络拓扑图)
6、F5设备日志分析和负载分析;
7、网站负载分析(包括白天和晚上的连续监控)
8、网络相关链路故障分析(需要检查网络链路的相关设备)
9、X网访问测试(包括白天和晚上,关于晚上的X网访问测试,请吩咐运维商晚上访问并提交相关网站响应的记录给我们)
10、直接外网访问测试(白天访问,提供不同时段的访问响应时间分析)
11、网站架构分析
12、X网下载速度测试
13、F5设备重点排查,F5设备配置和最新操作
14、WAF设备检查和分析
15、可能情况下设备隔离分析
16、网络延迟:
包括设备延迟、传输距离延迟和带宽延迟
17、服务器响应时间:
建立连接性能、页面请求响应性能及应用和服务可用性。
18、交换机、流控设备和负载均衡设备负载情况
19、网络中传输的原始数据包
3网络概况
从X区信息委网络管理员处获得网络的基本情况,了解网络的简单拓扑图如图1所示:
从图1可以知道,网络中有四个核心,分别是朱家角镇电信机房核心,徐泾镇电信机房核心、新机房核心和X机房核心,而X机房核心又是整个网络的出口,上联6509,经Radware和流控设备,通过HY2000连接互联网。
图3-1:
网络拓扑图
4问题分析
在问题分析的前期解决,采取的主要措施包括:
中心交换机负载查看、网络抓包分析、网络恶意代码(僵尸网络和木马)扫描、网站服务器内网安全检测、网站应用安全评估、网站服务器日志分析、内网访问网站性能分析和外网访问网站性能分析。
4.1交换机负载查看
以超级终端方式登录中心交换机,发现交换机的负载并不高,立即清除交换机ARP表,但故障仍然存在。
4.2网络抓包分析
在核心交换机12500(X核心)上配置好端口镜像(具体配置信息,略),并安装科来网络分析系统的笔记本接到中心交换机的镜像口上进行网络抓包。
由于sniffer分析系统可以跨VLAN对数据进行捕获分析,所以同时在中心交换机上接入安装sniffer网络分析系统。
使用sniffer网络分析系统,在上班高峰期的一个小时内,采集四次数据,每次采集数据包约1分钟(捕获停止后发现确切时间是53秒)后停止捕获,并对捕获到的数据通讯进行分析。
图4-1:
在8:
15监控到网络使用情况
有上图可以看出,HTTP流量占总流量的73.367%即网路内的主要流量是HTTP的流量。
图4-2:
8:
30监控到的网络使用情况
这个时间段上网总流量开始增加,TCP流量增长迅猛,此时正值上班高峰期,各种应用程序和服务都需要发送请求和建立链接。
图4-3:
8:
45监控到的网络使用情况
到8:
45分,流量恢复正常,基本上还是HTTP流量占据主导地位。
图4-4:
9:
00监控到的网络使用情况
小结:
经过对上班高峰期流量抓取分析,网络应用层HTTP协议占用了55%以上的带宽,并无发现其他突发异常流量。
期间核心交换机运行平稳,CPU负载都在5%作用。
4.3网络恶意代码分析
为了排除网路内的恶意代码占用带宽和影响主机性能的情况,X在3月8号对X信息委的网路进行了网络恶意代码检测。
检测到疑似木马种类1种,攻击次数265次,同比增长∞%,涉及感染主机3台,同比增长∞%,对受害的主机分析,发现新进受害主机3台。
图4-5:
攻击概况
关于受害主机的详细情况如下图所示:
图4-6:
受害主机情况
关于攻击主机的情况如下图所示:
图4-7:
攻击主机信息
此次扫描并未发现高位和中危木马和僵尸网络。
也没发现大批量的主机感染相关恶意代码。
除上图所示的受害主机外。
4.4网站服务器内网安全检测
通过对X区科委门户网站所属服务器进行安全审计工作,以便检查由于服务器安全因素导致的性能问题。
分析门户网站系统从网络上、系统上所存在的弱点、漏洞。
图4-8:
网站服务器信息
此次评估中发现高危漏洞0类,中危漏洞2类,低危漏洞2类,结果综合了人工评估和
工具扫描的结果
图4-9:
主机漏洞概况
图4-10:
主机弱点分布
网站服务器虽然存在部分漏洞,但未有影响服务器性能的关键要素存在。
4.5网站服务器日志分析
X在3月14号获得网站服务器的应用日志,并于3月15号进行了分析。
获得的日志介于X年7月28到X年11月16日。
这个日期之后的日志并不存在。
很难从最新日志进行问题判断。
但从三年的日志中可以分析到平均每天的消耗带宽。
如下图所示:
图4-11:
带宽消耗概况
如图4-11所示,其中关键的指标有,每天平均消耗带宽X,每个点击的平均带宽为X
根据日志统计,通常在上午8点到9点这段时间对X网站的访问比较活跃。
最活跃的天数是X年的3月14号即星期三。
最活跃天消耗的带宽为X。
详细参见图4-12。
因此通常在最活跃天的时候,网站访问变慢将是在早晨8点到9点这段时间。
由于访问量加大,随着对带宽的消耗也增多。
网路变的拥塞属于正常状况。
图4-12:
事务摘要
4.6内网访问性能分析
3月14号,X工程师在X信息委办公室内网进行访问X网站并进行了实时监测。
关于所使用的工具及测试客户端的信息如下:
在加载网站首页的时候,对相关时间指标进行了检测。
发现在4.841秒后浏览器才开始下载页面。
在3.910秒内完成了最后一个页面的下载。
问题在于开始下载页面的等待时间过长,通常打开一个页面至完全下载完毕应该控制在4.4秒之内。
在本次进行内网访问网站时,对页面加载过程中的各个网页元素的加载时间也进行了统计。
发现有几个元素的加载耗时比较长。
具体参考图4-14,在图4-14中列出了相关网页元素的URL地址。
耗时比较长的页面元素主要集中在所加在的各种脚本和CSS。
建议对相关代码进行优化。
这些元素的加载时间分别是:
2.605秒,2.581秒,2.579秒,2.571秒。
图4-13:
网页加载时间图
图4-14:
网页元素加载时间图
图4-15:
关键时间性能参数
在页面加载过程中的等待时间过长。
耗时1.771秒。
在另外一次的测试中,发现在5.564秒后,浏览器才开始下载页面。
此现象属于异常现象。
4.7外网访问网站性能分析
X使用棱镜系统对XX网站进行了检测。
性能指标的历史曲线参考如下:
图4-16:
性能指标曲线-首屏时间
如图4-16表明,在3月12号凌晨到3月16号凌晨这段时间内,网页首屏的时间基本保持在4.5秒之内,但4月15号的4.75秒例外。
说明从外网访问正常。
图4-17-1:
性能指标-内容下载时间
图4-17-2:
检测数据列表
图4-18:
性能指标-网络层时间图
从4-17-1的内容下载时间图和4-17-2的检测数据列表中可以看到基础页面的下载时间最大在2.16秒之内。
耗时比较长的方面在内容下载时间和网络层下载时间。
尤其网络层时间耗时最多,平均6.104秒。
关于网络层时间的具体情况可以参考图4-18。
从4-19的ping延时检测数据来看,一周时间内最大延迟也没超过60ms,正常都控制在平均41.8ms。
属于正常水平。
在3月16号延迟偶尔达到58ms以上。
此原因应该归于网络性能问题。
可能由运营商网络状况引起。
图4-19:
Ping延时检测数据
在图4-20和4-21中,反映了运营商网络的状况。
其中中国联通的延时最大,在55秒以上。
有线通的丢包率在8%以上。
XX网站采用电信的网络,则排除延迟情况。
图4-20:
运营商延迟图
图4-21:
运营商网络丢包率
5结论与建议
通过以上分析,造成网站访问慢的主要原因有以下几点:
第一、在上班高峰期8-9点和中午12-13点间,访问量大,服务器负载较大而引起延迟;
第二、运营商网络不稳定或线路问题,引起延迟在50ms以上并伴随一定比例的丢包;
第三、网页上使用了大量的脚本和CSS样式。
其中CSS样式表代码效率较低,需要优化。
首页上使用的脚本程序也需要优化。
此次,对XX网站进行了初步的关键组件的排查。
后续还将开展网站渗透测试工作和在内网使用检测设备检测网络链路和设备响应性能的工作。
这些工作将作为安全运维工作的一部分而开展。
建议如下:
测试运营商(ISP)的网络延迟和丢包率测试;对网站应用程序中使用的脚本(如date.js)和css样式代码进行优化。