第10章 常见网络故障处理Word下载.docx
《第10章 常见网络故障处理Word下载.docx》由会员分享,可在线阅读,更多相关《第10章 常见网络故障处理Word下载.docx(57页珍藏版)》请在冰豆网上搜索。
逻辑故障表现为网络不通,或者同一个链路中有的网络服务通,有的网络服务不通。
一般可以通过Ping命令检测故障,并通过重新配置网络协议或网络服务来解决问题。
2.按照网络故障的对象分
按照网络故障出现的对象,网络故障可分为网络服务器故障、线路故障和路由器故障。
网络服务器故障一般包括服务器硬件故障、操作系统故障和服务设置故障。
通常主要的原因是操作系统故障。
当网络服务故障发生时,首先应当确认服务器是否感染病毒或被攻击,然后检查服务器的各种参数设置是否正确合理。
线路故障是网络中最常见和多发的故障。
线路故障时应该先诊断该线路上流量是否还存在,然后用网络故障诊断工具进行分析后再处理。
路由器故障也是网络中常见的,由于现在网络中路由器设备的大量采用,一旦出现故障就会使网络通信中断。
路由器故障的现象有时和线路故障相似,因此在诊断时要注意区分处理。
检测这种故障,需要利用专门的管理诊断工具,用它收集路由器的路由表、端口流量数据、计费数据、路由器CPU温度、负载及路由器的内存余量等数据。
一般可以利用网管系统中的专门进程不断地检测路由器的关键参数,并及时给出报警。
3.按照引起网络故障的原因分
按照引起网络故障的原因,网络故障可分为配置故障、连通性网络故障、网络协议故障和安全故障。
(1)配置故障
配置故障指的是Windows2000Server网络系统及相关网络中的客户机配置内容不当引发的网络故障。
在组建局域网的过程中,由于系统的配置十分复杂,很多重要的参数配置一旦被修改、破坏会导致网络系统故障。
常见的配置故障现象包括:
●某些工作站无法和其他部位工作站实现通信。
●工作站无法访问任何其他设备。
●只能Ping通本机。
●当局域网连入hternet时,用Ping命令检测正常,但无法上网浏览。
(2)连通性网络故障
连通性网络故障的现象是网络不通。
连通性网络故障通常涉及网卡、网线、交换机、路由器等设备和通信介质。
其中任何一个设备的损坏,都会导致网络连接的中断。
设备电源的突然关闭或损坏是造成连通性网络故障常见原因之一。
(3)网络协议故障
局域网中使用的网络协议出现故障,网络中的工作站无法登录服务器。
网络协议故障通常涉及网卡、网络协议安装、配置与管理等内容。
其中任何一项故障,都会导致网络连接的中断。
网络协议的配置错误是造成网络协议故障主要原因之一。
(4)安全故障
安全故障通常表现为系统感染病毒、存在安全漏洞、有黑客入侵等几个方面。
当局域网连入Internet时,没有做好安全防护的网络体系很容易出现安全故障。
对于这类故障的现象通常表现为网络的交通流量突然变大,服务器的端口十分繁忙,系统负载极大,网络响应明显变慢。
另外局域网中没有设计完善的防病毒体系和安全机制也是导致网络安全故障的基本原因。
很多时候局域网内部一处机器病毒感染,导致全网环境内扩散病毒,甚至产生许多不明原因的恶意攻击。
例如在日常的计算机维护中,为了方便机器之间传送文件,对机器的部分文件夹进行共享。
文件共享一开,表面上方便了维护,可是网络病毒一旦大肆扩散的时候,就难于清理和控制了。
为了解决文件共享的需要,我们可以在局域网内做一个简单的FTP服务器,避免使用操作系统的文件共享服务。
总之,在日常的维护中,千万不要忽视一些技术上的细节问题。
特别是在安全体系的设计问题上,一个很小的细节失误也会造成网络瘫痪这样的大故障。
作为技术维护人员,应该养成细致的习惯,更要有网络整体安全的防范意识。
10.2网络故障诊断
一、网络故障诊断概述
当网络出现故障时,学会分析网络故障的原因对解决网络故障有很大的帮助。
诱发网络故障的原因通常有以下几种可能:
物理层中物理设备相互连接失败或者硬件及线路本身的问题;
数据链路层的网络设备的接口配置问题;
网络层网络协议配置或操作错误;
传输层的设备性能或通信拥塞问题;
上三层或网络应用程序错误。
网络故障的原因中,由网卡安装设置、计算机操作系统的网络配置因素造成的问题占了很大比例。
二、网络故障检测步骤
1重现网络故障
当出现故障时,首先应该重现故障,与此同时应该尽可能全面地收集故障信息,这是获取故障信息的最好办法。
在重现故障的过程中还要注重收集这些方面的故障信息:
●该网络故障的影响及范围
●故障的类型
●每次操作都会让该网络故障发生的步骤或过程
●在多次操作中故障是偶然才发生的步骤或过程
●故障是在特定的操作环境下才发生的步骤或过程
重现故障时,还需要网管人员对网络故障具有比较好的判断能力,并做好适当的准备工作。
有些故障在重现时,可能会导致网络崩溃,因此在决定进行网络故障重现时要注意这方面的问题。
2网络故障分析与定位
重现故障后,可以根据收集的资料对故障现象进行分析。
根据网络故障的分析结果确定故障的类型并初步定位故障范围。
并对故障进行隔离。
从故障现象出发,以网络诊断工具为手段获取诊断信息,确定网络故障点,查找问题的根源。
OSI的层次结构为管理员分析和排查故障原因提供了非常好的组织方式。
由于各层相对独立,按层排查能够有效地发现和隔离故障,因而一般使用逐层分析和排查的方法。
通常有两种逐层排查方式,一种是从低层开始排查,适用于物理网络不够成熟稳定的情况,如组建新的网络、重新调整网络线缆、增加新的网络设备;
另一种是从高层开始排查,适用于物理网络相对成熟稳定的情况,如硬件设备没有变动。
无论哪种方式,最终都能达到目标,只是解决问题的效率有所差别。
具体采用哪种方式,可根据具体情况来选择。
例如,遇到某客户端不能访问Web服务的情况,如果首先去检查网络的连接线缆,就显得太悲观了,除非明确知道网络线路有所变动。
比较好的选择是直接从应用层着手,可以这样来排查:
首先检查客户端Web浏览器是否正确配置,可尝试使用浏览器访问另一个Web服务器;
如果Web浏览器没有问题,可在Web服务器上测试Web服务器是否正常运行;
如果Web服务器没有问题,再测试网络的连通性。
即使是Web服务器问题,从底层开始逐层排查也能最终解决问题,只是花费的时间太多了。
如果碰巧是线路问题,从高层开始逐层排查也要浪费时间。
网络故障检测可以使用多种工具:
路由器诊断命令、网络管理工具和包括局域网或广域网分析仪在内的其它故障诊断工具。
查看路由表,是开始查找网络故障的好办法。
基于ICMP的ping、trace命令和Cisco的show命令、debug命令是获取故障诊断有用信息的网络工具。
在路由器上,利用showinterface命令可以非常容易地获得待检查的每个接口的信息;
showbuffer命令提供定期显示缓冲区大小、用途及使用状况;
showproc命令和showprocmem命令可用于跟踪处理器和内存的使用情况。
定期收集这些数据,在故障出现时可以用于诊断参考。
对故障现象进行分析之后,就可以根据分析结果来定位故障的范围。
要限定故障的范围是否仅出现在特定的计算机、某一地区的机构或某一时间段。
由于一些本质不同的故障其现象却非常相似,因此仅通过表面现象,往往无法非常准确地将故障归类、定位。
一旦确认局域网出现故障,应立即收集所有可用的信息并进行分析。
对所有可能导致错误的原因逐一进行测试,将故障的范围缩小到一个网段或节点。
在测试时,不能根据一次的结果就断定问题的所在,而不再继续进行测试。
因为故障存在的原因可能不只一处,使用尽可能的方法,并对所有的可能性进行测试,然后做出分析报告,剔除非故障因素,缩小故障发生的范围。
另外,在故障的诊断过程中,一定要采用科学的诊断方法,以便提高工作效率,尽快排除故障。
在定位故障时,应遵循“先硬后软”的原则,即先确定硬件是否有故障,再考虑软件方面。
3网络故障的排除
确定网络故障原因后,要采取一定的措施来隔离和排除故障。
如果故障影响整个网段,那么就通过减少可能的故障源来隔离故障。
例如,将可能的故障源仅与一个网络中的节点相连,除这两个节点外,断开其他所有网络节点。
如果这两个网络节点音能正常进行网络通信,可以再增加其他节点。
如果这两个节点不能进行通信,就要逐步对物理层的有关部分进行检查。
如果故障能被隔离至一个节点,可以更换网卡,重新安装相应的驱动程序,或是用一条新的双绞线与网络相连。
如果网络的连接没有问题,那么检查一下是否只是某一个应用程序有问题,使用相同的驱动器或文件系统运行其他应用程序,与其他节点比较配置情况,试用该应用程序。
如果只是一名用户出现使用问题,检查涉及该节点的网络安全系统。
检查是否对网络的安全系统进行了改变以致影响该用户。
一旦确定了故障源,那么识别故障类型是比较容易的。
对于硬件故障来说,最方便的措施就是简单的更换,对损坏部分的维修可以以后再进行。
对于软件故障来说,解决办法则是重新安装有问题的软件,删除可能有问题的文件并且确保拥有全部所需的文件。
如果问题是单一用户的问题,通常最简单的方法是整个删除该用户,然后从头开始或是重复必要的步骤,使该用户重新获得原来有问题的应用。
这比无目标地进行检查、逻辑有序地执行这些步骤可以更快速地找到问题。
4网络安全的检查
在网络故障被排除之后,还应该记录故障并存档,并且再次验证故障是否真正被排除。
对于网络安全故障,在排除后还要详细分析产生的原因并对系统进行全面的安全检查,确保系统的安全。
对于Windows2000网络系统的安全检查内容包括:
(1)物理安全
(2)停掉Guest账号
(3)限制不必要的用户数量
(4)创建两个管理员用账号
(5)把系统Administrator账号改名
(6)把共享文件的权限从“everyone”组改成“授权用户”
(7)使用安全密码
(8)设置屏幕保护密码
(9).使用NTFS格式分区
(10).必要时运行防毒软件
(11)保障备份盘的安全
(12)利用Windows2000的安全配置工具来配置策略
(13)关闭不必要的服务
(14)关闭不必要的端口
(15)打开审核策略
(16)开启密码策略
(17)开启账户策略
(18)设定安全记录的访问权限
(19)把重要敏感文件存放在另外的文件服务器中
(20)不让系统显示上次登录的用户名
(21)禁止建立空连接
(22)到微软网站下载最新的补丁程序
(23)关闭DirectDraw
(24)必要的时候使用文件加密系统EFS
(25)加密temp文件夹
(26)锁住注册表
(27)关机时清除掉页面文件
(28)禁止从软盘和CD-Rom启动系统。
(29)考虑使用IPSec。
10.3故障诊断工具
故障的正确诊断是排除故障的关键,因此选择好的故障诊断工具是很重要的。
这些工具,既有软件工具,也有系统命令,功能各异,各有长处。
Windows2000Server中包括几种常用的网络故障测试诊断工具,主要有IP测试工具Ping、测试TCP/IP协议配置工具Ipconfig、网络协议统计工具Netstat和Nbstat、跟踪工具Tracert和Pathping。
这些工具需要在命令行方式下执行,运行前必须先启动命令行环境。
命令行就是在Windows操作系统中打开DOS窗口,以字符串的形式执行Windows管理程序。
进入了命令行操作界面(DOS窗口),在DOS窗口中只能用键盘来操作。
一、启动命令行环境
单击开始按钮,选择“运行”命令,在弹出的“运行”对话框中输入"
cmd"
命令,可进入命令行界面,也可以按下Windows快捷键+R直接打开运行对话框,再输入cmd命令,如图10-1、10-2、所示。
单击“确定”按钮,随后打开DOS窗口,如10-3所示。
图10-1从开始菜单启动命令行图10-2在运行对话框中输入命令cmd
图10-3命令行环境
有时命令的参数过多,可以在DOS提示符号下输入“命令名/?
”来获取相应的提示和帮助。
执行完命令后,要退出时可以输入命令“exit”,按回车键后,将关闭命令窗口,返回Windows2000Server操作系统环境。
二、IP测试工具Ping
Ping是Windows2000Server中集成的一个专用于TCP/IP协议网络中的测试工具。
Ping是测试网络联接状况以及信息包发送和接收状况非常有用的工具,是网络测试最常用的命令。
Ping命令用于查看网络上的主机是否在工作,它是通过向主机发送ICMPECHO_REQUEST包进行测试而达到目的的。
Ping命令把ICMPECHO_REQUEST包发送给指定的计算机,如果Ping成功了,则TCP/IP把ICMPECHOREQUEST包发送回来,以校验与本地或远程计算机的连接,其返回的结果表示是否能到达主机、向主机发送一个返回数据包需要多长时间。
对于每个发送的数据包Ping命令最多等待1秒。
使用Ping可以确定TCP/IP配置是否正确以及本地计算机与远程计算机是否正在通信。
此外,还可以使用Ping工具来测试计算机名和IP地址。
在本地的hosts文件中或DNS数据库中存在要查询的计算机名时,如果仅能够成功校验IP地址却不能成功校验计算机名,则说明名称解析存在问题。
一般在使用TCP/IP协议的网络中,当发生计算机之间无法访问或网络工作不稳定时,都可以试用Ping命令来确定问题的所在。
1.Ping命令的格式
Ping命令格式为:
Ping[参数1][参数2][…]目的地址
其中目的地址是指被测试计算机的IP地址或计算机名称。
2.Ping命令的常用参数
Ping命令常用参数的含义如下:
-t指定在中断前Ping可以向目的地持续发送回响请求信息。
如果想要中断并显示统计信息,可以按Ctrl+Break组合键;
要中断命令执行并退出,可以按Ctrl+C组合键。
-a:
指定对目的地IP地址进行反向名称解析。
如果解析成功,Ping将显示相应的主机名。
-nCount(计数):
指定发送回响请求消息的次数,默认值是4。
-lSize(长度):
指定发送的回响请求消息中“数据”字段的长度(以字节为单位),默认值为32,Size的最大值是65527。
-f:
指定发送的“回响请求”中其IP头中的“不分段”标记被设置为1(仅适用于IPv4)。
“回响请求”消息不能在到目标的途中被路由器分段。
该参数可用于解决“路径最大传输单位(PMTU)”的疑难。
-iTTL:
指定回响请求消息的IP数据头中的TTL段值。
其默认值是主机的默认TTL(生存时间TTL是IP协议包中的一个值,它告诉网络路由器包在网络中的时间是否太长而应被丢弃)值。
TTL的最大值为225。
注意该参数不能与-f一起使用。
-vTOS:
指定发送的“回响请求”消息中的p标头中的“服务类型(TOS)”字段值(只适用于IPv4)。
默认值是0。
TOS的值是0~255之间的十进制数。
-rCount:
指定p标头中的“记录路由”选项用于记录由“回响请求”消息和相应的“回响回复”消息使用的路径(只适用于IPv4)。
路径中的每个跃点都使用“记录路由”选项中的一项。
如果可能,可以指定一个等于或大于来源和目的地之间跃点数的Count。
Count的最小值必须为1,最大值为9。
-sCount:
指定IP数据头中的“Intemet时间戳”选项用于记录每个跃点的回响请求消息和相应的回响应答消息的到达时间。
Count的最小值是1,最大值是4。
对于链接本地目标地址是必需的。
-jHostList(目录):
指定“回响请求”消息对于HostList中指定的中间目标集在IP标头中使用“稀疏来源路由”选项(只适用于IPv4)。
使用稀疏来源路由时,相邻的中间目标可以由一个或多个路由器分隔开。
HostList中的地址或名称的最大数为9,HostList是一系列由空格分开的IP地址(带点的十进制符号)。
-kHostList:
指定“回响请求”消息对于HostList中指定的中间目标集在IP标头中使用“严格来源路由”选项(只适用于lPv4)。
使用严格来源路由时,下一个中间目的地必须是直接可达的(必须是路由器接口上的邻居)。
-wTimeout(超时):
指定等待回响应答消息响应的时间(以毫秒计),该回响应答消息响应接收到的指定回响请求消息。
如果在超时时间内未接收到回响应答消息,将会显示“请求超时”的错误消息。
-R:
指定应跟踪往返路径(只适用于lPv6)。
-SSrcAddr(源地址):
指定要使用的源地址(只适用于IPv6)。
-4:
指定将lPv4用于Ping。
不需要用该参数识别带有IPv4地址的目标主机,要按名称识别主机。
-6:
指定将lPv6用于Ping。
不需要用该参数识别带有lPv6地址的目标主机,要按名称识别主机。
仅需要按名称识别主机。
Ping命令可以可以通过在MS-DOS提示符下运行“Ping/?
”命令来查看Ping命令的格式及参数,如图10-4所示。
图10-4Ping命令的格式与参数
在Ping命令测试中,如果网络未连接成功,除了出现“RequestTimeout”错误提示信息外,还有可能出现“Unknownhostname(未知用户名),“Networkunreachable(网络没有连通,“Noanswer(没有响应)和“Destinationspecifiedisinvalid(指定目标地址无效)等错误提示信息。
“Unknownhosmame”表示主机名无法识别.通常情况下,这条信息出现在使用了“Ping主机名[命令参数]”之后,如果当前测试的远程主机名字不能被命令服务器转换成相应的IP地址(名称服务器有故障,主机名输入有误,当系统与该远程主机之间的通信线路故障等),就会给出这条提示信息.
“Networkunreachable”表示网络不能到达.如果返回这条错误信息,表明本地系统没有到达远程系统的路由。
此时,可以检查局城网路由器的配置,如果没有路由器(软件或硬件),可进行添加.
“Noanswer”表示当前所Ping的远程系统没有响应.返回这条错误信息可能是由于远程系统接受不到本地发给局域网中心路由的任何分组报文,如中心路由工作异常、网络配置不正确、本地系统工作异常、通信线路工作异常等。
“Destinationspecifiedisinvalid”表示指定的目的地址无效,返回这条错误信息可能是由于当前所Ping的目的地址已经被取消,或者输入目的地址时出现错误等。
3.常用Ping命令诊断
在使用Ping命令进行故障诊断时,可以通过Ping下列地址来判断故障的位置。
●Ping127.0.0.1:
在此命令执行时,计算机将模拟远程操作的方式来测试本机,如果不通,则极有可能是TCP/IP协议安装不正常,应删除TCP/IP协议,重新启动计算机,再重新安装TCP/IP协议:
或者网络适配器安装有问题,应删除后重新添加。
●Ping本机IP地址:
如果不通,则说明在相应端口上的协议绑定有问题,查看网络设置,可能是网络协议绑定不正确。
●Ping其他主机IP地址:
如果前两种方式都能Ping通,而不能Ping通其他主机的IP地址,那么说明其他主机的网络设置有问题,或者网络连接有问题,可以检查其他主机的网络设置,检查物理连接是否有问题。
4.Ping命令的应用
在局域网的维护中,经常使用Ping命令来测试一下网络是否通畅。
使用Ping命令检查局域网上计算机的工作状态的前提条件是:
局域网中计算机必须已经安装了TCP/IP协议,并且每台计算机已经配置了固定的IP地址。
如果要检查网络中另一台计算机上TCP/IP协议的工作情况,可以在网络中其他计算机上Ping该计算机的IP地址。
如果这台计算机的IP地址是192.168.1.3,应用Ping命令的操作步骤如下:
(1)输入Ping命令
在MS-DOS提示符下,输入Ping测试的目标计算机的IP地址或主机名,即运行“Pingl92.168.1.3”命令,如图10-5所示。
图10-5Ping测试的目标计算机连通信息
(2)查看结果
按回车键,如果客户机上TCP/IP协议工作正常,则会以DOS屏幕方式显示类似“Replyfrom192.168.1.3:
bytes=32time<
1msTTL=64”信息,如图10-4中返回信息提示所示。
(3)如果网络未连接成功,则显示“RequestTimeout(请求超时)”信息,如图10-6所示。
图10-6Ping测试的目标计算机失败信息
出现以上错误提示的情况时,就要仔细分析一下网络故障出现的原因和可能有问题的网上节点了,可以从以下几个方面来着手检查。
●网卡是否安装正确,IP地址是否被其他用户占用。
●检查本机和被测试的计算机的网卡及交换机(集线器)显示灯是否为亮,是否已经连入整个网络中。
●是否已经安装了TCP/IP协议,TCP/IP协议的配置是否正常。
●检查网卡的I/O地址、IRQ值和DMA值,是否与其他设备发生冲突。
如果还是无法解决,建议用户重新安装和配置TCP/IP协议。
三、测试TCP/IP协议配置工具
利用Ipconfig工具可以查看和修改网络中的TCP/IP协议的有关配置,例如IP地址、网关、子网掩码等。
利用这两个工具可以很容易地了解IP地址的实际配置情况。
1.Ipconfig命令的格式
Ipconfig命令格式为:
Ipconfig[/参数1][/参数2][/…]
常用参数的含义如下:
All:
返回所有与TCP/IP协议有关的所有细节,包括主机名、主机的IP地址、DNS服务器、节点类型、是否启用IP路由、网卡的物理地址、子网掩码及默认网关等信息。
release:
作用于向DHCP服务器租用IP地址的计算机。
如果输入ipconfig/release,那么所有接口的租用IP地址归还给DHCP服务器。
renew:
如果输入ipconfig/renew,那么本地计算机便重新与DHCP服务器联系并申请租用一个IP地址。
2.Ipconfig命令的应用
在DOS提示符下,输入ipconfig/all,执行结果如图10-7所示。
图10-