随着Internet的高速发展,局域网络技术在企业、研究部门生产、管理、科研中得到广泛的应用。局域网上连往往要配置管理核心路由器和核心交换机,从而实现上连广域网和Internet。核心路由器状态的好坏直接影响整个局域网的性能。本文通过运用嗅探技术和路由管理技术完成了对核心设备网络故障排除的成功事例。
笔者在一个研究院工作,我院局域网骨干网采用ATM技术搭建,核心交换机为Fore7110并且有路由功能,通过以太网仿真ELAN技术,下连3台Fore7105构成研究院ATM骨干网,上连企业ATM网。网络拓扑为星型树结构。拥有10.65.100.0—10.65.111.0九个子网段,共2300个IP地址资源,足以满足我院 1248台PC电脑、138台工作站和网络交换设备对节点的需求。
研究院局域网光纤线路覆盖大小建筑34幢,共有信息点1150个。在Internet服务方面有域名服务系统、电子邮件系统和Web站点。
故障的出现
我院的Fore7100是支持最大交换1.6G带宽的具有路由功能的核心交换设备,一天,该交换机出现如下现象:
工作状态指示异常繁忙,交换速度极慢,又没有其它特征。网络连通测试(ping)是通的。单响应时间慢到300ns-900ns不等。Fore7010交换机的路由包监测发现无效路由包在极短的时间内增长很快,数量级为105~106甚至107。仅仅在10秒种内,有效的路由服务就瘫痪了,形成了网络安全上称为拒绝服务的攻击。
我们直接进入到 Fore7110交换机 ( 10.60.11.62),用stats命令显示路由记录信息。
Telnet 10.60.11.62
PB1_JSZ3:ip# stats -P IP(当前路由记录信息)
IP statistics: count since last stats clear
Datagrams forwarded: 170073
Datagrams rcvd: 175164
……
No route to send: 5507
……
(交换机无法发送的无效路由请求数)
经过查看显示的路由记录信息,发现8.3,8.5,8.6端口无效路由包请求增长很快。
检测过程
我们决定对Fore7110显示的几个无效路由包增加过快的几个端口进行监测。在没有相应的网络性能分析仪(Sniffer网络分析仪)的情况下,我们决定通过修改Fore的VLAN将需要监测的8.3、8.5、8.6等端口与具有snoop功能的Sun工作站jsz3上连口8.1划分到同一VLAN中。同时通过Fore7110 监控Monitor端口命令。需要注意:使用monitor 命令对交换设备有较大的性能的影响。
[1] [2] 下一页
步骤1: 登录核心交换机
Telnet 10.60.11.62
PB1_JSZ3:ip#media
PB1_JSZ3:media# segment pdisable 8.3,8.5,8.6
PB1_JSZ3:media# monitor set 8.3 to 8.6 on 8.1
执行jsz3的solaris系统的Snoop命令,进一步对1.1、8.3、8.5、8.6几个端口packet进行监视,发现IP地址分属于8.3、8.6端口的10.60.12.17、10.60.12.59、10.60.10.57的机器发送大量的路由包,8.5端口正常。确定了机器IP后我们自然想到为什么会有大量的路由请求呢?。以Sun工作站(10.60.10.57)为例。通过远程登录该机器。我们执行solaris系统的Snoop命令。
步骤2:远程登录
#Telnet 10.60.10.57
#