WLAN常见问题和故障维护应急处理流程.doc
《WLAN常见问题和故障维护应急处理流程.doc》由会员分享,可在线阅读,更多相关《WLAN常见问题和故障维护应急处理流程.doc(8页珍藏版)》请在冰点文库上搜索。
站点故障应急处理流程
站点故障一般处理流程
应急技术实施预案
1.1WLAN公众网应急方案
1.1.1覆盖区域无信号
故障现象
在覆盖区域内找不到AP信号,
故障原因
可能的原因有:
原因一:
AP断电;
原因二:
网线断路;
原因三:
供电模块故障;
原因四:
AP故障;
排除故障
故障处理方式与步骤:
步骤一
先根据原始资料确定出问题AP;
步骤二
再从网管处看此AP是否报警,是转步骤三
步骤三
检查电源、线路、供电模块及AP,确定故障原因
步骤四
根据故障原因解决,如重新接电、更换故障设备
应急建议
要求对现场熟悉、对设备位置熟悉,方案随时带在身边
1.1.2用户无法获取IP地址
故障现象
用户无法获取ip地址
故障原因
可能的原因有:
原因一:
用户端网卡配置问题;
原因二:
用户端到AC的中间链路问题;
原因三:
AC上对应ip-pool配置问题:
原因四:
AC上没有可用于分配的ip地址了(ip-pool地址耗尽)
排除故障
故障处理方式与步骤:
步骤一
检查用户端网卡配置,设置为自动获取ip地址,在cmd下先执行ipconfig/release;再执行ipconfig/renew;
步骤二
在AC上显示用户列表,查看用户端网卡是否已经有分出了的地址;如果是,在AC上执行释放IP,如果没有,转入步骤三。
步骤三
在AC上查看ip-pool,查看是否有可用于分配的ip地址,如果没有,尽快增加更多的ip-pool。
如果还有,转入步骤四。
步骤四
通过AC来PINGAP地址,检查到用户端的链路情况是否正常。
在哪个位置出现问题,去出现问题的设备处检查解决。
应急建议
如果是ip-pool地址耗尽了,尽快增加更多的ip-pool地址。
预留部分网段做应急用,及时监控地址池的分配情况,随着用户量的增加经常出现地址短缺情况的,及时扩大地址池。
1.1.3用户获取IP地址但无法上网
故障现象
用户无法打开网页
故障原因
可能的原因有:
原因一:
DNS服务器有问题;
原因二:
AC往外网的路由不通;
排除故障
故障处理方式与步骤:
步骤一
更换DNS服务器看是否解决,否则转入步骤二
步骤二
在telnetAC,然后往外网一步步ping,看哪段出现问题,然后进行解决
应急建议
需要路由器、AC、防火墙厂家紧密配合
1.1.4用户无法通过认证
故障现象
用户无法通过认证
故障原因
可能原因:
原因一:
用户名/密码错误;
原因二:
帐号吊死;
原因三:
AC与Radius通信问题:
原因四:
Radius问题
排除故障
故障处理方式与步骤:
步骤一
判断保障是个别用户还是全部,如果是个别用户,进入步骤二;如果普遍情况,进入步骤三。
步骤二
先到AC上查看在线用户的帐号,查看用户是否在线;如果在线,强制用户下线;如果不在线,通过radius日志查看用户帐号属性以及用户认证日志判断原因所在,进一步处理。
步骤三
先到AC上pingradius地址,看是否通;在查看AC上统计到的radius认证报文情况,判断radius是否有问题。
步骤四:
登录Radius服务器,检查系统工作进程是否正常,必要时重启进程或手工进行主备切换。
应急建议
如果是整体无法认证的话,先在AC上执行开放认证。
方法是在AC上的配置界面里面,执行所有IP的源地址直通设置。
1.1.5流量拥塞
故障现象
用户访问网页太慢,同时在网管上看到站点交换机流量太大
故障原因
可能的原因有:
原因一:
有人利用BT等高速下载工具下载。
原因二:
个别用户电脑感染病毒,发送大量广播包。
排除故障
故障处理方式与步骤:
步骤一:
通过网络流量分析系统,来分析问题站点的流量,看是哪些流量造成的。
并定位用户。
步骤二:
通过AC上,显示用户流量,查看问题站点哪些用户流量较大,将这些用户强行下线,由站点维护人员排除用户故障。
应急建议
对用户全部进行带宽限速,并限制使用高速下载工具等应用。
1.2设备故障应急流程
1.2.1设备宕机
由于Radius、路由器、交换机、AC、防火墙等系统均具有双机的热备份,在一般情况下,主设备宕机之后,业务会自动切换到备用设备之上,不会对业务造成影响。
碰到异常的情况,即主设备出现宕机的时候,业务并没有切换到备用设备之上,可以通过网管监控设备上联口流量,可以及时发现,发现之后,马上在机房或站点设备位置对主设备进行断电或者拔下与备用机相连的心跳线,手工进行切换。
对于上述两种情况,业务切换到备用机上之后,我们要在第一时间对主设备进行故障排除,如果是硬件问题,应该及时更换机器,保证热备系统的正常环境。
认证故障
A方案
认证恢复
B方案
即在认证平台故障时,首先启用A方案流程,如A方案出现问题可再启用B方案流程,在A流程或B流程启动后如认证平台故障恢复则重新恢复正常认证。
1.2.2站点出现信号弱或无信号情况
应急小组须常备设备(笔记本、测线器、备件等)及时到现场。
对现场信号情况进行测试,判断出故障原因,如是分布原因或本身设备原因,立即排除故障;如是合作厂家设备原因,及时通知,配合解决。
铁通运城分公司网络部
2015-1-26