摘要:通过一起网络微机监控系统(即NCS)通讯中断故障,描述了网络微机监控系统结构图、故障发生时的现象、消除故障的过程和ping命令在通讯故障中的应用,并提出了杜绝此类问题的措施,对其它通讯故障的消除具有一定的借鉴意义。
关键词:微机网络监控系统;通讯中断;ping命令
0.概述
2014年3月12日,我厂远动通讯柜发生故障:根据调度反映,我厂母联断路器、线路断路器等设备位置接点显示每隔一段时间发生变化,与设备实际状态不符。通过检查我厂微机监控系统设备通讯回路,发现是由于网口插头松动和光缆受损造成;通过紧固网口插头、更换光纤通道,一举解决了该故障。 本文将详细介绍本次故障的处理过程,分析故障产生的原因,并提出了避免类似故障发生的具体措施。
1.网络微机监控系统结构图
我厂网络微机监控系统结构如图1所示:采集终端包括机组测控柜、线路测控柜、母线测控柜、公用测控柜。其中,机组测控柜安装主厂房电子间内,用于监测发电机实时状态;线路测控柜、母线测控柜、公用测控柜安装在网控室,分别用于监测线路、母线及启备变实时状态。所有测控装置通过网线分别通过A网、B网两条通讯通道接入远动柜内通讯服务器A、通讯服务器B,将设备实时信息传给调度。正常情况下,A网为主通道,B网为从通道。两台操作站分别位于集控室和网控室,通过操作站可以调取设备的实时数据和报警信息。 2.故障现象描述
根据调度人员反映:
⑴线路断路器、母联断路器、启备变断路器等开关位置信号发生变化,由合变分且持续时间在3-10s。故障每隔一段时间出现一次,每次出现较短。 ⑵调度人员和通讯人员通过检查,已排除调度侧出现问题的可能性。
⑶通过调取我厂操作站1、操作站2的故障信息记录,发现近期我厂A网、B网发生过同时中
断的现象,且A网通讯中断是最近出现而B网通讯在很长一段时间内一直存在通讯中断的现象。
3.故障原因和处理过程
根据故障现象,首先排除明显不可能的原因,大致确定排查方向。
⑴根据我厂网络微机监控系统接口图可以看出,运动柜内通讯服务器A、通讯服务器B分别与厂内通信通道A网、B网连接。正常情况下,服务器A为主通道,服务器B为备用通道,在服务器A出现故障后,通过通道切换装置可由服务器A自动切换至服务器B。如果通讯服务器出现故障,必须是两台通讯服务器同时出现故障,才会出现通讯中断的现象。两台服务器同时出现故障几率特别小;通过检查通讯服务器接线、调取通讯服务器本身故障记录,未发现异常状况,故通讯服务器本身故障可基本排除。
⑵通过分析此次通讯故障现象可知:出现问题的信号分别来自于来自网控室线路测控柜、母线测控柜、公用测控柜。三台测控柜内的测控单元通过两根网线分别接入交换机A、交换机B连入通讯网A、通讯网B。如果测控单元出现故障,必须是所有测控单元同时出现故
障,才会出现通讯中断的现象。测控单元同时出现故障几率特别小;通过检查通讯服务器接线、调取测控单元本身故障记录,未发现异常状况,故排除测控单元故障的可能性。
⑶通过以上分析,可以确定通讯故障出现在网控室交换机到电子件远动柜之间的通讯回路上。确定故障具体位置后进行以下工作:
①首先对通讯回路进行外观检查。在检查过程中发现,网控室A交换机尾纤插头松动,紧固尾纤插头,通讯回路A网恢复正常。联系调度值班人员,确认我厂与调度通讯以恢复正常。
②通讯A网通讯故障消除后,通讯B网的故障仍然存在。重新检查通讯B网通讯回路并紧固网线和光纤插头后,B网通讯故障未消失,排除B网插头松动的可能性。
③检查进行到此阶段,已经无法从设备报警记录和外观判断故障出现位置。与厂家联系,确定利用ping命令在操作站1、操作站2分别对机组测控柜、线路测控柜内相同装置同时进行通讯测试。测试结果如图1至图4。
从以上截取的报文可以看出:在相同的事件内,操作站1对线路测控柜有1%文件包丢失,
对机组测控柜无丢失;操作站2对机组测控柜有1%文件包丢失,对线路测控柜无丢失。结合我厂微机监控系统拓扑结构图可判断出:在设备发生通讯故障时,在操作站1对电子间设备通讯正常,对网控室设备通讯中断;操作站2对电子间设备通讯中断,对网控室设备通讯正常。可判断故障位置为网控制至电子间之间的通信光纤上。
④更换网控室至电子间之间的B网通信光纤,B网通信中断现象消失,故障消除。
4.防范措施
(1)建立设备维护保养制度,建立设备巡视档案。定期检查操作站内是否有通讯中断报警信息。
(2)提高运行人员巡视检查的质量,发现设备异常及时汇报。
(3)通讯设备安装时必须注意设备质量。特别是光纤,一定要有验收报告,不得使不合格的光纤投入使用。
(4)在设备停运期间,对全厂通信线路进行检查、端子紧固。