摘要:针对自动化系统在现场实际运行中的常见故障:通信网络类故障、数据采集故障、误报警故障和与其他厂家装置不匹配故障进行了分析和归纳,从大量的现场数据中找出其规律性,分析了产生的原因(产品质量、不同厂家设备的接口通信、开放性等问题),提出了处理建议与改进措施。着重介绍了与变电站自动化系统密切相关几类典型问题的解决方法,为快速查找和正确处理变电站自动化系统故障提供了指导方法。
随着自动化技术、通信技术、计算机和网络技术的飞速发展与应用普及,目前新建变电站大多是采用计算机自动化系统。自动化系统不但在现场生产与办公等方面提高了生产运行部门的工作效率,使得电力生产更加数字化、自动化,同时也使得现场运行更加安全可靠,运行维护成本大大降低,效益显著提高。并且在后期多变电站集控应用上,自动化系统的应用也是实现集控必需具备的基础条件。随着自动化变电站投入运行的时间逐渐增长,在现场实际工作中各类问题也慢慢出现,其中就有一些很有常见性的故障隐患。因此,针对自动化变电站大多运行时间不长、经验较少的弱点,以下就自动化变电站常见的一些具有普遍代表性的问题进行分析探讨。
1.自动化系统的结构
变电站自动化系统采用自动控制和计算机技术实现变电站二次系统的部分或全部功能[1]。为达到这一目的,满足电网运行对变电站的要求,变电站自动化系统体系由“数据采集和控制”、“继电保护”、“直流电源系统”三大块构成变电站自动化系统的基础。
变电站自动化系统目前有三类系统结构:分布式系统结构、集中式系统结构、分层分布式系统结构。
1.1分布式系统结构
分布式系统结构是按功能设计,如按保护和监控等功能划分单元而分布实施,其最大特点是将变电站自动化系统的功能分散给多台计算机来完成。其结构采用主从CPU协同工作方式,多CPU系统提高了处理并行多发事件的能力,解决了CPU运算处理的瓶颈问题。各功能模块之间采用网络技术或串行方式实现数据通信。分布式结构有助于系统扩展和维护,可靠性好,局部故障不影响系统其它模块正常运行。该模式在安装上有集中组屏和分层组屏两种方式,较适合于中低压变电站[2]。
1.2集中式系统结构
集中式系统结构按信息类型划分功能。采用这类结构的系统其功能模块与硬件无关,各功能模块的连接通过模块化软件实现,信息是集中采集、处理和运算的。受计算机硬件水平的限制,该结构在早期自动化系统中应用较多。此类结构对监控主机的性能要求较高,且系统处理能力有限,开发手段少,系统在开放性、扩展性和可维护性等方面较差,抗干扰能力不强[3]。
1.3分层分布式系统结构
分层分布式系统结构采用“面向对象”设计[4],系统结构的特点是功能分散、管理集中。所谓面向对象,就是面向电气一次回路设备或电气间隔设备,间隔层中数据、采集、控制单元(I/O单元)和保护单元就地分散安装在开关柜上或其他一次设备附近[5],相互间通过通信网络相连,与监控主机通信。目前,此种系统结构在自动化系统中较为流行[6],主要原因是:
1)现在的智能设备[7]大多是按面向对象设计的,如专门的线路保护单元、主变保护单元、小电流接地选线,其在保护安装接线中仍是面向对象的;
2)利用了现场总线的技术优势,省去了大量二次接线,控制设备之间仅通过双绞线或光纤连接,设计规范,设备布置整齐,调整扩建也很简单,成本低,运行维护方便;
3)系统装置及网络冗余性强,不依赖于通信网和主机,主机或单台智能设备损坏并不影响其它设备的正常工作,运行可靠性有保证[3]。
分层分布式系统结构代表了现代变电站自动化技术发展的趋势,大幅度地减少了连接电缆,减少了电缆传送信息的电磁干扰,且具有很高的可靠性,比较好的实现了部分故障不相互影响,也方便维护和扩展,扩展性与开放性较高,有利于工程设计及应用[8-9]。
2.常见故障及其处理
因自动化变电站需对站内一二次设备实现实时数据采集、通信、遥控、遥调等功能,还应考虑与不同厂家设备实现互操作性及未来扩容扩建等兼容扩展性[10],其稳定性依赖于微处理器与通信技术的可靠发展。自动化变电站内设备的参数采集、信号控制等都需要通过网络传输,在稳定性上对网络系统及传输设备的稳定可靠性依赖很大[11],一旦网络传输出现问题,有可能导致数据出错、丢失、失控等问题,严重的可能导致发生事故未及时察觉而进一步扩大事故,可以说网络传输系统就是自动化变电站的神经传输系统,其重要性不言而喻。就厦门超高压局的自动化变电站运行几年来的 经验总结,发现现场发生的缺陷有很大一部分是网络通信的不稳定性造成的。以厦门超高压局500kV漳州变电站为例,自2006年5月投产以来,在三年的时间里,有关自动化系统的缺陷共计49条,占缺陷总数的27.68%,其中Ⅰ类缺陷2次、Ⅱ类缺陷14次、Ⅲ类缺陷33次。最严重的情况是双网络冗余配置的自动化系统A网与B网同时中断,导致测控数据采集丢失、设备失去远程控制。
以下是常见的几类自动化系统故障,并对发生原因进行分析和针对性处理。
2.1通信网络类故障
2.1.1某保护小室内某单元保护装置或测控装置通信中断
出现该类故障,其原因多在于保护装置与自动化系统的通信出现问题,有可能是因为保护装置通信接口模块故障、通信接线松动。针对该类情况可以先查找保护装置至保护管理机之间的接线是否牢固、完好,保护管理机通信指示灯是否正常,保护装置面板显示是否正常,是否出现通信模块故障或是装置故障的告警,而后相应的进行紧固接线、重启装置、更换相关装置模块等处理。
2.1.2某保护小室内所有保护装置(非自动化系统厂家的保护装置)通信中断
自动化系统与其他厂家的保护装置因为使用的通信规约不同,所以自动化系统采集保护信号需要经过保护管理机进行规约转换,一台保护管理机可以容纳多台保护装置的信号传输,一旦小室内的保护管理机出现死机或是故障,往往导致所接的所有保护装置信号无法正常传输,遥信信号无法更新,可能会错失重要信号报文。出现该类问题,可以通过观察保护管理机的通信指示灯是否正常来判断,并且检查其与交换机之间的接线是否松脱,而后相应的进行重启装置、紧固接线、更好装置等处理。
2.1.3某保护小室内所有保护装置、测控装置通信中断
一旦出现整间保护小室内的所有保护装置、测控装置的通信全部中断,不论是单网络中断或是双网络中断,其故障原因大多在于该小室内的交换机、光电转换装置以及该小室在站控层所对应的光电转换装置等网络传输设备出现故障导致的,所以可以首先对网络传输设备及其接线进行排查,而后进行相应处理。
2.1.4所内双网络结构通信其中一个网络或是两个网络都中断
全所内的自动化系统网络出现单网络或是双网络的整体通信中断,可以先对站控层所属的交换机等网络设备及其接线进行检查。因为现场的所有通信信号,不论是测控采集的信号,还是保护管理机转换传输的遥信信号,最终都需经过站控层的交换机、光电转换装置等网络传输装置进行传输,所以出现该类问题,应该首先从站控层自上而下的查起。
2.2数据采集类故障
实际运行中,在网络连接正常的情况下,存在个别遥信信号量显示与现场实际状态不一致的问题。例如,某保护屏上压板投退后,监控主机却显示并未变位。该类情况往往还应参考SOE事件[12]信号进行综合分析判断。当SOE事件中也没有该压板投退的信号出现时,可以判断是属于保护装置与自动化系统间通信出现故障,或是保护管理机死机,此时只需对保护管理机重启便可恢复正常,也可能是因保护装置内部的通信出口模块损坏导致信号缺失,此时需要对相关模块进行修复、更换。当SOE事件中有该压板投退信号时,则说明保护装置与自动化系统的通信采集正常,此时需要对自动化系统数据库中该压板软节点的定义进行重新设置修定。
对于遥测硬节点开入的报文,如果某一硬节点开入信号丢失,或频繁动作、复位(即节点抖动),而与现场实际运行情况不符时,则该节点的接线触点可能存在接头松脱、虚接的现象,需要对接线进行紧固处理。如果同属于一个测控装置的多个硬节点开入同时出现信号丢失、节点抖动的问题时,则应对该测控装置的开入模块加强检查,同时检查其管理插件配置是否存在不匹配现象。
2.3误报警故障
在自动化系统中,所有非自动化系统厂家的保护装置发出的软报文,均由保护管理机接入自动化系统后台数据库[13]。当保护信号量非常大的时候,例如保护调试、系统事故等情况,保护装置发出的部分信号会堆栈在保护装置内存中,根据通信规约先入先出的原理,这部分堆积的信号会在下次保护管理机读取信号时(如收发信启动),随着收发信告警信号一起被保护管理机读取上报至监控主机报文,对运行监视及信号判断造成干扰。此类因堆积而延迟上报的信号,其动作时间不是当前时间,而是其真实发信时间,此时需要结合现场实际保护动作情况进行分析判断,将其告警发生时间与相应保护装置内的历史记录进行对比,即可发现属于信号堆积延迟误报警,进而排除干扰。对于存在该类问题的变电站,可以在每次保护调试或事故处理后,对保护装置内存事件进行清空,即可解决该问题。
2.4与其他厂家装置不匹配故障
现场运行中发现,有一部分厂家的同一类型保护装置存在装置异常、通信中断等频繁告警现象,主要是因为保护装置与自动化系统存在不匹配造成的。例如,珠海泰坦的TEP-G-C(D)分布式绝缘监测装置、南自的PSL603电流差动保护都存在与北京四方CSC2000自动化系统不匹配的问题。在珠海泰坦的TEP-G-C(D)分布式绝缘监测装置与CSC2000自动化系统的通信过程中,因为经规约转换后的通信数据存在冗余、缺失等不匹配现象,所以在运行中会不时出现保护装置异常或通信中断等报警,短时后自动复位。针对该类问题,四方厂家与珠海泰坦厂家分别对各自的通信模块与规约进行了修改升级,使该类问题得以解决。对于南自PSL603保护与CSC2000自动化系统的不匹配问题,经检查试验发现,保护管理机的COM通信口发送报文给PSL603保护装置,却无法收到回应报文,同时用上海许继I-POFAS故障信息处理系统召唤PSL603保护装置也无回应。对此,由南自厂家对PSL603保护装置进行版本升级后,该问题得以解决。
3.问题发生的原因
通过对自动化系统常见问题的归纳分析,可以发现导致这些故障的原因主要在于以下几点:
3.1产品质量问题
正常运行维护中对通信网络的操作并不多,而之所以会出现各类通信中断的问题,最主要的就是在于自动化系统的产品设备选型方面存在着所选系统不够全面、产品质量不过关、系统性能不达标等问题[14]。一些产品出厂时能够正常调试使用,但在运行一段时间之后稳定性有所下降,厂家对现有设备改进更新的积极性不高,缺乏质量保证措施,对设备售后出现质量问题的反馈与改进不足,致使一些相同的问题重复出现。如举例中该变电站自动化系统所使用的自动化设备,其通信接口部件均为外协加工,使得该变电站自动化系统通信故障发生率较高。
3.2不同厂家设备的接口通信问题
接口问题是自动化系统中非常重要而又长期以来未得到妥善解决的问题之一[15],包括RTU、保护、五防、直流监测、故障录波、无功装置等与自动化系统设备之间的通信。这些不同厂家的产品要在数据接口方面沟通,需花费软件人员很大精力去协调数据格式、通信规约等问题[16],与自动化系统通信时也需要通过加装保护管理机(规约转换器)等中间设备进行沟通,既增加了投资成本,又因为中间环节设备的增加而导致故障发生概率的增高。当不同厂家的产品、种类很多时,问题会很严重。
如果所有厂家的自动化产品的数据接口遵循统一的、开放的数据接口标准,则上述问题可得到圆满解决,用户可以根据各种产品的特点进行选择,以满足自身的使用要求。
3.3开放性问题
变电站自动化系统应能实现不同厂家生产的设备的互操作性(互换性);系统应能包容变电站自动化技术新的发展要求;还必须考虑和支持变电站运行功能的要求。而现有的变电站自动化系统却不能满足这样的要求,各厂家的设备之间接口困难,甚至不能连接,从而造成各厂家各自为政,重复开发,浪费了大量的财力物力。
另外,各种屏体及设备的组织方式不尽相同,给运行维护和管理带来许多问题。并且在现有的变电站二次设备中,厂家数量较多,各厂不同系列的产品造成产品型号复杂,备品备件通用性差、储备繁多,设备运行率低。
4.结论
在对自动化系统出现的各类故障进行归类分析之后,在实际检查处理过程中不断总结经验,找出其规律性,可以对自动化系统各类故障的排查进行指导,以便迅速发现故障点,消除缺陷,缩短故障存在时间,进而提高设备运行的稳定性。随着通信技术与计算机技术的不断进步,变电站自动化系统也将不断发展完善,这就要求电力生产人员对自动化系统熟悉掌握,充分发挥其作用,才能提高工作效率,保证电网的安全、经济、优质运行。