中央研究院软件研发部 谈群
摘要:水电站设备故障成因复杂、关联性强,研究故障之间的成因关系及发生概率有助于快速确定故障原因和制定排查计划。根据专家经验与历史故障数据构建了水电站设备知识图谱,设计了基于知识图谱的智能故障诊断算法,利用 Noisy Or 模
型实现一种近似推理算法,实现了根因的定量分析,基于图推理分析相关现象和熵理论实现了排查建议的优化计算。系统给出全面、详细的建议和解释信息,允许用户自由交互,可以帮助用户快速排查故障。系统具有不依赖历史数据、准确性高、可解
释性强、可动态更新等优点。
关键词:水电站;故障诊断;知识图谱;图推理;熵
0 引言
近年来,我国的水电建设事业飞速发展,2022 年水电装
机容量达到 4.135 亿 kW,水力发电已成为发电产业中的中坚
力量,取得了许多举世瞩目的成就 [1]。随着水电站装机容量
的提升,水电设备的维修保养和故障诊断也越来越重要,对
机组的检修、维护、运行、管理提出了更高的要求 [2]。水电
站工作者需要对水电站的机电设备进行定期的维护检修以保
障机电设备的正常运行 [3]。传统的人工巡检费时费力,容易
导致漏检,且存在诸多限制条件,效率低、成本高 [4-5]。同
时,水电站设备故障机理复杂,受水力、电气、机械及环境
等多种因素影响,一旦出现故障,如果不能及时查找故障原
因并及时处理,将带来严重的后果。此外,水电站设备之间
关系密切,相互耦合构成有机整体,设备分析与诊断需要关
联相关设备状态 [6]。因此,对水电站维修巡检方案进行统计
分析,考虑设备、故障之间的关联,结合专家经验建立故障
根因分析方法对水电设备的检修和维护具有重要意义。
知识图谱是人工智能领域的一个重要分支,以结构化的
形式描述客观世界中概念、实体及其之间的关系,将信息表
达成更接近人类认知世界的形式 [7],提供了一种更好地组织、
管理和利用知识的能力,广泛应用于智能搜索、智能问答、
辅助决策、风险预警等领域。
由于知识图谱技术良好的可解释性,以及可以有效地利
用专家知识,减少对故障数据的依赖性,在故障诊断领域越
来越受到重视。刘鑫等 [8-9] 在故障诊断分析领域引入知识
图谱相关技术思想,提出了基于本体的故障知识图谱构建方
法,解决了故障知识与故障数据自动对接、自动推理生成故
障传播链、按图索骥查询故障传播可解释性知识等问题。许
祺等 [10-13] 将知识图谱技术引入电力、航空等领域,提出
了基于知识图谱的故障分析框架和实现手段,建立了智能故
障诊断或智能问答系统。Yang 等 [14-15] 针对复杂的工业过
程或设备,提出了基于知识图谱和贝叶斯网络的故障诊断方
法,将经验知识融入到智能诊断过程中,实现了多源故障检
测和诊断框架。当前的研究以基于知识图谱的定性推理为主、
分析故障原因,缺少对相关现象及排查建议的分析。
本文基于专家经验与历史故障数据构建了水电站设备知
识图谱,设计了基于知识图谱的智能故障诊断算法,实现了
定量的根因分析,根据图推理分析相关现象和熵理论实现了
排查建议的优化计算,系统给出全面、详细的建议和解释信息,
允许用户自由交互,可以帮助用户快速排查故障。
1 知识图谱设计
用知识图谱表达故障之间的影响关系,可以采用简化的
Noisy Or[16] 模型表示,当多个原因导致同一个后果时,假
设多个原因之间相互独立。如图 1 所示,左侧 Noisy Or 模型
描述了三个故障的关系,表示当 A 发生时,有 0.6 的概率导
致 C 发生,当 B 发生时,有 0.8 的概率导致 C 发生,当 A 与 B
均不发生时,C 不会发生,那么当 A 与 B 均发生时,C 发生的
概率为:
P(C|A,B)=1-(1-0.8)*(1-0.6)=0.92(1)
因此,该模型与具有右侧条件概率表(CPT)的贝叶斯模
型等价。
图 1 Noisy Or 模型与 CPT 对应关系
基于专家经验及历史故障数据(如系统故障数据库、相
关的专业领域文献资料、各类传感器数据等),构建了水电
站设备故障知识图谱,以有向无环图描述所有设备故障之间
的影响关系。在 Neo4j 图数据库中完成了建模,以机组轴承
温度升高故障为例,图谱如图 2 所示,描述了机组轴承温度
升高可能的根因及相关故障现象,黄色节点表示根因,蓝色
节点表示非根因故障。
图 2 水电站设备知识图谱示例
表 1 是图 2 中所有根因的先验概率,故障 a 的先验概率
记为w(a)。基于先验概率、图结构及边的权重,即可针对任意
给定的一个或多个故障状态,计算每个根因的后验概率,进
行定量的故障诊断。
表 1 先验概率
2 根因分析
故障诊断的第一个关键问题是分析可能导致故障的根因,
并定量地给出其可能性。
2.1 根因路径推理
根因路径推理是根据已发现、已排除现象列表,推理可
能的根因,具体思路如下:
在图G = {X , R}中,如果存在一个序列 k x r x r x ,对任
意i =1,, k −1,满足 → i+1
r
i x x i
,则该序列为图 G 上的一条长
度为 i-1 的路径,记为 ( , , , ) 1 2 k Path x x x ,简记为 ( , ) 1 k Path x x ,
( , ) i 1 k x ∈ Path x x 表示节点 i x 属于该路径上的节点集合,W (Path)
表示该路径的强度,定义为路径上关系权重的乘积。
∏
−
=
=
1
1
( )
k
i
i W Path r (2)
基于根因之间的独立性,假设在某一时刻,只有一个根
因发生。记已发现、已排除现象的集合分别为 X = {xi
}, E = {ej},
如果根因 s,对任意 x∈ X ,存在路径 Path(s, x)同时满足以下
两个条件:
● 对任意c∈ Path(s, x),c∉ E
● 有且仅有唯一的c∈ Path(s, x) 且c ≠ x ,使得 c∉ X 且c为
根因
则 Path(s, x)称为 s 到 x 的一条有效路径。
对第二个条件的解释,如果推理路径上有多个根因,仅
推理到离实际故障最近的一个根因,以免诊断结果过多,用
户可以将根因作为新的任务继续诊断。
根因 s 到任意 e∈ E 的路径集合记为 P(s, E),记 s 的排除
度为:
∏∈
= − ( , )
( ) 1- (1 ( ) p P s E
U s W p
(3)
如果根因 s 排除度小于 1,且对所有的 x∈ X 均存在至少
一条有效路径,则 s 为可能根因。
如 图 3 所 示, 已 发 现、 已 排 除 现 象 的 集 合 分 别 为
X = {x1, x2}, E = {e1,e2}。由于 e2∈ E ,Path(d1,e2,x1) 不是一条有
效路径,根因 d1 没有有效路径,不是可能根因。根因 d2 对
所有的 x∈ X 均存在有效路径,但路径Path(d 2,e1)的强度为 1,
因此 d2的排除度为 1,d2不是可能根因。根因 d3排除度小于 1,
且对所有的 x∈ X 均存在至少一条有效路径,所以 d3 为可能根因。
2.2 根因可能性计算
对根因到已发现、已排除现象的路径进行计算、综合,求出每个根因的可能性并归一化,按照可能性排序。
根因的可能性计算本质是后验概率问题,也就是已知某
些变量的取值(证据),计算另外一些变量的后验概率分布。
按 照 贝 叶 斯 理 论, 设 D D Dn , , , 1 2 为样本空间S的
一 个 划 分, 如 果 以 ( ) P Di 表示事件 Di 发 生 的 概 率, 且
P(Di)>0(i=1,2,...,n)。对于给定的证据 x,事件 Di 的后验概
率为:
∑=
= n
j
j j
i i
i
p x D P D
p x D P D P D x
1
( | ) ( )
( | ) ( ) ( | )
(3)
当网络规模较大时,样本空间的规模成指数增长,严格
地按照贝叶斯公式计算后验概率是非常困难的。在一个故障
诊断任务中,要多次计算后验概率,对时效性有较高的要求,
因此本文设计了一种快速的近似算法。
根据贝叶斯公式以及对图结构的观察,我们可以发现以
下规律:
● 后验概率P(D | x) i 与先验概率 ( ) P Di 成正比。
● 后验概率与排除度负相关,排除度为 1时,后验概率为 0,
排除度为 0 时,对后验概率无影响。
● 后验概率与根因到已发现现象的路径强度正相关。
● 根据在某一时刻只有一个根因发生的假设,所有可能根
因的后验概率之和为 1。
根据以上假设,设 { }k S = s 为所有可能根因的集合,定义
后验概率如下:
∑
∑∑
∈
=
= ∗ − ∗
s S
k k
I J
j i
p s h s h s
h s w s U s W s x
( ) ( )/ ( )
( ) ( ) (1 ( ) ( , )
(5)
其中,X = {xi} 为已发现现象,根因 s到 有 J条有效路径。
w(s) 为根因的先验概率,U(s) 为根因的排除度, ( , ) j i W s x 为
一条有效路径的强度。
3 排查建议
故障诊断的第二个关键问题是从可能的根因出发,分析
这些根因还有可能导致哪些故障现象,并根据这些相关现象
的检查难度及检查后对故障诊断带来的帮助综合分析,给出
排查建议的优先顺序。
3.1 相关现象推理
从根因出发推理所有相关现象,过滤已发现、已排除现
象及其关联现象(属于同一个父故障的现象),形成排查建
议列表。
对 于 故 障 现 象 o, 如 果 存 在 可 能 根 因 s, 以 及 路 径
Path(s,o),至少满足以下二者之一:
● 对任意c∈ Path(s,o), { } { } i j c∉ x + e
● ( ) 1 { }j length Path = 且c∉ e
则 Path(s,o) 称为 o 的检查路径,所有存在检查路径的故
障现象组成排查建议列表,对同属一个父故障的现象聚合处理。
3.2 对排查建议进行排序
用户排查相关建议的目的是减少未知的不确定性,用信
息论中熵理论 [17] 衡量每个排查项的期望收益。设可能的根
因为 X,其熵可以定义为:
∑∈
= −
x X
H(X ) p(x)log p(x)
(6)
假设可能的根因还有 n个,故障的熵就落在图 4的虚线上:
图 4 故障的熵曲线
熵表明了故障的不确定程度,通过检查更多的排查项来
减小这个不确定性,缩减了多少不确定性,就可以用互信息
来量化。
假设某排查项的可能状态集合为 S,计算每个状态的发生
概率 p(s), s∈ S ,以及每个状态下故障的熵 H(X | s),然后计算
其加权平均值与原熵的差,则该排查项对 X 的互信息为:
∑∈
= −
s S
I(S, X ) H(X ) p(s)H(X | s)
(7)
比较排查建议时还要考虑每个排查项的排查难度,用检
测度 d(S) 表示,最终,用每个排查项的互信息与检测度来综
合判断其优先顺序:
R(S) I(S, X )/ d(S) (8)
4 故障诊断应用
基于水电站知识图谱及故障诊断算法,开发了智能故障
诊断系统,流程如图 5 所示。用户选择一个故障后,系统进
入诊断流程,根据已发现、已排除现象集合,分别进行根因推理、根因排序、排查建议推理、建议排序,用户根据排查
建议,选择其中一项进行检查,反馈检查结果,将检查结果
加入到已发现、已排除现象集合,如此循环,直到帮助用户
找到导致故障的根因。系统给出全面、详细的建议和解释信息,
用户可以自由交互,任意选择排查项进行检查并反馈结果。
图 5 故障诊断流程
以图 2 所示图谱为例,选择“轴承温度升高”进行诊断,
排除“管道故障”“振动异常”两个相关现象后,系统给出
的可能根因及排查建议(前 5 项)如表 2 所示,排查建议与
可能根因可以是多对多关系。大多数情况下诊断结果符合专家预期,显示出良好的性能。
表 2 先验概率
Table 2 Fault diagnosis result
在知识图谱的构建过程中,由于知识收集的有限性,无
法穷举所有可能的根因。此外,不同水电站的设备信息、地区、
工作环境的不同,有可能用户检查完所有的待排查项后仍然
找不到正确的根因,导致诊断失败。此时用户可点击“专家
求助”,在专家指导下解决问题后可向系统反馈正确的根因。
系统维护人员可以根据用户反馈结果完善对应的知识图谱,
实现知识图谱的动态更新。
5 结语
本文针对水电站设备故障的复杂成因及关联关系,提出
了基于知识图谱的设备故障根因分析方法,实现了以下成果:
(1)基于专家经验及历史故障数据,构建了水电站设备
知识图谱;
(2)设计了基于知识图谱的故障根因分析算法,实现了
定量的根因分析,基于图推理分析相关现象、信息论实现了
排查建议的优化计算。
基于知识图谱技术的水电站设备智能故障根因分析方法
的成功研发和系统应用,实现了排查建议的优化计算,给出
全面、详细的建议和解释信息,为水电站故障的快速识别和
精准定位提供了坚实基础,也为水电系统的智慧建设做了积
极探索。
参考文献:
[1] 张群 . 我国水力发电的现状和前景 [J]. 科技风 ,
2016, 12(8): 102-104
[2] 胡勇健 ,肖志怀 ,周云飞等 .基于贝叶斯网络
Noisy Or 模型的水电机组故障诊断研究 [J]. 水力发电学
报 ,2015,34(06):197-203.
[3] 廖熙仲 . 浅谈水电站机电设备维护检修与管理 [J].
技术与市场 ,2017,24(01):100+102.
[4] 王波 , 赵远 , 刘喜泉等 . 智能巡检机器人在大坝廊
道运维中的应用 [J]. 人民长江 , 2022, 53(7): 227-231.
[5] 赵薛强 , 凌峻 . 无人机自动巡检智慧监控系统研究
与应用 [J]. 人民长江 , 2022, 53(6): 235-241.
[6] 杨贤 . 面向智能水电站的远程监测与分析系统 [D].
湖北 : 华中科技大学 ,2012. DOI:10.7666/d.D229164.
[7] 朱小燕 , 李晶 . 人工智能:知识图谱前沿技术 [M].
北京 : 电子工业出版社 ,2020.
[8] 刘鑫 . 面向故障分析的知识图谱构建技术研究 [D]
北京邮电大学 ,2019.
[9] 刘瑞宏 , 谢国强 , 苑宗港等 . 基于知识图谱的智能
故障诊断研究 [J]. 邮电设计技术 ,2020(10):30-35.
[10] 许祺 . 基于知识图谱的 CNC 故障诊断系统 [D]. 北
京邮电大学 ,2020.
[11] 耿慧 . 基于知识图谱的整机线缆检测故障诊断系统
研究 [D]. 浙江大学 ,2020.
[12] 乔骥 , 王新迎 , 闵睿等 . 面向电网调度故障处
理的知识图谱框架与关键技术初探 [J]. 中国电机工程学
报 ,2020,40(18):5837-5849.
[13] F.Yun,Z.Feng,L.Baofeng, C. Yongfeng. Research
on Intelligent Fault Diagnosis of Power Acquisition
Based on Knowledge Graph.2019 3rd International
Conference on Electronic Information Technology and
Computer Engineering[C].2019, pp. 1737-1740, doi:
10.1109/EITCE47263.2019.9095018.
[14] N.Yang,G.Zhang,J.Wang. Research on Knowledge
Graph and Bayesian Network in Fault Diagnosis of Steam
Turbine. 2020 Global Reliability and Prognostics and
Health Management[C]. 2020, pp. 1-6, doi: 10.1109/
PHM-Shanghai49105.2020.9281007.
[15] Sun.T, Wang.Q. Multi-source fault detection
and diagnosis based on multi-level knowledge graph
and Bayesian theory reasoning. 31th International
Conference on Software Engineering and Knowledge
Engineering[C]. 2019 pp. 177-180. KSI, Pittsburgh.
[16] Agnieszka.Learning Bayesian Network
Parameters from Small Data Sets Application of Noisy—
OR Gates [J].InternationalJournal of Approximate
Reasoning,2001,27(2):165-182.
[17] Cover T.M,Thomas J.A. 信息论基础 [M]. 阮吉寿,机械工业出版社 ,2007.
|