基于多源信息融合与HMM 的剩余寿命预测

第44卷 第5期系统工程与电子技术www.hnnn
Vol.44 No.5
2022年5月SystemsEngineeringa
ndElectronicsMay                                                  2
022文章编号:1001 506X(2022)05 1747 10 网址:www.sy
s ele.com收稿日期:20210220;修回日期:20210606;网络优先出版日期:20210827。
网络优先出版地址:http:
∥kns.cnki.net/kcms/detail/11.2422.TN.20210827.1726.014.html基金项目:国家自然科学基金(71871218,72071208)资助课题 通讯作者.
引用格式:黄林,龚立,姜伟,等.基于多源信息融合与HMM的剩余寿命预测[J].系统工程与
正交编码器电子技术,2022,44(5):1747 1756.犚犲犳犲狉犲狀犮犲犳狅狉犿犪狋:HUANGL,GONGL,JIANGW,etal.Remainingu
sefullifepredictionbasedonmulti sourceinformationfusionandHMM[J].SystemsEngineeringa
ndElectronics,2022,44(5):1747 1756.基于多源信息融合与犎犕犕的剩余寿命预测
黄 林,龚 立 ,姜 伟,王康勃
(海军工程大学舰船综合试验训练基地,湖北武汉430033)
  摘 要:针对设备剩余使用寿命预测问题,
提出一种基于多源信息融合与隐马尔可夫模型的预测方法。首先,针对发动机结构复杂、监控数据参数多等问题,提出一种基于传感器信噪比和主成分分析(princip
alcompo nentanaly
sis,PCA)降维的多源传感器数据融合方法。在此基础上,利用样本数据训练高斯混合隐马尔可夫模型,
同时为降低模型偏差并避免过拟合风险,提出一种“定制”策略训练方法,训练后的模型可用于系统健康状态识别和剩余使用寿命预测。最后,
通过美国国家航空航天局公开的航空发动机仿真数据集对所提方法进行了验证,并与几种具有代表性且预测精度较高的文献方法进行了比较分析,验证了方法的有效性。关键词:多源信息融合;隐马尔可夫模型;剩余使用寿命;模型训练
中图分类号:V239    文献标志码:A    犇犗犐:10.12305/j.
issn.1001 506X.2022.05.38犚犲犿犪犻狀犻狀犵狌
狊犲犳狌犾犾犻犳犲狆狉犲犱犻犮狋犻狅狀犫犪狊犲犱狅狀犿狌犾狋犻 狊狅狌狉犮犲犻狀犳狅狉犿犪狋犻狅狀犳狌狊犻狅狀犪狀犱犎犕犕
HUANGLin,GONGLi ,JIANGWei,WANGKang
bo(犛犺犻狆犆狅犿狆狉犲犺犲狀狊犻狏犲犜犲狊狋犪狀犱犜狉犪犻狀犻狀犵犅犪狊犲,犖犪狏狔犝狀犻狏犲狉狊犻狋狔狅犳犈狀犵
犻狀犲犲狉犻狀犵,犠狌犺犪狀430033,犆犺犻狀犪)  犃犫狊狋狉犪犮狋:Aimingattheproblemofequipmentremainingu
sefullifeprediction,apredictionmethodbasedonmulti sourceinformationfusionandhiddenMarkovmodelisproposed.Firstly,amu
lti sourcesensordatafusionmethodbasedonsignal to noiseratioofsensorandprincipalcomponentanalysis(PCA)dimensionality
reductionisproposedtosolvetheproblemsofcomplexenginestructureandmultiplemonitoringdatap
arameters.Onthisbasis,theGaussianmixturehiddenMarkovmodelistrainedusingthesampledata.Atthesametime,inordertoreducethedeviationofmodelandavoidtheriskofoverfitting,a“customized”strategytrainingmethodisproposed.Thetrainedmod
elcanbeusedforsystemhealthstatusrecognitionandremainingusefullifeprediction.Finally,theeffectivenessoftheproposedmethodisverifiedbytheaeroeng
inesimulationdatasetpublishedbyNationalAeronauticsandSp
aceAdministration,andcomparedwithseveralrepresentativeliteraturemethodswithhighpredictionaccuracy.犓犲狔狑狅
狉犱狊:multi sourceinformationfusion;hiddenMarkovmodel;remainingusefullife;modeltraining0 引 言在故障预测与健康监测(prog
nosticsandhealthman agement,PHM)领域中,对设备性能退化的实时预测非常重要,是基于状态维修(condition basedmaintenance,CBM)策略制定的重要依据。但是在大多数情况下,监控系统测量的数据无法跟踪系统每个组件的退化
状态,因此CBM需要一个能够基于监测数据预测其系统性能退化状态的模型
或者是一个可以量化的指标,例如系统健康指数(healthindex,HI)、剩余使用寿命(remainingu
sefullife,RUL)等。RUL是指设备失效前能够运行的次数或者时间。准确的RUL预测在实施CBM策略中起着关键作用,因为其
 ·1
748 ·系统工程与电子技术第44卷                                                   可以为维修人员在系统故障之前提供足够的时间,使用者能够及时评估设备的健康状况,并针对设备状态规划和制定未来的维护保养计划。目前常采取的做法是,利用系统传感器采集大量的实时数据,将这些数据存储在历史数据集中,并通过建立基于数据驱动模型(data drivenmodel,DDM)
来预测精确的组件衰减状态和RUL。在关于PHM和CBM的文献中,基于物理模型、统计学理论和数据驱动等诸多方法被提出来解决RUL预测问题。近年来,由于机器学习方法能够在不了解设备退化机制的情况下,仅依靠历史数据对设备运行状态进行学习和预测,不需要过多的领域知识,因此受到了越来越多的关注[1],其中常用的方法包括支持向量机(supportvectorma
chine,SVM)[2]、隐马尔可夫模型(hiddenMarkovmodel,HMM)[3]、卡尔曼滤波[4]、深度学习方法[56]等。HMM最早被应用于语音识别[7],是一个双重嵌入的随机过程,其一般随机过程是不可观测的(设备的状态是隐藏的),只能通过产生观测序列(即传感器信号)的另一组随机过程来观测,适用于动态过程时间序列信号分析和平稳随机信号的建模,在语音识别、手势识别、目标跟踪[8]等许多应用领域都显示出其优越的性能。HMM同样也被广泛应用于故障诊断和故障预测领域[9],故障预测是PHM核心课题之一,HMM可根据测量信号检测和识别系统健康状态,并对未来一段时间内的健康状态进行估计,从而实现系统RUL预测。Zhu等[10]针对动态工业过程中的故障分类问题,提出了一种HMM驱动的鲁棒隐变量模型,将概率结构发展为一种分类器形式,以便在模型获取过程中融合各种类型的过程信息。Yiako p
oulos等[11]利用分段聚合近似和符号聚合近似时间序列数据挖掘表示方法,
结合HMM应用于过程变量监控数据,并与过程缺陷相关联,从而捕捉隐藏在观测数据中的有意义的信息,识别特定异常情况。Galagedarage等[12]采用HMM 贝叶斯网络混合系统,对田纳西伊斯曼过程中的10个已识别故障进行预测和隔离,并成功地预测了所选的10个过程故障,并对其中的8个进行了准确隔离。Wang等[13]提出了一种基于HMM的多模态过渡过程故障检测方法,以一种隐状态概率集成策略将局部监测结果以概率方式组合
成两个全局指标,并采用贝叶斯信息准则进行模型评估,后采用负对数似然概率指标进行过渡过程故障检测。Du等[14]以HMM建立润滑油降解的状态演化过程,利用最大化期望(exp
ectationmaximization,EM)算法估计HMM的未知参数,并以后验概率的形式通过条件可靠度函数和平均剩余寿命函数来进行预测。Soualhi等[15]提出了两种基于HMM故障预测的概率方法,将故障预测不仅限于对RUL的估计,
而且还扩展到对未来可能出现故障的风险的估计。Le等[16]针对系统可能存在多个性能退化机制的情
况,提出了一个多分支建模框架,通过CBM环境中的状态监测信息,证明了多分支HMM在RUL估计方面的性能。上述文献证明了HMM在RUL预测应用中的有效
性,并且与许多其他RUL预测方法相比,HMM的一个显
著优点是具有比较强的可解释性。但是,标准HMM的最基础的假设是马尔可夫链,即系统下一时刻的状态仅由当前状态决定,
不依赖于以往的任何状态,并以此计算所有变量的联合概率分布。这样将导致在利用建立好的HMM进行预测时,因为没有考虑预测对象的全寿命过程退化轨迹,HMM将产生较大的偏差,从而导致预
测结果不够理想。针对上述问题,提出了一种基于多源信息融合的HMM建模方法,首先定义经验信噪比(empiricalsignaltonoiseratio,eSNR)选取主要信号,随后基于主成分分析(principalcomponentanaly
sis,PCA)方法将多维发动机监控数据进行信息融合,将监控数据从多维降至一维,通过对
降维后的数据进行分析和比较,得到每台发动机的HI,再将测试数据集中的发动机性能HI与训练数据集遍历比较,通过相似性分析得到若干个与之最为接近的训练发动机HI,再将相应的发动机数据进行HMM建模,针对测试数据集中的每个发动机分别建立一个与之相对应的高斯混合
隐马尔可夫模型(GaussianmixtureHMM,GM HMM)
,再对其进行隐状态分析,
通过EM算法,得到后验概率最大的模型后,
采用维特比算法估计当前发动机的退化状态,再利用蒙特卡罗模拟,通过生成从当前健康状态到故障状态的路径,估计发动机的RUL。相比于直接利用所有的数据训练一个HMM,该方法在分析发动机退化轨迹的基础上,针对每一个测试发动机分别得到一个HMM,充分考虑了发动机的历史退化轨迹的影响,提高了模型的准确度。同时,为了避免可能出现的过拟合风险,相比于直接挑选一个最相
似的退化轨迹,利用相似度原理分析选出了若干个最相似轨迹,再对其进行HMM建模。最后通过对NASA公开的航空发动机的案例进行研究,证明了所提预测方法的有效性。1 基于犲犛犖犚和犘犆犃的传感器信号融合方法1.1 基于犲犛犖犚的传感器特征提取
特征提取是模式识别和机器学习的重要课题,数据中如果包含大量冗余变量或噪声信号,会对模型性能产生非
常大的影响,
导致模型过拟合或精度差等问题。在RUL预测的应用中,
特征提取等价于选择合适的传感器信号,其目的是降低数据之间的冗余并尽量提高其相关性。常用的传感器选择方法包括观察传感器数据变化趋势[17]、
基于信息熵理论的传感器选择[18],
上述方法简单直观,操作性强,但缺乏理论基础,基于主观判断的信号特征使预测结果不
稳定。为提取有用的传感器信号,并同时达到降噪的目的,本文提出了一种基于信噪比分析的传感器特征提取方法。首先对信号进行归一化处理,在此基础上分析各传感器数据
太阳能电池板制作
 第5期
黄林等:基于多源信息融合与HMM的剩余寿命预测·1749 ·                                                   的信噪比,再采用sigmo
id函数将信噪比转化至0~1区间后,
将归一化的传感器信号乘以对应的信噪比函数,对信号进行加权后,同时考虑传感器信号的变化趋势和不同信号之间的相关性,采用核PCA方法对数据进行降维,根据主成分方差占比提取信号作为最终的预测信号。令{狊犻}为1维时间序列的原始传感器信号,{狊犻_狊}为经过PCA降维和数据平滑后的时间序列,定义eSNR为eSNR(狊)=var{狊犻—狊})/var{狊犻}
(1)传感器信号的权重将根据其对应的eSNR而定,具体为珘狔狀=狔狀·eSNR(狔狀)(2)式中:狔狀为传感器信号;珘狔狀为修正后的传感器信号,通过eSNR修正后,
能够充分降低传感器信号中杂讯的影响,起到滤波的作用,从而提取更加可靠的系统HI。1.2 基于犘犆犃数据降维与信息融合PCA是一种数据压缩和特征提取的多变量统计分析技术,能够有效去除数据间的相关性,目的就是在保证数据损失尽可能小的前提下,经过线性变换舍弃小部分信息,以少数新的综合变量取代原始变量,因此要求主成分能够充分反映原始变量的信息,同时又互不相关,
从而进行样本评价。在许多情况下可以通过PCA来降低特征向量的维数,将系统众多的传感器信号转换为较少数量的主成分,同时PCA可以消除变量间的线性相关性,并通过融合多个变量来抑制噪声。传感器信号之间可能存在关联,且其相关性可能会破坏RUL预测模型,使预测结果产生偏差。PCA是一种将潜在相关变量转换为少量不相关变量的常用技术。数据集犡=(狓1,狓2,…,狓犾,…,狓犔)包含犔个样本,每个样本为犖维变量,则犡的经验均值为狌=(μ1,μ2,…,μ犖)T(3)μ狀=1犔∑犔犾=1
犡[狀,犾](4)样本的协方差矩阵为犆=1犔-1(犡-狌犺)(犡-狌犺)T(5)式中:犺为全为1的犔维向量。对协方差矩阵犆进行特征向量分解,并选取前犕个特征向量,特征向量数犕的选择取决于希望保留的数据方差,例如80%,即有:犕=min犿=1,2,…,犖
改锥头犿∑犿狀=1λ狀≥80%∑犖狀=1λ烅烄烆狀(6)因此,可以对数据集犡进行降维处理,并保留系统80%方差:犣=犞T犕·犢=犞T犕(
犡-狌犺)(7)式中:犞犕=(狏1,狏2,…,狏犕)
为由犕个特征向量组成的犖×犕矩阵,犢为犕×犔矩阵且每列为犡中对应列向量的一个主分量向量。1.3 犎犐构建本文对比了目前使用较为广泛的用于数据平滑从而构建系统HI的两种算法,分别是核岭回归(kernelridg
ere gression,KRR)[19]和支持向量回归(supportvectorregre ssion,
SVR)模型[20]。算法对经过eSNR特征选择和PCA降维后的多维系统监测数据进行拟合平滑处理,提取系统性能退化特征曲线,从而构建系统HI。1.3.1 KRR
KRR是岭回归(ridgeregression,RR)的扩展,而RR的本质是在线性回归的基础上增加L2正则化,RR的最小化代价函数为犔(犠)=1狀∑狀犻=1
狔犻-犠π狓犻2F+λ‖犠‖2F(8)式中:
λ为正则化参数;‖·‖F表示F范数;犠∈犚狆×犱是变化矩阵;狓犻为第犻个样本;狔犻为第犻个样本的真实值。即求解
argm
in犔(犠)=(犣T犣+λ犐狆)-1犣T犢(9)式中:犣∈犚狀×狆,犢∈犚狀×狆为训练数据特征向量矩阵和因变量矩阵;犐狆∈犚狆×狆为恒等矩阵。通过核变换可以将此方法进行扩展,将数据映射到某一个核空间,使得数据在该核空间线性可分,从而能够处理非线性数据,则回归函数结果可表示为
犳(
狓)=犢T(犓+λ犐狀)-1犽(狓)(10)式中:犓为Gram矩阵,犓犻犼=犽(狓犻,狓犼)(犻=1,2,…,狀),狀为训练样本的数量。本文使用高斯核函数:
犓犻犼=犽(狓犻,狓犼)=exp烄烆烌烎(11)式中:σ为核函数宽度,通常采用交叉验证的方式选取合适的宽度参数。1.3.2 SVR
SVR是SVM在分类应用方面的推广,SVR假设模型输出犳(狓犻)
与真实值狔犻之间最多有ε的误差,即仅当与之间的误差绝对值小于ε就算预测正确。于是,SVR问题写成:min狑,犫12‖狑‖2+犅∑犿犻=1犾ε(犳(狓犻)-狔犻)(12)式中:狑为样本空间中超平面的法向量;犅为正则化常数;犾ε
为ε的不敏感损失函数:犾ε(狕)=0,|狕|<ε|狕|-ε,烅烄烆其他(13)更多关于SVM的原理建议参看文献[21]
。1.3.3 对比分析
图1为两种方法对论文拟采用的数据集中某一训练样本进行拟合的情况,直接采用经过PCA降维后的散点
 ·1
750 ·系统工程与电子技术第44卷                                                   作为系统HI不能很好地反应系统性能随使用时间增加而
导致的性能退化情况,因此需要进行曲线拟合,提取系统退化特征,作为系统HI。图1分别为KRR和SVR对数据的平滑效果以及相应的误差变化趋势。可以看出,采用KRR提取的性能退化轨迹更加平滑,更能反应系统性能退化的真实状态,SVR曲线起伏波动较大,与实际情况有所差别,因此采用本文所提的KRR进行系统性能退化轨迹提取。
图1 KRR与SVR拟合效果对比Fig.1 ComparisonoffittingeffectbetweenKRRandSVR2 基于犌犕
犎犕犕的犚犝犔预测2.1 犌犕 犎犕犕基本原理HMM是一种基于动态贝叶斯网(dynamicBay
esiann
etwork,DBN)的统计概率模型。HMM假定系统状态不可观测,
并由有限个隐状态和一组观测变量构成,每个隐状态对应两种概率:
状态转移概率和输出观测概率,且在任一时刻,观测变量的取值仅依赖于隐状态。在本文所关心的状态监测和故障诊断等领域的应用中,
系统的健康状态(故障参数、RUL、HI等)
即为HMM模型假定的隐状态。HMM变量分两组:①隐状态{狇1,狇2,…,狇犖},狇狋为模
型在狋时刻的隐状态,假定马尔可夫隐状态空间犛={犛1,犛2,…,犛犖}
,其中犖为马尔可夫链隐状态数目,则显然有狇狋∈犛;②观测变量{
狓1,狓2,…,狓犖},狓狋为狋时刻的观测值。若观测变量为离散值,并假定取值空间为χ={狅1,狅2,…,狅犕}
,则有狓犖∈χ。若HMM应用于RUL预测中,观测变量通常为系统一组可量化的监测变量,
通常为连续型,因此取值空间可为无限维。一个标准的HMM可由以下3组参数确定。(1)模型在各状态之间的转移概率犃=[犪犻犼]犖×犖,其中犪犻犼=犘(狇狋+1=犛犼狘狇狋=犛犻)∑犼犪犻犼=烅烄烆1,1≤犻,犼≤犖(14)(2)初始状态概率π=[π1,π2,…,π犖]
,其中π犻=犘{狇1=犛犻}∑犻
π犻=烅烄烆1,1≤犻≤犖(15)(3)输出观测概率犅=[犫犻犼]犖×犕,
其中犫犻犼=犘(狓狋=狅犼|狇狋=犛犻)
,1≤犻≤犖;1≤犼≤犕(16)通过指定状态空间、观测空间和上述3组参数即可确定一个HMM,并可简化表示为
λ=(犃,犅,π)
在RUL预测中,系统性能逐渐退化直至失效(RUL为0)的过程通常是不可逆的,因此左右连续型HMM(left
rig
htcontinuousHMM)是描述退化过程的合适选择,其失效概率将随着时间推移而增加,状态转移概率矩阵形式如下:
犃=犪11犪120…000犪22犪23…00
000…犪(犖-1)(犖-1)犪(犖-1)犖
000…熿
燀燄燅0
1(17)
另外,在实际应用中,由于观测变量往往是连续变化的,因此采用混合高斯函数拟合各个隐状态的对应输出分布,则式(16)
可改写为犫犼(犗)=∑犓犽=1犮犼犽犫犼犽(犗)=∑犓犽=1
犮犼犽犖(犗,μ犼犽,犝犼犽)(18)
 第5期
黄林等:基于多源信息融合与HMM的剩余寿命预测·1751 ·                                                   式中:犗为观测序列;犓为高斯元数目;μ犼犽为状态犼对应的权重;犝犼犽为第犽个高斯元函数。因此,GM HMM可表示为
λ′=(π,犃,犮犼犽,μ犻犽,
犝犼犽)(19)并且有:
犮犼犽≥0,1≤犼≤犖;1≤犽≤犓(20)
∑犓
犽=1
犮犼犽=1,1≤犼≤犖(21)2.2 系统状态识别
HMM主要用于解决3个基本问题[2122],
分别是:①评估模型与观测序列之间的匹配程度;②根据观测序列推断出隐藏的模型状态;③训练模型使其能更好地描述观测数据。本文主要利用GM HMM解决后面两个问题。针对本文的实际需求,首先采用Baum Welch算法,基于充足的训练样本数据,对GM HMM模型参数进行训练,通过极大似
然估计可得到观测序列下概率最大的模型,以该模型作为最终的模型,即上文中提到的问题③。得到HMM模型后,
地理位置服务运用维特比算法,对测试数据进行分析处理,从而推断系统当前的健康状态,即HMM模型的隐状态,从而实现对设备当前健康状态的有效识别,对应上文提到的问题②,具体流程如图2所示。
图2 HMM健康状态预测流程Fig.2 HealthstatuspredictionbasedonHMM2.
3 基于蒙特卡罗模拟的犚犝犔预测通过训练数据对GM HMM模型进行训练后,即可得到系统的转移矩阵,
转移矩阵以概率的形式,描述了系统健康状态在每一个循环过程的演变信息,从而可以有效地对
系统当前的健康状态进行预测,
系统RUL预测流程如图3所示。图3 RUL预测流程Fig.
3 RULpredictionprocess  本文采用蒙特卡罗模拟[23],
基于GM HMM转移矩阵计算系统RUL,
具体过程为:①基于训练后的GM HMM模型,对当前测试样本进行狀次模拟,在这狀次模拟中,设
备将逐步从健康状态演变至失效状态。根据GM HMM转移概率生成0~1之间的均匀分布随机数,从而估计下一时刻系统健康状态;②将计算出的下一个状态视为当前状
态,重复此过程直到达到系统失效状态;③系统从健康状
态运行至失效前的运行次数可作为RUL预测值,
通过狀次模拟,可以得到狀个RUL预测值,直至完成所有样本模拟。根据蒙特卡罗模拟方法的思想,系统到达失效状态的平均步数可作为RUL预测值:光滑的皮革
steps =1狀∑狀犻=1
RUL犻(22)

本文发布于:2024-09-22 04:35:45,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/3/256824.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:状态   数据   系统   预测   进行   方法
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议