首页 > 专利技术

基于多源信息融合与HMM 的剩余寿命预测

第４４卷　第５期系统工程与电子技术www.hnnn

Ｖｏｌ．４４　Ｎｏ．５

２０２２年５月ＳｙｓｔｅｍｓＥｎｇｉｎｅｅｒｉｎｇａ

ｎｄＥｌｅｃｔｒｏｎｉｃｓＭａｙ２

０２２文章编号：１００１５０６Ｘ（２０２２）０５１７４７１０　网址：ｗｗｗ．ｓｙ

ｓｅｌｅ．ｃｏｍ收稿日期：２０２１０２２０；修回日期：２０２１０６０６；网络优先出版日期：２０２１０８２７。

网络优先出版地址：ｈｔｔｐ：

∥ｋｎｓ．ｃｎｋｉ．ｎｅｔ／ｋｃｍｓ／ｄｅｔａｉｌ／１１．２４２２．ＴＮ．２０２１０８２７．１７２６．０１４．ｈｔｍｌ基金项目：国家自然科学基金（７１８７１２１８，７２０７１２０８）资助课题通讯作者．

引用格式：黄林，龚立，姜伟，等．基于多源信息融合与ＨＭＭ的剩余寿命预测［Ｊ］．系统工程与

正交编码器电子技术，２０２２，４４（５）：１７４７１７５６．犚犲犳犲狉犲狀犮犲犳狅狉犿犪狋：ＨＵＡＮＧＬ，ＧＯＮＧＬ，ＪＩＡＮＧＷ，ｅｔａｌ．Ｒｅｍａｉｎｉｎｇｕ

ｓｅｆｕｌｌｉｆｅｐｒｅｄｉｃｔｉｏｎｂａｓｅｄｏｎｍｕｌｔｉｓｏｕｒｃｅｉｎｆｏｒｍａｔｉｏｎｆｕｓｉｏｎａｎｄＨＭＭ［Ｊ］．ＳｙｓｔｅｍｓＥｎｇｉｎｅｅｒｉｎｇａ

ｎｄＥｌｅｃｔｒｏｎｉｃｓ，２０２２，４４（５）：１７４７１７５６．基于多源信息融合与犎犕犕的剩余寿命预测

黄　林，龚　立，姜　伟，王康勃

（海军工程大学舰船综合试验训练基地，湖北武汉４３００３３）

摘　要：针对设备剩余使用寿命预测问题，

提出一种基于多源信息融合与隐马尔可夫模型的预测方法。首先，针对发动机结构复杂、监控数据参数多等问题，提出一种基于传感器信噪比和主成分分析（ｐｒｉｎｃｉｐ

ａｌｃｏｍｐｏｎｅｎｔａｎａｌｙ

ｓｉｓ，ＰＣＡ）降维的多源传感器数据融合方法。在此基础上，利用样本数据训练高斯混合隐马尔可夫模型，

同时为降低模型偏差并避免过拟合风险，提出一种“定制”策略训练方法，训练后的模型可用于系统健康状态识别和剩余使用寿命预测。最后，

通过美国国家航空航天局公开的航空发动机仿真数据集对所提方法进行了验证，并与几种具有代表性且预测精度较高的文献方法进行了比较分析，验证了方法的有效性。关键词：多源信息融合；隐马尔可夫模型；剩余使用寿命；模型训练

中图分类号：Ｖ２３９文献标志码：Ａ犇犗犐：１０．１２３０５／ｊ．

ｉｓｓｎ．１００１５０６Ｘ．２０２２．０５．３８犚犲犿犪犻狀犻狀犵狌

狊犲犳狌犾犾犻犳犲狆狉犲犱犻犮狋犻狅狀犫犪狊犲犱狅狀犿狌犾狋犻狊狅狌狉犮犲犻狀犳狅狉犿犪狋犻狅狀犳狌狊犻狅狀犪狀犱犎犕犕

ＨＵＡＮＧＬｉｎ，ＧＯＮＧＬｉ，ＪＩＡＮＧＷｅｉ，ＷＡＮＧＫａｎｇ

ｂｏ（犛犺犻狆犆狅犿狆狉犲犺犲狀狊犻狏犲犜犲狊狋犪狀犱犜狉犪犻狀犻狀犵犅犪狊犲，犖犪狏狔犝狀犻狏犲狉狊犻狋狔狅犳犈狀犵

犻狀犲犲狉犻狀犵，犠狌犺犪狀４３００３３，犆犺犻狀犪）犃犫狊狋狉犪犮狋：Ａｉｍｉｎｇａｔｔｈｅｐｒｏｂｌｅｍｏｆｅｑｕｉｐｍｅｎｔｒｅｍａｉｎｉｎｇｕ

ｓｅｆｕｌｌｉｆｅｐｒｅｄｉｃｔｉｏｎ，ａｐｒｅｄｉｃｔｉｏｎｍｅｔｈｏｄｂａｓｅｄｏｎｍｕｌｔｉｓｏｕｒｃｅｉｎｆｏｒｍａｔｉｏｎｆｕｓｉｏｎａｎｄｈｉｄｄｅｎＭａｒｋｏｖｍｏｄｅｌｉｓｐｒｏｐｏｓｅｄ．Ｆｉｒｓｔｌｙ，ａｍｕ

ｌｔｉｓｏｕｒｃｅｓｅｎｓｏｒｄａｔａｆｕｓｉｏｎｍｅｔｈｏｄｂａｓｅｄｏｎｓｉｇｎａｌｔｏｎｏｉｓｅｒａｔｉｏｏｆｓｅｎｓｏｒａｎｄｐｒｉｎｃｉｐａｌｃｏｍｐｏｎｅｎｔａｎａｌｙｓｉｓ（ＰＣＡ）ｄｉｍｅｎｓｉｏｎａｌｉｔｙ

ｒｅｄｕｃｔｉｏｎｉｓｐｒｏｐｏｓｅｄｔｏｓｏｌｖｅｔｈｅｐｒｏｂｌｅｍｓｏｆｃｏｍｐｌｅｘｅｎｇｉｎｅｓｔｒｕｃｔｕｒｅａｎｄｍｕｌｔｉｐｌｅｍｏｎｉｔｏｒｉｎｇｄａｔａｐ

ａｒａｍｅｔｅｒｓ．Ｏｎｔｈｉｓｂａｓｉｓ，ｔｈｅＧａｕｓｓｉａｎｍｉｘｔｕｒｅｈｉｄｄｅｎＭａｒｋｏｖｍｏｄｅｌｉｓｔｒａｉｎｅｄｕｓｉｎｇｔｈｅｓａｍｐｌｅｄａｔａ．Ａｔｔｈｅｓａｍｅｔｉｍｅ，ｉｎｏｒｄｅｒｔｏｒｅｄｕｃｅｔｈｅｄｅｖｉａｔｉｏｎｏｆｍｏｄｅｌａｎｄａｖｏｉｄｔｈｅｒｉｓｋｏｆｏｖｅｒｆｉｔｔｉｎｇ，ａ“ｃｕｓｔｏｍｉｚｅｄ”ｓｔｒａｔｅｇｙｔｒａｉｎｉｎｇｍｅｔｈｏｄｉｓｐｒｏｐｏｓｅｄ．Ｔｈｅｔｒａｉｎｅｄｍｏｄ

ｅｌｃａｎｂｅｕｓｅｄｆｏｒｓｙｓｔｅｍｈｅａｌｔｈｓｔａｔｕｓｒｅｃｏｇｎｉｔｉｏｎａｎｄｒｅｍａｉｎｉｎｇｕｓｅｆｕｌｌｉｆｅｐｒｅｄｉｃｔｉｏｎ．Ｆｉｎａｌｌｙ，ｔｈｅｅｆｆｅｃｔｉｖｅｎｅｓｓｏｆｔｈｅｐｒｏｐｏｓｅｄｍｅｔｈｏｄｉｓｖｅｒｉｆｉｅｄｂｙｔｈｅａｅｒｏｅｎｇ

ｉｎｅｓｉｍｕｌａｔｉｏｎｄａｔａｓｅｔｐｕｂｌｉｓｈｅｄｂｙＮａｔｉｏｎａｌＡｅｒｏｎａｕｔｉｃｓａｎｄＳｐ

ａｃｅＡｄｍｉｎｉｓｔｒａｔｉｏｎ，ａｎｄｃｏｍｐａｒｅｄｗｉｔｈｓｅｖｅｒａｌｒｅｐｒｅｓｅｎｔａｔｉｖｅｌｉｔｅｒａｔｕｒｅｍｅｔｈｏｄｓｗｉｔｈｈｉｇｈｐｒｅｄｉｃｔｉｏｎａｃｃｕｒａｃｙ．犓犲狔狑狅

狉犱狊：ｍｕｌｔｉｓｏｕｒｃｅｉｎｆｏｒｍａｔｉｏｎｆｕｓｉｏｎ；ｈｉｄｄｅｎＭａｒｋｏｖｍｏｄｅｌ；ｒｅｍａｉｎｉｎｇｕｓｅｆｕｌｌｉｆｅ；ｍｏｄｅｌｔｒａｉｎｉｎｇ０　引　言在故障预测与健康监测（ｐｒｏｇ

ｎｏｓｔｉｃｓａｎｄｈｅａｌｔｈｍａｎａｇｅｍｅｎｔ，ＰＨＭ）领域中，对设备性能退化的实时预测非常重要，是基于状态维修（ｃｏｎｄｉｔｉｏｎｂａｓｅｄｍａｉｎｔｅｎａｎｃｅ，ＣＢＭ）策略制定的重要依据。但是在大多数情况下，监控系统测量的数据无法跟踪系统每个组件的退化

状态，因此ＣＢＭ需要一个能够基于监测数据预测其系统性能退化状态的模型

或者是一个可以量化的指标，例如系统健康指数（ｈｅａｌｔｈｉｎｄｅｘ，ＨＩ）、剩余使用寿命（ｒｅｍａｉｎｉｎｇｕ

ｓｅｆｕｌｌｉｆｅ，ＲＵＬ）等。ＲＵＬ是指设备失效前能够运行的次数或者时间。准确的ＲＵＬ预测在实施ＣＢＭ策略中起着关键作用，因为其

　·１

７４８　·系统工程与电子技术第４４卷　可以为维修人员在系统故障之前提供足够的时间，使用者能够及时评估设备的健康状况，并针对设备状态规划和制定未来的维护保养计划。目前常采取的做法是，利用系统传感器采集大量的实时数据，将这些数据存储在历史数据集中，并通过建立基于数据驱动模型（ｄａｔａｄｒｉｖｅｎｍｏｄｅｌ，ＤＤＭ）

来预测精确的组件衰减状态和ＲＵＬ。在关于ＰＨＭ和ＣＢＭ的文献中，基于物理模型、统计学理论和数据驱动等诸多方法被提出来解决ＲＵＬ预测问题。近年来，由于机器学习方法能够在不了解设备退化机制的情况下，仅依靠历史数据对设备运行状态进行学习和预测，不需要过多的领域知识，因此受到了越来越多的关注［１］，其中常用的方法包括支持向量机（ｓｕｐｐｏｒｔｖｅｃｔｏｒｍａ

ｃｈｉｎｅ，ＳＶＭ）［２］、隐马尔可夫模型（ｈｉｄｄｅｎＭａｒｋｏｖｍｏｄｅｌ，ＨＭＭ）［３］、卡尔曼滤波［４］、深度学习方法［５６］等。ＨＭＭ最早被应用于语音识别［７］，是一个双重嵌入的随机过程，其一般随机过程是不可观测的（设备的状态是隐藏的），只能通过产生观测序列（即传感器信号）的另一组随机过程来观测，适用于动态过程时间序列信号分析和平稳随机信号的建模，在语音识别、手势识别、目标跟踪［８］等许多应用领域都显示出其优越的性能。ＨＭＭ同样也被广泛应用于故障诊断和故障预测领域［９］，故障预测是ＰＨＭ核心课题之一，ＨＭＭ可根据测量信号检测和识别系统健康状态，并对未来一段时间内的健康状态进行估计，从而实现系统ＲＵＬ预测。Ｚｈｕ等［１０］针对动态工业过程中的故障分类问题，提出了一种ＨＭＭ驱动的鲁棒隐变量模型，将概率结构发展为一种分类器形式，以便在模型获取过程中融合各种类型的过程信息。Ｙｉａｋｏｐ

ｏｕｌｏｓ等［１１］利用分段聚合近似和符号聚合近似时间序列数据挖掘表示方法，

结合ＨＭＭ应用于过程变量监控数据，并与过程缺陷相关联，从而捕捉隐藏在观测数据中的有意义的信息，识别特定异常情况。Ｇａｌａｇｅｄａｒａｇｅ等［１２］采用ＨＭＭ贝叶斯网络混合系统，对田纳西伊斯曼过程中的１０个已识别故障进行预测和隔离，并成功地预测了所选的１０个过程故障，并对其中的８个进行了准确隔离。Ｗａｎｇ等［１３］提出了一种基于ＨＭＭ的多模态过渡过程故障检测方法，以一种隐状态概率集成策略将局部监测结果以概率方式组合

成两个全局指标，并采用贝叶斯信息准则进行模型评估，后采用负对数似然概率指标进行过渡过程故障检测。Ｄｕ等［１４］以ＨＭＭ建立润滑油降解的状态演化过程，利用最大化期望（ｅｘｐ

ｅｃｔａｔｉｏｎｍａｘｉｍｉｚａｔｉｏｎ，ＥＭ）算法估计ＨＭＭ的未知参数，并以后验概率的形式通过条件可靠度函数和平均剩余寿命函数来进行预测。Ｓｏｕａｌｈｉ等［１５］提出了两种基于ＨＭＭ故障预测的概率方法，将故障预测不仅限于对ＲＵＬ的估计，

而且还扩展到对未来可能出现故障的风险的估计。Ｌｅ等［１６］针对系统可能存在多个性能退化机制的情

况，提出了一个多分支建模框架，通过ＣＢＭ环境中的状态监测信息，证明了多分支ＨＭＭ在ＲＵＬ估计方面的性能。上述文献证明了ＨＭＭ在ＲＵＬ预测应用中的有效

性，并且与许多其他ＲＵＬ预测方法相比，ＨＭＭ的一个显

著优点是具有比较强的可解释性。但是，标准ＨＭＭ的最基础的假设是马尔可夫链，即系统下一时刻的状态仅由当前状态决定，

不依赖于以往的任何状态，并以此计算所有变量的联合概率分布。这样将导致在利用建立好的ＨＭＭ进行预测时，因为没有考虑预测对象的全寿命过程退化轨迹，ＨＭＭ将产生较大的偏差，从而导致预

测结果不够理想。针对上述问题，提出了一种基于多源信息融合的ＨＭＭ建模方法，首先定义经验信噪比（ｅｍｐｉｒｉｃａｌｓｉｇｎａｌｔｏｎｏｉｓｅｒａｔｉｏ，ｅＳＮＲ）选取主要信号，随后基于主成分分析（ｐｒｉｎｃｉｐａｌｃｏｍｐｏｎｅｎｔａｎａｌｙ

ｓｉｓ，ＰＣＡ）方法将多维发动机监控数据进行信息融合，将监控数据从多维降至一维，通过对

降维后的数据进行分析和比较，得到每台发动机的ＨＩ，再将测试数据集中的发动机性能ＨＩ与训练数据集遍历比较，通过相似性分析得到若干个与之最为接近的训练发动机ＨＩ，再将相应的发动机数据进行ＨＭＭ建模，针对测试数据集中的每个发动机分别建立一个与之相对应的高斯混合

隐马尔可夫模型（ＧａｕｓｓｉａｎｍｉｘｔｕｒｅＨＭＭ，ＧＭＨＭＭ）

，再对其进行隐状态分析，

通过ＥＭ算法，得到后验概率最大的模型后，

采用维特比算法估计当前发动机的退化状态，再利用蒙特卡罗模拟，通过生成从当前健康状态到故障状态的路径，估计发动机的ＲＵＬ。相比于直接利用所有的数据训练一个ＨＭＭ，该方法在分析发动机退化轨迹的基础上，针对每一个测试发动机分别得到一个ＨＭＭ，充分考虑了发动机的历史退化轨迹的影响，提高了模型的准确度。同时，为了避免可能出现的过拟合风险，相比于直接挑选一个最相

似的退化轨迹，利用相似度原理分析选出了若干个最相似轨迹，再对其进行ＨＭＭ建模。最后通过对ＮＡＳＡ公开的航空发动机的案例进行研究，证明了所提预测方法的有效性。１　基于犲犛犖犚和犘犆犃的传感器信号融合方法１．１　基于犲犛犖犚的传感器特征提取

特征提取是模式识别和机器学习的重要课题，数据中如果包含大量冗余变量或噪声信号，会对模型性能产生非

常大的影响，

导致模型过拟合或精度差等问题。在ＲＵＬ预测的应用中，

特征提取等价于选择合适的传感器信号，其目的是降低数据之间的冗余并尽量提高其相关性。常用的传感器选择方法包括观察传感器数据变化趋势［１７］、

基于信息熵理论的传感器选择［１８］，

上述方法简单直观，操作性强，但缺乏理论基础，基于主观判断的信号特征使预测结果不

稳定。为提取有用的传感器信号，并同时达到降噪的目的，本文提出了一种基于信噪比分析的传感器特征提取方法。首先对信号进行归一化处理，在此基础上分析各传感器数据

太阳能电池板制作

　第５期

黄林等：基于多源信息融合与ＨＭＭ的剩余寿命预测·１７４９　· 　的信噪比，再采用ｓｉｇｍｏ

ｉｄ函数将信噪比转化至０～１区间后，

将归一化的传感器信号乘以对应的信噪比函数，对信号进行加权后，同时考虑传感器信号的变化趋势和不同信号之间的相关性，采用核ＰＣＡ方法对数据进行降维，根据主成分方差占比提取信号作为最终的预测信号。令｛狊犻｝为１维时间序列的原始传感器信号，｛狊犻＿狊｝为经过ＰＣＡ降维和数据平滑后的时间序列，定义ｅＳＮＲ为ｅＳＮＲ（狊）＝ｖａｒ｛狊犻—狊｝）／ｖａｒ｛狊犻｝

（１）传感器信号的权重将根据其对应的ｅＳＮＲ而定，具体为珘狔狀＝狔狀·ｅＳＮＲ（狔狀）（２）式中：狔狀为传感器信号；珘狔狀为修正后的传感器信号，通过ｅＳＮＲ修正后，

能够充分降低传感器信号中杂讯的影响，起到滤波的作用，从而提取更加可靠的系统ＨＩ。１．２　基于犘犆犃数据降维与信息融合ＰＣＡ是一种数据压缩和特征提取的多变量统计分析技术，能够有效去除数据间的相关性，目的就是在保证数据损失尽可能小的前提下，经过线性变换舍弃小部分信息，以少数新的综合变量取代原始变量，因此要求主成分能够充分反映原始变量的信息，同时又互不相关，

从而进行样本评价。在许多情况下可以通过ＰＣＡ来降低特征向量的维数，将系统众多的传感器信号转换为较少数量的主成分，同时ＰＣＡ可以消除变量间的线性相关性，并通过融合多个变量来抑制噪声。传感器信号之间可能存在关联，且其相关性可能会破坏ＲＵＬ预测模型，使预测结果产生偏差。ＰＣＡ是一种将潜在相关变量转换为少量不相关变量的常用技术。数据集犡＝（狓１，狓２，…，狓犾，…，狓犔）包含犔个样本，每个样本为犖维变量，则犡的经验均值为狌＝（μ１，μ２，…，μ犖）Ｔ（３）μ狀＝１犔∑犔犾＝１

犡［狀，犾］（４）样本的协方差矩阵为犆＝１犔－１（犡－狌犺）（犡－狌犺）Ｔ（５）式中：犺为全为１的犔维向量。对协方差矩阵犆进行特征向量分解，并选取前犕个特征向量，特征向量数犕的选择取决于希望保留的数据方差，例如８０％，即有：犕＝ｍｉｎ犿＝１，２，…，犖

改锥头犿∑犿狀＝１λ狀≥８０％∑犖狀＝１λ烅烄烆狀（６）因此，可以对数据集犡进行降维处理，并保留系统８０％方差：犣＝犞Ｔ犕·犢＝犞Ｔ犕（

犡－狌犺）（７）式中：犞犕＝（狏１，狏２，…，狏犕）

为由犕个特征向量组成的犖×犕矩阵，犢为犕×犔矩阵且每列为犡中对应列向量的一个主分量向量。１．３　犎犐构建本文对比了目前使用较为广泛的用于数据平滑从而构建系统ＨＩ的两种算法，分别是核岭回归（ｋｅｒｎｅｌｒｉｄｇ

ｅｒｅｇｒｅｓｓｉｏｎ，ＫＲＲ）［１９］和支持向量回归（ｓｕｐｐｏｒｔｖｅｃｔｏｒｒｅｇｒｅｓｓｉｏｎ，

ＳＶＲ）模型［２０］。算法对经过ｅＳＮＲ特征选择和ＰＣＡ降维后的多维系统监测数据进行拟合平滑处理，提取系统性能退化特征曲线，从而构建系统ＨＩ。１．３．１　ＫＲＲ

ＫＲＲ是岭回归（ｒｉｄｇｅｒｅｇｒｅｓｓｉｏｎ，ＲＲ）的扩展，而ＲＲ的本质是在线性回归的基础上增加Ｌ２正则化，ＲＲ的最小化代价函数为犔（犠）＝１狀∑狀犻＝１

狔犻－犠π狓犻２Ｆ＋λ‖犠‖２Ｆ（８）式中：

λ为正则化参数；‖·‖Ｆ表示Ｆ范数；犠∈犚狆×犱是变化矩阵；狓犻为第犻个样本；狔犻为第犻个样本的真实值。即求解

ａｒｇｍ

ｉｎ犔（犠）＝（犣Ｔ犣＋λ犐狆）－１犣Ｔ犢（９）式中：犣∈犚狀×狆，犢∈犚狀×狆为训练数据特征向量矩阵和因变量矩阵；犐狆∈犚狆×狆为恒等矩阵。通过核变换可以将此方法进行扩展，将数据映射到某一个核空间，使得数据在该核空间线性可分，从而能够处理非线性数据，则回归函数结果可表示为

犳（

狓）＝犢Ｔ（犓＋λ犐狀）－１犽（狓）（１０）式中：犓为Ｇｒａｍ矩阵，犓犻犼＝犽（狓犻，狓犼）（犻＝１，２，…，狀），狀为训练样本的数量。本文使用高斯核函数：

犓犻犼＝犽（狓犻，狓犼）＝ｅｘｐ烄烆烌烎（１１）式中：σ为核函数宽度，通常采用交叉验证的方式选取合适的宽度参数。１．３．２　ＳＶＲ

ＳＶＲ是ＳＶＭ在分类应用方面的推广，ＳＶＲ假设模型输出犳（狓犻）

与真实值狔犻之间最多有ε的误差，即仅当与之间的误差绝对值小于ε就算预测正确。于是，ＳＶＲ问题写成：ｍｉｎ狑，犫１２‖狑‖２＋犅∑犿犻＝１犾ε（犳（狓犻）－狔犻）（１２）式中：狑为样本空间中超平面的法向量；犅为正则化常数；犾ε

为ε的不敏感损失函数：犾ε（狕）＝０，｜狕｜＜ε｜狕｜－ε，烅烄烆其他（１３）更多关于ＳＶＭ的原理建议参看文献［２１］

。１．３．３　对比分析

图１为两种方法对论文拟采用的数据集中某一训练样本进行拟合的情况，直接采用经过ＰＣＡ降维后的散点

　·１

７５０　·系统工程与电子技术第４４卷　作为系统ＨＩ不能很好地反应系统性能随使用时间增加而

导致的性能退化情况，因此需要进行曲线拟合，提取系统退化特征，作为系统ＨＩ。图１分别为ＫＲＲ和ＳＶＲ对数据的平滑效果以及相应的误差变化趋势。可以看出，采用ＫＲＲ提取的性能退化轨迹更加平滑，更能反应系统性能退化的真实状态，ＳＶＲ曲线起伏波动较大，与实际情况有所差别，因此采用本文所提的ＫＲＲ进行系统性能退化轨迹提取。

图１　ＫＲＲ与ＳＶＲ拟合效果对比Ｆｉｇ．１　ＣｏｍｐａｒｉｓｏｎｏｆｆｉｔｔｉｎｇｅｆｆｅｃｔｂｅｔｗｅｅｎＫＲＲａｎｄＳＶＲ２　基于犌犕

犎犕犕的犚犝犔预测２．１　犌犕犎犕犕基本原理ＨＭＭ是一种基于动态贝叶斯网（ｄｙｎａｍｉｃＢａｙ

ｅｓｉａｎｎ

ｅｔｗｏｒｋ，ＤＢＮ）的统计概率模型。ＨＭＭ假定系统状态不可观测，

并由有限个隐状态和一组观测变量构成，每个隐状态对应两种概率：

状态转移概率和输出观测概率，且在任一时刻，观测变量的取值仅依赖于隐状态。在本文所关心的状态监测和故障诊断等领域的应用中，

系统的健康状态（故障参数、ＲＵＬ、ＨＩ等）

即为ＨＭＭ模型假定的隐状态。ＨＭＭ变量分两组：①隐状态｛狇１，狇２，…，狇犖｝，狇狋为模

型在狋时刻的隐状态，假定马尔可夫隐状态空间犛＝｛犛１，犛２，…，犛犖｝

，其中犖为马尔可夫链隐状态数目，则显然有狇狋∈犛；②观测变量｛

狓１，狓２，…，狓犖｝，狓狋为狋时刻的观测值。若观测变量为离散值，并假定取值空间为χ＝｛狅１，狅２，…，狅犕｝

，则有狓犖∈χ。若ＨＭＭ应用于ＲＵＬ预测中，观测变量通常为系统一组可量化的监测变量，

通常为连续型，因此取值空间可为无限维。一个标准的ＨＭＭ可由以下３组参数确定。（１）模型在各状态之间的转移概率犃＝［犪犻犼］犖×犖，其中犪犻犼＝犘（狇狋＋１＝犛犼狘狇狋＝犛犻）∑犼犪犻犼＝烅烄烆１，１≤犻，犼≤犖（１４）（２）初始状态概率π＝［π１，π２，…，π犖］

，其中π犻＝犘｛狇１＝犛犻｝∑犻

π犻＝烅烄烆１，１≤犻≤犖（１５）（３）输出观测概率犅＝［犫犻犼］犖×犕，

其中犫犻犼＝犘（狓狋＝狅犼｜狇狋＝犛犻）

，１≤犻≤犖；１≤犼≤犕（１６）通过指定状态空间、观测空间和上述３组参数即可确定一个ＨＭＭ，并可简化表示为

λ＝（犃，犅，π）

在ＲＵＬ预测中，系统性能逐渐退化直至失效（ＲＵＬ为０）的过程通常是不可逆的，因此左右连续型ＨＭＭ（ｌｅｆｔ

ｒｉｇ

ｈｔｃｏｎｔｉｎｕｏｕｓＨＭＭ）是描述退化过程的合适选择，其失效概率将随着时间推移而增加，状态转移概率矩阵形式如下：

犃＝犪１１犪１２０…０００犪２２犪２３…００

０００…犪（犖－１）（犖－１）犪（犖－１）犖

０００…熿

燀燄燅０

１（１７）

另外，在实际应用中，由于观测变量往往是连续变化的，因此采用混合高斯函数拟合各个隐状态的对应输出分布，则式（１６）

可改写为犫犼（犗）＝∑犓犽＝１犮犼犽犫犼犽（犗）＝∑犓犽＝１

犮犼犽犖（犗，μ犼犽，犝犼犽）（１８）

　第５期

黄林等：基于多源信息融合与ＨＭＭ的剩余寿命预测·１７５１　· 　式中：犗为观测序列；犓为高斯元数目；μ犼犽为状态犼对应的权重；犝犼犽为第犽个高斯元函数。因此，ＧＭＨＭＭ可表示为

λ′＝（π，犃，犮犼犽，μ犻犽，

犝犼犽）（１９）并且有：

犮犼犽≥０，１≤犼≤犖；１≤犽≤犓（２０）

∑犓

犽＝１

犮犼犽＝１，１≤犼≤犖（２１）２．２　系统状态识别

ＨＭＭ主要用于解决３个基本问题［２１２２］，

分别是：①评估模型与观测序列之间的匹配程度；②根据观测序列推断出隐藏的模型状态；③训练模型使其能更好地描述观测数据。本文主要利用ＧＭＨＭＭ解决后面两个问题。针对本文的实际需求，首先采用ＢａｕｍＷｅｌｃｈ算法，基于充足的训练样本数据，对ＧＭＨＭＭ模型参数进行训练，通过极大似

然估计可得到观测序列下概率最大的模型，以该模型作为最终的模型，即上文中提到的问题③。得到ＨＭＭ模型后，

地理位置服务运用维特比算法，对测试数据进行分析处理，从而推断系统当前的健康状态，即ＨＭＭ模型的隐状态，从而实现对设备当前健康状态的有效识别，对应上文提到的问题②，具体流程如图２所示。

图２　ＨＭＭ健康状态预测流程Ｆｉｇ．２　ＨｅａｌｔｈｓｔａｔｕｓｐｒｅｄｉｃｔｉｏｎｂａｓｅｄｏｎＨＭＭ２．

３　基于蒙特卡罗模拟的犚犝犔预测通过训练数据对ＧＭＨＭＭ模型进行训练后，即可得到系统的转移矩阵，

转移矩阵以概率的形式，描述了系统健康状态在每一个循环过程的演变信息，从而可以有效地对

系统当前的健康状态进行预测，

系统ＲＵＬ预测流程如图３所示。图３　ＲＵＬ预测流程Ｆｉｇ．

３　ＲＵＬｐｒｅｄｉｃｔｉｏｎｐｒｏｃｅｓｓ本文采用蒙特卡罗模拟［２３］，

基于ＧＭＨＭＭ转移矩阵计算系统ＲＵＬ，

具体过程为：①基于训练后的ＧＭＨＭＭ模型，对当前测试样本进行狀次模拟，在这狀次模拟中，设

备将逐步从健康状态演变至失效状态。根据ＧＭＨＭＭ转移概率生成０～１之间的均匀分布随机数，从而估计下一时刻系统健康状态；②将计算出的下一个状态视为当前状

态，重复此过程直到达到系统失效状态；③系统从健康状

态运行至失效前的运行次数可作为ＲＵＬ预测值，

通过狀次模拟，可以得到狀个ＲＵＬ预测值，直至完成所有样本模拟。根据蒙特卡罗模拟方法的思想，系统到达失效状态的平均步数可作为ＲＵＬ预测值：光滑的皮革

ｓｔｅｐｓ＝１狀∑狀犻＝１

ＲＵＬ犻（２２）

本文发布于:2024-09-22 04:35:45，感谢您对本站的认可！

本文链接：https://www.17tex.com/tex/3/256824.html

上一篇：中国知网的数据采集攻略

下一篇：细菌GntR家族转录调控因子的研究进展

标签：状态数据系统预测进行方法

留言与评论（共有 0 条评论）