基于CNN-LSTM的轴承故障智能诊断方法研究

第41卷第12期 2020年12月
自动化仪表
PROCESS AUTOMATION INSTRUMENTATION
Vol.41 No. 12
Dec. 2020
基于C N N-L S T M的轴承故障智能诊断方法研究
徐先峰,赵龙龙,夏振
(长安大学电子与控制工程学院,陕西西安710064)
摘要:针对轴承工况背景复杂、故障诊断难度大、威胁公共安全和社会经济等特点,利用深度学习方法对轴承故障进行分析和建模考虑轴承故障诊断对实时性、稳定性以及准确性的高要求特性,基于卷积神经网络(CNN) f彳动提取重要特征、训练速度快的优势,提取轴承故障信号的故障信息作为整体模型的输人。提出了卷积-长短时记忆神经网络(CNN-LSTM)轴承故障诊断模型,建立一 种端到端的学习架构,
实现轴承故障的智能诊断和分类。使用凯斯西储大学(CWRU)轴承数据在Python搭建的keras框架仿真验证,结果显示所提故障诊断方法较传统方法准确率更高,模型的运行速度相较于长短时记忆网络(LSTM)轴承故障诊断方法更快,可以有 效解决对比模型的稳定性差、收敛速度慢的问题:实测结果验证了所建模型应用于轴承故障诊断领域的准确性和可行性,表明结合 深度学习建立轴承故障诊断模型必将成为轴承故障诊断行业的重要发展方向之一。
关键词:轴承故障;卷积神经网络;长短对记忆神经网络;故障分类;特征提取;智能诊断
中图分类号:TH133.33 文献标志码:A D0I: 10. 16086/j. cnki. issn 1000-0380. 2020030015
Research on Intelligent Fault Diagnosis Method
for Bearings Based on CNN-LSTM
X U X i a n f e n g,Z H A O L o n g l o n g,X I A Z h e n
(College of Electronics and Control Engineering,Chang'an University,Xi' an 710064,China)
A bstract :In view of the characteristics of complex hearing operating conditions,difficulty in fault diagnosis and threats to public safety and social economy, the analysis and modeling are made for b
earing faults by using deep learning. Considering the requirements of real-tim e,stability and accuracy of bearing fault diagnosis,based on the advantages of convolution neural network (C N N) ,in automatic extraction of important features and fast training speed are used as the input of the model to extract fault information of bearing fault signals. The convolutional neural network-long and short terim memory ( CNN-LSTM) bearing fault diagnosis model is proposed, and an end-to-end learning architecture is established to realize intelligent diagnosis and classification of l>earing faults. The bearing data of Case Western Reserve University ( CW RU) is simulated and verified in the keras framework built by Python. The results show that the proposed fault diagnosis method is more accurate than the traditional method,and the running speed of the model is faster compared to the long and short term memory (LSTM) neural network bearing fault diagnosis method, which can effectively solve the problems of poor stability and slow convergence speed of the comparison model. The tested results proved the accuracy and feasibility of the model used in the field of bearing fault diagnosis. The establishment of bearing fault diagnosis model combined with deep learning will become one of the important development directions of the bearing fault diagnosis industry.
K eyw ords:Bearing fault; Convolutional neural network( CNN) ; Long and short term memory ( LSTM) neural network;Fault classification;Feature extraction;Intelligent diagnosis
〇引言
轴承作为旋转机械设备中广泛应用的关键部件之 一111,发生故障会导致设备停产,甚至造成人员伤亡21。超过50%的旋转机器故障与轴承故障有关'轴承故障诊断可以发现轴承的早期特征和演变进程,防止因故障造成的损失[4]。深度学习在21世纪迅猛 发展。由于其在机械故障领域的应用成果丰硕,研究 人员已经将多种深度学习模型应用在轴承故障诊断 中[5]。本文利用深度学习中卷积神经网络
收稿日期:2020-03-09
基金项目:陕西省自然科学基础研究计划基金资助项目(2019GY-002)、长安大学中央高校基本科研基金资助项目(300102328202) 作者简介:徐先峰( 1982—),男,博士,副教授,硕七生导师,主要研究方向为信号处理、深度学习理论及应用、智能电网等,E-mail :***************
• 28 •自动化仪表第41卷
(convolutional neural network,C N N)收敛速度快、准确 率高的优势6 ,以及长短时记忆神经网络(long ami
s l i m'l term m e m o r y,L S T M)神经网络在处理时间序列应 用中的优势,提出基于卷积-长短时记忆神经网络
(convolutional neural network-long and short term m e m o r y
neural network,C N N-1S T M)的轴承故障诊断方法该方法将原始轴承振动信号进行C N N卷积层和池化层 处理后作为模型的输人,利用L S T M中的门运算进一 步对数据进行处理,最后输出至全连接层进行运算分类并输出故障类别试验结果a示,模型具有良好的 收敛速度和精确度。
1 C N N-L S T M轴承故障诊断模型
本文利用C N N提取轴承故障震动信号的故障信 息,用作L S T M的输人层;建立C N N-L S T M轴承故障诊 断模型,采用端到端的学习架构,提升L S T M轴承故障 诊断模型的实时诊断能力。模型总体框架如图1所示。
图1模型总体框架图
Fig. 1Overall framework of the model
C N N-L S T M模型搭建流程如图2所示,
图2模型搭建流程图
Fig. 2 Model building flowchart
C N N-L S T M模型利用C N N的卷积层和池化层,对输人的原始轴承故障数据进行特征降维,并以此 作为L S T M网络层的特征输入;输出接softmax线性 输出层展开成与最终分类数目相匹配的维度;使用 A(l a m优化算法对整个网络参数进行更新,直至完成 r次训练;在代价函数收敛时截止,以确保模型的准 确率。
2 C N N轴承故障诊断模型
C N N是一种专门为处理高维网格型数据而设计 的神经网络,凭借其强大的特征提取与模式识别能力,受到学术界和工业界的广泛关注m。本文采用的C N N结构如图3所示C N N主要由输人层、卷积层、池化层、全连接层和输出层5部分组成该C N N是由 2个卷积层、2个池化层、1个全连接层以及I个 Softmax组成。由于单核的卷积每次只能提取一种特 征,而实际应用中则希望网络的每一层能在多个位置 提取多种类型的特征,所以采用多个并行卷积组成的
运算。
第12期基于C N N-L S T M的轴承故障智能诊断方法研究徐先峰,等•29 •
图3 CN N结构示意图
Fig. 3 Strm ture of CNN
CNN结构的基本原理为:首先,通过历史数据获取机械设备全部可能发生的运行状态,以构成状态空间,并利用CNN诊断模型拾取全部状态的隐藏特征;8 ;然后,利用分类器利用监督学习对特征空间进行划分,将特征空间映射到状态空间,从而实现机械设备的故障检测、诊断与模式匹配等1(11。
2.1卷积层
原始轴承故障信号经过CNN的输人层标准化后输出至卷积层,使用原始轴承故障输人数据与多个卷积核卷积生成特征映射;输人数据序列X = [*,,…,.v\]。其中,A"为序列的长度。卷积层中的卷积运算可以定义为卷积核阶(识e#)和串联矢量之间的乘法运算。
丨㊉㊉A㊉'丨⑴
式中:,为从第;个点开始的序列信号窗口;L为卷积核的大小;®为串联方式连接数据样本。
最终的卷积操作被定义为:
4 =『㊉(2)式中:《彳为第y个卷积核上的第;个权;6为偏置项;2丨为卷积核IT在序列上学习到的特征..
通过卷积核从样本数据的第一个点到最后一个点的滑动窗口,得到第』_个卷积核的特征映射,可以表示为:
2; = [2;,r;,W.+1](3)在卷积操作之后,使用线性整流单元Rel.u激活函数激活神经单元。ReLu激活函数公式描述为:
a: =〇•(:;) = max丨1(4)式中:< 为第y个卷积核卷积运算得到的第 个输出值;<;为经过激活函数得到的z丨的激活值.
2.2池化层方式有两种:最大池化和平均池化:m最大池化是取该区域所有神经元的最大值,平均池化则是取区域内神经元的均值本文采用的最大值池化计算示例如图4所示
图4最大值池化计算示例
Fig. 4 Example of maximum pooling calclation
2.3全连接层
全连接层把池化层降维提取轴承故障最重要的局部特征全部连接起来,将输出值送至分类器。全连接层位于神经网络的顶端将最后一个池化层的输出通过Flatten层展平为一维的特征向量,作为后续全连接层的输人,从而在其与输出层之间构建全连接网络全连接层的正向传播公式为:
z'*'U)=X(5)式中:< 为第/层第i_个神经元与第(/+ I)个神经元之间的权值为第(/+ 1 )层第;'个输出神经元的i»gits值< 为第/层所有神经元对第(/+1)层第y个神经元的偏置值。
本文搭建CNN模型诊断逻辑如图5所示。图5中:输人为(2 048x1)的轴承故障诊断信号通过第一个卷积层及I H u激活层成为一组(256 x32)的特征阁,卷积层的窗口大小为64x1、步长16x1第一层卷积层窗口较大是为了提取短时特征卷积层后接一个池化层,池化层的窗口大小为2 x1,缩小比例因数为2,
经过卷积层卷积运算处理后的特征映射序列,在池化层进行降维提取轴承故障最重要的局部特征。池化层又称子采样层(下采样层、汇聚层)。常用的池化采用最大值池化进行降采样成为(64x32)的特征图_重复一次以上操作,把第二个池化层的输出特征图经过Flatten展平成(I 024x1
)并与全连接隐含层连接,
• 30 •自动化仪表第41卷
经过R e L u激活后输出至softmax输出层,输出10类轴 承故障,本文研究的是多分类问题,故选W分类交叉 熵损失函数作为损失函数:为了加速模型的收敛速 度,本文采用R e L u激活函数。该方法在函数正区间 有效解决了梯度消失的问题,计算速度非常快,而且涉 及的超参数较多。传统的优化器,如随机梯度下降
(stochastic gradiene (lesceat,S G D)等,容易出现局部最 优点的问题,所以使用A d a m优化器可以动态调整每
一个参数的学习率。
图5 C N N模型诊断逻辑示意图
粉末冶金网
Fig. 5 Logic diagram of CNN model diagnosis
3 L S T M神经网络轴承故障诊断模型
L S T M神经网络结构如图6所示:
L S T M神经网络
图6 LSTM神经网络结构示意图
Fig. 6 LSTM neural network stnicture
L S T M神经网络已经在许多基于时间序列的应用 中取得成功,如无约束手写字符识别、语音识别、手写 生成、机器翻译、为图像生成标题和解析等[nl。但是 L S T M网络对于轴承故障诊断系统来说,耗时长且精 度低〜。丨.S T M网络包括长时记忆和短时记忆两部分神经网络训练时的参数更新为长时i己忆,更新周 期慢,积累了训练中的经验短时记忆是循环神经网络中隐状态/|存储的历史信息,每个时刻都会更新相 对参数B L S T M网络作为循环神经网络的重要改 型,克服了循环神经网络的诸多缺点(例如梯度消失 问题),并逐渐替代经典循环神经网络u
首先,通过遗忘门删除神经元某些信息,利用上一 时刻外部状态和当前时刻输入进行三个门的计算:
丨,
,]+V(6)
t, =(r(r.r,]+ 6,) (7)
威廉加拉c,=lanh(+ b f)(8)然后,结合遗忘门/,和输人门t',更新记忆单元c,,再使用ta»/i将f,值缩放到[-I,1]之间,最后结合输 出门〇,将内部状态的信息同步给外部状态/>,具体 计算如下:
〇,=(r(W…[h,_,,x,]
+ 6…) (9)
=/, +c,x i t(10)
/?, = Vanhclo l(11) L S T M故障诊断模型流程如图7所示。
图7 LSTM故障诊断模型流程图
Fig. 7 LSTM fault diagnosis model flowchart
使用的L S T M网络模型的输出维度设为32,激活 函数使用t a M函数,优化算法采用A d a m算法,选择分 段线性近似sigmokl函数作为循环时间步的函数。输 人线形变换的权值矩阵初始化器为g l〇r〇t_U l l i f〇r m,以0为中心、标准差为的截断正态分布中抽
+j
m
第12期基于C N N-LS T\1的轴承故障智能诊断方法研究徐先峰,等•31 •
迭代次数
图8 C N N模型在训练集和验证集上的损失值曲线Fig. 8 CNN model loss cunes on training and validation sets
由图9可知,基于卷积神经网络构建的轴承故障 诊断模型,经过大约10次训练后准确率开始收敛,且 识别准确率尚可其平均准确率超过98% ,损失率也较低,在本文的硬件平台上,训练用时为30 s左右, 速度较快
1.0
取样本:K:中为权值张M中的输入单位的数f i;,为权值张量中的输出单位的数量:后者是正交 的,能够随机生成一个正交矩阵。然后,添加Flatten 层。最后,经过全连接层和s o f t m a x函数输出识别结果。
4仿真试验验证
为了验证本文建立模型的可行性,建立C N N轴承 故障诊断模型和L S T M轴承故障诊断模型进行对比验 证:试验平台为一台计算机,主要配置为:I n t e l E5 2620 V4.32G H l)D R3 R A M,I n t e l 500G SSI),N V I D I A G T X 1080T i实现的代码均采用P y t h o n语言在Keras 框架下完成a
本文的试验数据来A于凯斯西储大学(C W R U)滚 动轴承数据中心15:C W K U数据集是世界公认的轴 承故障诊断标准数据集轴承故障类型如表1所示。其采样频率为48 k H z。数据集共包含4种状态类别, 分别为内圈故障、外圈故障、滚动体故障和正常状态- 每种故障类别包含有3种故障尺寸,分别为0.017 、0.035 c m、0. 053 c m;再加上正常状态,共计10种 状态。
表1轴承故障类型
Tab. 1Bearing failure types
直径外圈故障内阍故障滚珠故障正常
xcel
直径11230
直径2456
直径3789
4.1 CNN轴承故障诊断模型
通过本文的试验平台在Pytlimi中进行仿真,可得 所建立C N N轴承故障诊断模型在训练集和验证集上 的损失值和准确率,分别如阁8和图9所示。
4
3东安黑豹
0.4
0.2
0    5 10 15 20
迭代次数
图9 CNN模型在训练集和验证集上的准确率曲线Fig. 9 CNN model accuracy ('lines on training
and validation sets
C N N模型在测试集上的损失和准确率如表2 所示。
表2 C N N模型在测试集上的损失率和准确率
Tab.2 CNN model loss rate and accuracy rate on the test set 测试次数损失韦准确率测试次数损失率准确率
10. 052 50. 966 960. 029 50. 989 4
2 0. 027 50. 979 170. 026 50. 95
3 7
3 0. 098 30. 963 180. 068 30.967 4
女体解剖授业4 0. 030 30.958 290.048 30.956 5
5 0. 058 20.972 2100. 087 60. 965 2
经过求平均值计算,可得C N N模型在测试集上的 平均准确率为0.967 3.
4.2 LSTM轴承故障诊断模型
通过所建立的L S T M轴承故障诊断模型在Python 中的仿真试验,可得L S T M模型在训练集和验证集上 的损失值和准确率,分别如图10和图11所示。
从图11中可以看出,L S T M轴承故障诊断模型最 显著的弊端是模型的准确率低、收敛速度慢,而且该模 型在本文搭建的P y t h o n平台上试验的平均用时超过 1h,无法满足轴承故障诊断的实时性和有效性。
1.00
0.75
^0.50
1.,5
0.00
-0.25
〇  5 10 15 20 25 30
迭代次数
图10 LSTM模型在训练集和验证集上的损失值曲线
Fig. 10 LSTM model loss value counes on the training
and validation sets
•训练集损失值
铂热电阻
验证集损失值!
}
iK
3g

本文发布于:2024-09-22 18:19:56,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/475193.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:轴承   故障   模型   卷积
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议