一种结合TF-IDF和LSTM模型的变桨电机异常温升预警方法与流程


一种结合tf-idf和lstm模型的变桨电机异常温升预警方法
技术领域
1.本发明涉及机器学习的算法领域,特别涉及一种结合tf-idf和lstm模型的变桨电机异常温升预警方法。


背景技术:



2.变桨系统是用来控制叶片相对于旋转平面的位置角度的机械机构,风力发电机组通过变桨来控制机组启停、控制输出功率等任务,变桨距控制方式一般可以分为两种,一种是电机执行机构,另一种是液压执行机构,电机变桨距执行机构利用电动机对桨叶进行单独控制,现在主流的风力发电机组为同步变桨系统,所以三个独立的变桨电机执行相同的变桨控制指令,电机本身如果连续频繁地调节桨叶,将产生过量的热负荷使电机损坏,变桨系统的调节过程如下所示。
3.风速大-》叶片角度90
°‑
》降低转速或停机-》保证安全
4.风速小-》叶片角度0
°‑
》追求最大转速-》最大发电功率
5.变桨系统是风力发电机组重要的传动链控制装置,为影响风机发电量、能量控制甚至机组安全的重要部件,变桨电机由于自身性能老化衰退、工作负荷增大造成产生热量增加,由于散热异常引起电机进一步裂化,导致电机过热、抱死等故障,造成变桨控制不同步、风能利用降低甚至更严重的安全隐患,对变桨电机及其散热的监测预警,有益于及时发现变桨电机及其散热的异常,及时检修,避免更大的性能损失和安全问题出现。


技术实现要素:



6.本发明的目的在于提供一种结合tf-idf和lstm模型的变桨电机异常温升预警方法,包括以下步骤:
7.步骤一,数据抽取:从风机scada历史数据库抽取测点数据;
8.步骤二,数据清洗:按照空值剔除和异常值剔除两种原则对每个测点的数据进行剔除;
9.步骤三,风机工况划分:在对非正常工况数据的模型训练时,针对不同的负荷训练不同的模型,得到不同的基线值;
10.步骤四,模型训练:采用tf-idf和lstm这两种训练模型对数据进行训练工作;
11.步骤五,预警模型运行:模型每1个小时运行一次,每次使用最近2天的数据,采集一个窗口的数据量,计算每个温度差的tf-idf向量和基线模型之间的距离以及计算每个变桨电机温度的预测值和设备实际参数的距离,计算风险值,最后映射为预警级别。
12.优选的,所述步骤一中采用的测点数据分别为变桨电机的温度、变桨电机电流、叶片的角度、风速、有功功率、轮毂转速、风机状态、环境温度和机舱温度,时间长度为1年,时间间隔为1分钟。
13.优选的,所述步骤二中,在每个时间截面中,只要有一个测点数据异常,则将该时间截面数据全部剔除;
14.在空值剔除中,在机组工况恶劣或者运行状态不稳定时,scada系统中的空值数据持续一段时间,可以采用直接去除的方式进行预处理,运行不稳定的状态是指机组经常出现间歇性的启停机或者通信中断情况,scada数据存在空值记录;
15.在异常值剔除中,对于其它可能存在的异常值,通过对风电机组历史值的统计分析,采用箱型图方法进行预处理,删除明显偏离正常值的数据点,scada数据中的异常值主要指传感器的测量值超出其物理上下限,或者其测量结果超出当前可能的正常范围,如风速、环境温度等超出正常范围,对于传感器测量值超出物理上下限的数据可以直接采用删除的方式进行处理,对于测量结果采用极值判断后,明显超出当前正常范围,例如风速小于0或者大于历史上限、转速小于0等情况,该类数据所在的记录项也采取删除处理。
16.优选的,所述步骤二的异常值剔除中,通过采用箱型图的方法进行预处理时,观察数据整体的分布情况,利用中位数、25%分位数、75%分位数、上边界和下边界等统计量来来描述数据的整体分布情况,通过计算这些统计量,生成一个箱体图,箱体包含了大部分的正常数据,而在箱体上边界和下边界之外的,就认为是异常数据。
17.优选的,所述步骤二的异常值剔除中,上下边界计算公式如下所示:其中,q1表示数据的25%分位数,q3表示数据的75%分位数,lowerlimit表示数据集的下限,upperlimit表示数据集的上限。
18.优选的,所述步骤三中,非正常工况数据主要指设备未运行、设备故障、以及发生弃风限电、或出现多参数间逻辑矛盾的问题如风速低于切入风速机组却并网发电等产生的数据。
19.优选的,所述步骤三中,针对变桨电机异常温升建立预警模型,按照如下原则对风机工况进行划分:
20.(1)选择风速高于切入风速、桨叶角度大于2度并且小于50度、风机状态为发电状态的数据;
21.(2)采用基于密度的聚类分析方法,进行聚类,当需要计算对象到聚类组的距离时,应该用对象到子空间的垂直映射距离;
22.(3)聚类后的数据集即可定义为不同的工况,一般为满负荷工况和不同的限电工况。
23.优选的,所述步骤四中,
24.利用tf-idf模型计算基线值:在稳定工况下,三个桨叶的变桨电机温度保持一定的关系,首先将三个变桨电机的温度两两相减,获得特征向量,然后按照0.1摄氏度的精度对特征向量数据进行离散化,再使用离散化后特征向量的历史数据,训练出三个变桨电机温度两两参照的集水平基线向量;
25.采用lstm模型训练:利用lstm模型计算基线值:基于历史数据,训练一种出函数关系来描述变桨电机温度的变化,建立模型来预测温度,并作为基线建立模型,然后调用相同工况数据训练好的模型对变桨电机温度进行预测;
26.对特征向量数据进行离散化处理后,使用直方图方法即可描述数据的分布,采用自然语言处理领域广泛使用的加权方法tf-idf进行处理,在处理后使用实际生产数据,计算特征向量间的空间矢量距离作为风险值来进行预警,任意一组变桨电机温度异常都会输
出预警事件。
27.优选的,所述步骤四的采用lstm模型训练中,采用如下方法构建模型:
28.对原始数据进行归一化,对原始数据进行归一化的目的是scada数据中存储的监测数据种类众多,不同类型数据物理意义不同,单位也不同,为了消除不同量纲带来的影响,便于将不同单位、不同量级的数据进行比较和分析。
29.优选的,所述步骤四中采用lstm模型训练并利用利用lstm模型计算基线值时,归一化公式为
30.本发明的技术效果和优点:
31.(1)本发明采用基于tf-idf的符号化表征技术构建的异常检测模型以及采用lstm构建变桨电机温度预测模型相结合的技术,对变桨电机的异常温升进行检测,该方法有效的实现了变桨电机横向和纵向比较,即既和同一时间其它变桨电机温度比,又和自身历史上相近工况比,提升了预警的准确性;
32.(2)本发明同时还采用tf-idf的符号化表征技术可以降低传感器噪声带来的测量误差,提高信噪比;
33.(3)本发明在lstm建模时,首先划分工况,获取工况相对稳定状态下的数据集,并使用该数据集进行模型训练,避免了工况剧烈波动带来的模型失效或者模型过于复杂的问题。
附图说明
34.图1为本发明的流程示意图。
35.图2为本发明中剔除异常数据的箱型图。
具体实施方式
36.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
37.本发明提供了如图1-2所示的一种结合tf-idf和lstm模型的变桨电机异常温升预警方法,包括以下步骤:
38.步骤一,数据抽取:从风机scada历史数据库抽取测点数据;
39.步骤二,数据清洗:按照空值剔除和异常值剔除两种原则对每个测点的数据进行剔除;
40.步骤三,风机工况划分:在对非正常工况数据的模型训练时,针对不同的负荷训练不同的模型,得到不同的基线值。
41.步骤四:模型训练:采用tf-idf和lstm这两种训练模型对数据进行训练工作;
42.步骤五:预警模型运行:模型每1个小时运行一次,每次使用最近2天的数据,采集一个窗口的数据量,计算每个温度差的tf-idf向量和基线模型之间的距离以及计算每个变桨电机温度的预测值和设备实际参数的距离,计算风险值,最后映射为预警级别。
43.在步骤一中,采用的测点数据分别为变桨电机的温度、变桨电机电流、叶片的角度、风速、有功功率、轮毂转速、风机状态、环境温度和机舱温度,时间长度为1年,时间间隔为1分钟,抽取的测点数据如下表1所示;
44.pitch_mot_tmp1变桨电机1温度pitch_mot_tmp2变桨电机2温度pitch_mot_tmp3变桨电机3温度pitch_mot_curr1变桨电机1电流pitch_mot_curr2变桨电机2电流pitch_mot_curr3变桨电机3电流blade_ang1叶片1角度blade_ang2叶片2角度blade_ang3叶片3角度wd_spd风速atpwr有功功率hub_spd轮毂转速wd_tur_st风机状态hub_tmp环境温度nac_tmp机舱温度
45.表1
46.在步骤二中,在每个时间截面中,只要有一个测点数据异常,则将该时间截面数据全部剔除;
47.在空值剔除中,在机组工况恶劣或者运行状态不稳定时,scada系统中的空值数据持续一段时间,可以采用直接去除的方式进行预处理,运行不稳定的状态是指机组经常出现间歇性的启停机或者通信中断情况,scada数据存在空值记录;
48.在异常值剔除中,对于其它可能存在的异常值,通过对风电机组历史值的统计分析,采用箱型图方法进行预处理,删除明显偏离正常值的数据点,scada数据中的异常值主要指传感器的测量值超出其物理上下限,或者其测量结果超出当前可能的正常范围,如风速、环境温度等超出正常范围,对于传感器测量值超出物理上下限的数据可以直接采用删除的方式进行处理,对于测量结果采用极值判断后,明显超出当前正常范围,例如风速小于0或者大于历史上限、转速小于0等情况,该类数据所在的记录项也采取删除处理;
49.在异常值剔除中,通过采用箱型图的方法进行预处理时,观察数据整体的分布情况,利用中位数、25%分位数、75%分位数、上边界和下边界等统计量来来描述数据的整体分布情况,通过计算这些统计量,生成一个箱体图,箱体包含了大部分的正常数据,而在箱体上边界和下边界之外的,就认为是异常数据,上下边界计算公式如下所示:其中,q1表示数据的25%分位数,q3表示数据的75%分位数,lowerlimit表示数据集的下限,upperlimit表示数据集的上限。
50.在步骤三中,针对变桨电机异常温升建立预警模型,按照如下原则对风机工况进
行划分:
51.(1)选择风速高于切入风速、桨叶角度大于2度并且小于50度、风机状态为发电状态的数据;
52.(2)采用基于密度的聚类分析方法,进行聚类,当需要计算对象到聚类组的距离时,应该用对象到子空间的垂直映射距离;
53.(3)聚类后的数据集即可定义为不同的工况,一般为满负荷工况和不同的限电工况。
54.在步骤四中,对特征向量数据进行离散化处理后,使用直方图方法即可描述数据的分布,采用自然语言处理领域广泛使用的加权方法tf-idf进行处理,在处理后使用实际生产数据,计算特征向量间的空间矢量距离作为风险值来进行预警,任意一组变桨电机温度异常都会输出预警事件,在lstm模型训练中,采用如下方法构建模型:
55.首先对原始数据进行归一化,对原始数据进行归一化的目的是scada数据中存储的监测数据种类众多,不同类型数据物理意义不同,单位也不同,为了消除不同量纲带来的影响,便于将不同单位、不同量级的数据进行比较和分析,采用lstm模型建立用来预测变桨电机温度的模型,其详细参数如下表2所示,模型运行时也需要按照上述工况划分原则对工况进行划分,然后调用相同工况数据训练好的模型对变桨电机温度进行预测,采用lstm模型训练并利用利用lstm模型计算基线值时,归一化公式为
[0056][0057]
表2
[0058]
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

技术特征:


1.一种结合tf-idf和lstm模型的变桨电机异常温升预警方法,其特征在于,包括以下步骤:步骤一,数据抽取:从风机scada历史数据库抽取测点数据;步骤二,数据清洗:按照空值剔除和异常值剔除两种原则对每个测点的数据进行剔除;步骤三,风机工况划分:在对非正常工况数据的模型训练时,针对不同的负荷训练不同的模型,得到不同的基线值;步骤四,模型训练:采用tf-idf和lstm这两种训练模型对数据进行训练工作;步骤五,预警模型运行:模型每1个小时运行一次,每次使用最近2天的数据,采集一个窗口的数据量,计算每个温度差的tf-idf向量和基线模型之间的距离以及计算每个变桨电机温度的预测值和设备实际参数的距离,计算风险值,最后映射为预警级别。2.根据权利要求1所述的一种结合tf-idf和lstm模型的变桨电机异常温升预警方法,其特征在于,所述步骤一中采用的测点数据分别为变桨电机的温度、变桨电机电流、叶片的角度、风速、有功功率、轮毂转速、风机状态、环境温度和机舱温度,时间长度为1年,时间间隔为1分钟。3.根据权利要求1所述的一种结合tf-idf和lstm模型的变桨电机异常温升预警方法,其特征在于,所述步骤二中,在每个时间截面中,只要有一个测点数据异常,则将该时间截面数据全部剔除;在空值剔除中,在机组工况恶劣或者运行状态不稳定时,scada系统中的空值数据持续一段时间,可以采用直接去除的方式进行预处理,运行不稳定的状态是指机组经常出现间歇性的启停机或者通信中断情况,scada数据存在空值记录;在异常值剔除中,对于其它可能存在的异常值,通过对风电机组历史值的统计分析,采用箱型图方法进行预处理,删除明显偏离正常值的数据点。4.根据权利要求1所述的一种结合tf-idf和lstm模型的变桨电机异常温升预警方法,其特征在于,所述步骤二的异常值剔除中,通过采用箱型图的方法进行预处理时,观察数据整体的分布情况,利用中位数、25%分位数、75%分位数、上边界和下边界等统计量来来描述数据的整体分布情况,通过计算这些统计量,生成一个箱体图,箱体包含了大部分的正常数据,而在箱体上边界和下边界之外的,就认为是异常数据。5.根据权利要求1所述的一种结合tf-idf和lstm模型的变桨电机异常温升预警方法,其特征在于,所述步骤二的异常值剔除中,上下边界计算公式如下所示:其中,q1表示数据的25%分位数,q3表示数据的75%分位数,lowerlimit表示数据集的下限,upperlimit表示数据集的上限。6.根据权利要求1所述的一种结合tf-idf和lstm模型的变桨电机异常温升预警方法,其特征在于,所述步骤三中,非正常工况数据主要指设备未运行、设备故障、以及发生弃风限电、或出现多参数间逻辑矛盾的问题如风速低于切入风速机组却并网发电等产生的数据。7.根据权利要求1所述的一种结合tf-idf和lstm模型的变桨电机异常温升预警方法,其特征在于,所述步骤三中,针对变桨电机异常温升建立预警模型,按照如下原则对风机工
况进行划分:(1)选择风速高于切入风速、桨叶角度大于2度并且小于50度、风机状态为发电状态的数据;(2)采用基于密度的聚类分析方法,进行聚类,当需要计算对象到聚类组的距离时,应该用对象到子空间的垂直映射距离;(3)聚类后的数据集即可定义为不同的工况,一般为满负荷工况和不同的限电工况。8.根据权利要求1所述的一种结合tf-idf和lstm模型的变桨电机异常温升预警方法,其特征在于,所述步骤四中,利用tf-idf模型计算基线值:在稳定工况下,三个桨叶的变桨电机温度保持一定的关系,首先将三个变桨电机的温度两两相减,获得特征向量,然后按照0.1摄氏度的精度对特征向量数据进行离散化,再使用离散化后特征向量的历史数据,训练出三个变桨电机温度两两参照的集水平基线向量;采用lstm模型训练:利用lstm模型计算基线值:基于历史数据,训练一种出函数关系来描述变桨电机温度的变化,建立模型来预测温度,并作为基线建立模型,然后调用相同工况数据训练好的模型对变桨电机温度进行预测;对特征向量数据进行离散化处理后,使用直方图方法即可描述数据的分布,采用自然语言处理领域广泛使用的加权方法tf-idf进行处理,在处理后使用实际生产数据,计算特征向量间的空间矢量距离作为风险值来进行预警,任意一组变桨电机温度异常都会输出预警事件。9.根据权利要求1所述的一种结合tf-idf和lstm模型的变桨电机异常温升预警方法,其特征在于,所述步骤四的采用lstm模型训练中,采用如下方法构建模型:对原始数据进行归一化,对原始数据进行归一化的目的是scada数据中存储的监测数据种类众多,不同类型数据物理意义不同,单位也不同,为了消除不同量纲带来的影响,便于将不同单位、不同量级的数据进行比较和分析。10.根据权利要求1所述的一种结合tf-idf和lstm模型的变桨电机异常温升预警方法,其特征在于,所述步骤四中采用lstm模型训练并利用利用lstm模型计算基线值时,归一化公式为

技术总结


本发明公开了一种结合TF-IDF和LSTM模型的变桨电机异常温升预警方法,包括以下步骤:数据抽取:从风机SCADA历史数据库抽取对应测点数据;数据清洗:按照对应原则对每个测点的数据进行剔除;风机工况划分:模型训练时,针对不同的负荷训练不同的模型,得到不同的基线值;采用TF-IDF模型进行训练和LSTM模型训练,训练一种出函数关系来描述变桨电机温度的变化;预警模型运行:模型每1个小时运行一次,最后映射为预警级别。采用基于TF-IDF的符号化表征技术构建的异常检测模型以及采用LSTM构建变桨电机温度预测模型相结合的技术,对变桨电机的异常温升进行检测,该方法有效的实现了变桨电机横向和纵向比较,提升了预警的准确性。提升了预警的准确性。提升了预警的准确性。


技术研发人员:

程斌斌 王介昌 陈德彬 郭剑飞 李德鑫 于景龙 杨闰超

受保护的技术使用者:

华能国际电力开发公司吉林通榆风电分公司

技术研发日:

2022.07.04

技术公布日:

2022/11/1

本文发布于:2024-09-24 11:29:04,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/1/24050.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:数据   模型   电机   工况
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议