一种油谱数据预测方法、装置及设备与流程



1.本发明涉及一种油谱数据预测方法、装置及设备。


背景技术:



2.在换流站中,换流变压器是至关重要的关键设备。换流变压器内部充满了绝缘油,可以对运行中的变压器进行散热作用,避免变压器组件因过热而损坏。但是当变压器组件发生故障而产生过热现象或局部放电现象时,与变压器组件相接触的油就可能会因为这些热故障或电故障而导致化学键断裂,伴随产生各种化学反应,从而产生co2、ch4、h2以及c2h2等各种气体。将油中溶解的气体分离出来就产生了油谱数据。
3.在油谱中,不同成分的气体组成和比例会对应于不同类型的故障,如大量h2和一般量的ch4表示其对应的故障可能是局部放电(pd),而大量h2与c2h2则表示对应故障可能是低能量放电(led),如表1所示。因此对油谱数据进行监测和收集,通过对历史油谱数据进行分析建模,可以预测未来一段时间内油谱数据的变化情况,从而可以预测出换流站变压器的工作状态。


技术实现要素:



4.本发明的发明人发现,现有技术中油谱数据预测方法,在处理油谱信号时,是通过单变量时间序列即输入单种组分气体浓度数据进行对应的油中溶解气体浓度进行预测,没有考虑油中溶解气体组分之间是相互关联、相互影响、共同发展的特点,预测准确度低。鉴于上述问题,有必要提供一种油谱数据预测方法、装置及设备以解决或者部分地解决上述问题。本发明提供的技术方案如下:
5.第一方面,本发明实施例提供一种油谱数据预测方法,包括:
6.将获取的历史油谱数据输入预先得到的油谱数据预测模型中,得到油谱数据预测值;其中,所述油谱数据预测模型通过下述方式得到:
7.采用预设互信息算法从预先获取的油谱数据样本集中筛选与预设目标变量相关的至少一个输入变量;所述油谱数据样本集包括训练样本集和测试样本集,对应地,所述至少一个输入变量包括训练输入变量和测试输入变量;
8.根据预设嵌入延迟窗方法为所述至少一个输入变量赋予对应的嵌入维数和嵌入延时,并进行相重构得到对应的训练嵌入延迟向量和测试嵌入延迟向量;
9.使用预设kpca模型分别对所述训练嵌入延迟向量和所述测试嵌入延迟向量进行特征提取,得到对应的训练主元和测试主元;
10.基于所述训练主元和测试主元对预先构建的油谱数据训练模型进行训练,得到训练好的所述油谱数据预测模型。
11.在一个或一些实施例中,所述采用预设互信息算法从预先获取的油谱数据样本集中筛选与预设目标变量相关的至少一个输入变量,包括:
12.根据所述预先获取的油谱数据样本集和预设目标变量通过下述公式1得到所述
预先获取的油谱数据样本集中每一个变量的评价函数值:
[0013][0014]
其中,其中,为变量xi的噪声部分,为变量xi的有效信号部分,y为预设目标变量,|s|为已选特征子集s中的变量个数,xs为已选变量,为条件互信息,in(xi;xs)为标准化互信息,i为变量的序号;
[0015]
根据所述评价函数值从所述预先获取的油谱数据样本集中筛选得到与预设目标变量相关的至少一个输入变量。
[0016]
在一个或一些实施例中,所述使用预设kpca模型分别对所述训练嵌入延迟向量和所述测试嵌入延迟向量进行特征提取,得到对应的训练主元和测试主元,包括:
[0017]
将所述训练嵌入延迟向量和所述测试嵌入延迟向量进行标准化处理,得到标准化后的训练嵌入延迟向量和标准化后的测试嵌入延迟向量;
[0018]
根据预设核函数计算所述标准化后的训练嵌入延迟向量和标准化后的测试嵌入延迟向量对应的核矩阵;
[0019]
计算所述核矩阵的特征值,并根据所述特征值通过下述公式2得到对应训练主元和测试主元:
[0020][0021]
其中,tk为训练主元,vk为特征向量,为系数向量,φ是关于变量x的非线性映射,k为主元个数。
[0022]
在一个或一些实施例中,所述基于所述训练主元和测试主元对预先构建的油谱数据训练模型进行训练,得到训练好的油谱数据预测模型,包括:
[0023]
将所述训练主元输入预先构建的油谱数据训练模型进行训练,得到训练后的油谱数据模型;
[0024]
将所述测试主元输入所述训练后的油谱数据模型中得到预测值;
[0025]
确定所述预测值和预设目标值的比较结果,并根据所述比较结果调整所述训练后的油谱数据模型,并重复上述模型训练的过程,直至所述比较结果符合预设期望值,得到训练好的油谱数据预测模型。
[0026]
在一个或一些实施例中,所述确定所述预测值和预设目标值的比较结果,并根据所述比较结果调整所述训练后的油谱数据模型,并重复上述模型训练的过程,直至所述比较结果符合预设期望值,得到训练好的油谱数据预测模型,包括:
[0027]
将所述预测值和预设目标值代入下述公式3或下述公式4,得到对应的方均根误差或相对方均根误差:
[0028][0029]
[0030]
其中,e
rmse
为方均根误差,e
rrmse
为相对方均根误差,n
t
为预测样本数,f(xi)为预测值,yi为预设目标值;
[0031]
判断所述方均根误差或相对方均根误差是否符合预设期望值;
[0032]
若否,根据所述方均根误差或相对方均根误差调整所述训练后的油谱数据模型,并重复上述模型训练的过程;
[0033]
若是,获取训练好的油谱数据预测模型。
[0034]
第二方面,本发明实施例提供一种换流站变压器工作状态预测方法,包括:
[0035]
获取如上所述的油谱数据预测方法得到的油谱数据预测值;
[0036]
根据预先构建的油谱数据与换流站变压器工作状态的映射关系,确定所述油谱数据预测值对应的换流站变压器的预测工作状态。
[0037]
第三方面,本发明实施例提供一种油谱数据预测装置,包括:
[0038]
模型训练模块,用于采用预设互信息算法从预先获取的油谱数据样本集中筛选与预设目标变量相关的至少一个输入变量;所述油谱数据样本集包括训练样本集和测试样本集,对应地,所述至少一个输入变量包括训练输入变量和测试输入变量;根据预设嵌入延迟窗方法为所述至少一个输入变量赋予对应的嵌入维数和嵌入延时,并进行相重构得到对应的训练嵌入延迟向量和测试嵌入延迟向量;使用预设kpca模型分别对所述训练嵌入延迟向量和所述测试嵌入延迟向量进行特征提取,得到对应的训练主元和测试主元;基于所述训练主元和测试主元对预先构建的油谱数据训练模型进行训练,得到训练好的油谱数据预测模块;
[0039]
预测模块,用于将获取的历史油谱数据输入所述油谱数据预测模型中,得到油谱数据预测值。
[0040]
第四方面,本发明实施例提供一种换流站变压器工作状态预测装置,包括:
[0041]
模型训练模块,用于采用预设互信息算法从预先获取的油谱数据样本集中筛选与预设目标变量相关的至少一个输入变量;所述油谱数据样本集包括训练样本集和测试样本集,对应地,所述至少一个输入变量包括训练输入变量和测试输入变量;根据预设嵌入延迟窗方法为所述至少一个输入变量赋予对应的嵌入维数和嵌入延时,并进行相重构得到对应的训练嵌入延迟向量和测试嵌入延迟向量;使用预设kpca模型分别对所述训练嵌入延迟向量和所述测试嵌入延迟向量进行特征提取,得到对应的训练主元和测试主元;基于所述训练主元和测试主元对预先构建的油谱数据训练模型进行训练,得到训练好的油谱数据预测模块;
[0042]
预测模块,用于将获取的历史油谱数据输入所述油谱数据预测模型中,得到油谱数据预测值;
[0043]
工作状态确定模块,用于根据预先构建的油谱数据与换流站变压器工作状态的映射关系,确定所述油谱数据预测值对应的换流站变压器的预测工作状态。
[0044]
第五方面,本发明实施例提供一种计算机可读存储介质,其上存储有计算机指令,该指令被处理器执行时实现如第一方面所述的油谱数据预测方法或如第二方面所述的换流站变压器工作状态预测方法。
[0045]
第六方面,本发明实施例提供一种电子设备,包括:处理器、用于存储处理器可执行命令的存储器;其中,处理器被配置为可执行如第一方面所述的油谱数据预测方法或
如第二方面所述的换流站变压器工作状态预测方法。
[0046]
本发明实施例提供的上述技术方案的有益效果至少包括:
[0047]
本发明提供的油谱数据预测方法,采用预设互信息算法从预先获取的油谱数据样本集中选择得到与预设目标变量相关的至少一个输入变量,可以选择油谱数据样本集中最优特征的子集,从而降低输入变量的数量,并提高预测模型的精度,而且,通过输入多元时间序列即多种组分气体的浓度来预测某一种或某几种气体的浓度,而不仅仅只是通过油中单一溶解气体的浓度来构建预测模型,可获得更丰富更全面的特征气体发展变化的信息,能够考虑到油中溶解气体组分之间相互关联、影响和共同发展的特点,提高了输入变量选择的有效性;通过预设嵌入延迟窗方法为至少一个输入变量赋予对应的嵌入维数和嵌入延时并进行相重构,充分利用了系统的丰富信息,提高了预测的准确率;利用预设kpca模型对重构相空间进行特征提取,达到降维、除噪、消除变量间相关性的效果。
[0048]
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
[0049]
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
[0050]
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
[0051]
图1为现有技术的流程示意图;
[0052]
图2为本发明实施例提供的油谱数据预测方法的流程示意图;
[0053]
图3为本发明实施例提供的油谱数据预测装置的结构示意图;
[0054]
图4为本发明实施例提供的换流站变压器工作状态预测方法的流程示意图;
[0055]
图5为本发明实施例提供的换流站变压器工作状态预测装置的结构示意图;
[0056]
图6为本发明实施例提供的油谱数据预测模型构建方法的流程示意图;
[0057]
图7为本发明实施例提供的油谱数据预测模型构建装置的结构示意图;
[0058]
图8为本发明实施例提供的电子设备的结构示意图。
具体实施方式
[0059]
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
[0060]
实施例一
[0061]
本发明实施例中涉及到的相关术语解释如下:
[0062]
维数约简:包括变量选择(特征选择)和特征提取两方面,即对模型的特征进行抽象和提取。
[0063]
dga:油中溶解气体分析(dissovled gas analysis),是监测油浸式电力变压器早起潜伏性故障的重要方法。由于换流站变压器在运行过程中,各种组件在发生故障时会导
致变压器油发生化学反应分解,从而产生如co2、ch4、h2以及c2h2等各种气体,将油中溶解的气体分离出来就产生了油谱数据。通过分析这些气体的组成成分以及相互比例,可以推测出变压器发生的具体故障。
[0064]
互信息:互信息源于信息论中熵的概念,用来测量两随机变量间的统计相关量。它可以看成是一个随机变量中包含的关于另一个随机变量的信息量,或者说是一个随机变量由于已知另一个随机变量而减少的不肯定性。
[0065]
kpca:核主元分析(kernel principal component analysis),是一种非线性数据投影降维方法,其通过核技巧将原始数据空间映射到高维度特征空间中进行主元分析,可以在实现降低数据维数的同时,有效提取数据的非线性特征,从而能够降低数据噪声,消除变量之间的相关性。
[0066]
renyi熵:是信息论中的一个概念,它是hartley熵、香农熵、碰撞熵和最小熵的推广。其中,α阶renyi熵被定义为:
[0067][0068]
elm:极限学习机(extreme learning machine),是一种单隐层神经网络,有效地克服了传统神经网络基于梯度学习算法的缺陷,具有良好的泛化能力和极快的学习速度,并已成功应用于模式识别、复杂系统建模等领域。
[0069]
kelm:核极限学习机(kernel extreme learning machine)是将核函数引入elm的一种方法,用以解决elm中隐层初始参数的随机选取所造成的学习性能的不稳定性,可以使得模型的预测回归的能力更强。
[0070]
现有技术中变压器工作运行状态预测方法,是运用最小二乘支持向量机(least squares support vector machine,ls.svm)对变压器中多维度数据序列进行建模预测,从而能够预测变压器工作运行状态,其流程如图1所示,具体包括以下步骤:
[0071]
步骤1:获取不同运行年限变压器对应的多维度数据信号,包括油温信号、油位信号、微水含量信号、局部放电信号、油谱信号等;令数据集xi={t运行年限},yi={t运行年限对应的变压器多维度数据},其中t=1,2,...,n,建立训练样本集;取训练样本集前面n个数据作为训练样本,其余作为测试样本;对训练样本和测试样本进行相空间重构,将运行年限序列转化为矩阵形式,用于最小二乘支持向量机ls.svm学习;
[0072]
步骤2:对模型进行rbf核函数训练及mse参数寻优;
[0073]
所述rbf核函数训练,是对rbf核函数进行交叉验证方法寻优,其中rbf核为:
[0074]
k(xi,xj)=exp(-||x
i-xj||2/2σ2);
[0075]
其中,xj为模型优化的宽度参数;
[0076]
步骤3:对训练样本按照下式的回归函数y
t
进行训练,并进行预测结果误差判定:
[0077][0078]
其中,αk为拉格朗日乘子,k为满足梅西条件的核函数,b为偏置;
[0079]
将要预测时刻的多维度数据输入到训练好的最小二乘支持向量机模型进行预测,得到预测结果;为了检验模型的有效性,使用预测误差来评价预测结果,预测误差ε的计算公式为:
[0080][0081]
式中,xi为某个运行年限序列对应变压器多维数据的实际值;为预测数据的计算值;预测误差大,表明预测方法精度较低,继续进行上述预测过程,直至预测精度满足预先设定阈值;如果预测误差大于给定误差范围,则返回步骤2,直至预测结果小于模型给定的误差范围;将预测得到的结果作为最小二乘支持向量机预测模型新的输入,可以预测得到目标运行年限的对应值,从而实现多步预测;采用训练好的预测模型分别开展下一目标运行年限序列的多维数据预测,得到变压器多维数据的预测结果,即最终得到第n+l步预测值:
[0082][0083]
式中,
[0084]
步骤4:计算预测得到多维数据的欧式距离以及数据信息熵权重;
[0085]
步骤4.1:针对预测得到的多维数据,逐一计算多维数据量化值;其量化方法如式所示:
[0086][0087]
式中,p为指标归一化后的值,x为指标实测值,a1和a2表示该指标的最小值和最大值;
[0088]
步骤4.2:计算多维数据预测结果的量化值,与变压器出厂时标准多维数据量化值的欧氏距离,计算公式为:
[0089][0090][0091][0092]
式中,k
t
为多维数据预测结果的量化值,ki为多维数据量化后的出厂标准值,d为多维数据欧氏距离;
[0093]
步骤4.3:根据计算的多维数据欧氏距离作为多维数据状态值,评价出多维数据状态,计算各多维数据的信息熵,即:
[0094]hj
=-p ln p;
[0095]
式中,i=1,2,

,n;j=1,2,

,m;
[0096]
计算各多维数据的熵权w,即:
[0097][0098]
步骤5:根据多维数据的预测结果,进行变压器部件状态预测、以及变压器整体运行状态预测。
[0099]
上述的基于ls.svm的变压器运行状态预测方法,在处理油谱信号时,是将油中溶解气体浓度预测作为单变量时间序列的预测问题,没有考虑油中溶解气体组分之间是相互关联、相互影响、共同发展的特点。另外,在实际应用中,支持向量机的性能依赖于学习机的参数及核参数的确定。传统的svm参数选取都是通过反复的试验,人工选取出令人满意的解。所以,很难到一种普适且合理的方法优化svm参数。基于此,本发明实施例首先提供一种基于二次维数约简的油谱数据预测方法,如图2所示,包括:
[0100]
s101、采用预设互信息算法从预先获取的油谱数据样本集中筛选与预设目标变量相关的至少一个输入变量;所述油谱数据样本集包括训练样本集和测试样本集,对应地,所述至少一个输入变量包括训练输入变量和测试输入变量;
[0101]
上述步骤s101中,通过筛选与预设目标变量相关的至少一个输入变量,后续可以通过与预设目标变量相关的至少一个输入变量,进行对预设目标变量的预测过程,即对油中溶解气体浓度采用多元时间序列预测方法,即通过输入多种组分气体的浓度来预测某一种或某几种气体的浓度,而不仅仅只是通过油中单一溶解气体的浓度来构建预测模型。通过这一手段,可获得更丰富更全面的特征气体发展变化的信息,与此同时,能够考虑到油中溶解气体组分之间相互关联、影响和共同发展的特点。
[0102]
通过一个具体的实施例对本发明上述步骤s101进行说明,例如现有已采集到的油谱数据样本集包含h2、co2、co、c2h4等四种特征气体。确定预测目标变量为h2气体,采用预设互信息算法从h2、co2、co、c2h4这四种特征气体进行选择,确定与h2气体相关的输入变量是h2、co2、c2h4。而现有技术是对h2、co2、co、c2h4这四种气体不加选择,将它们的浓度、含量等信息全部输入算法模型中进行模型训练。本方案通过采用互信息变量选择算法,对输入对h2、co2、co、c2h4这四种气体的标准化互信息的评价函数进行计算,从而选择评价函数较高的气体为特征气体,可获得更丰富更全面的特征气体发展变化的信息,与此同时,能够考虑到油中溶解气体组分之间相互关联、影响和共同发展的特点。
[0103]
上述步骤s101中,将得到的至少一个输入变量的数据集中的部分数据作为训练集,另一部分作为测试集,为便于区分,将训练集中包含的输入变量定义为训练输入变量,将测试集中包含的输入变量定义为测试输入变量。
[0104]
s102、根据预设嵌入延迟窗方法为所述至少一个输入变量赋予对应的嵌入维数和嵌入延时,并进行相重构得到对应的训练嵌入延迟向量和测试嵌入延迟向量;
[0105]
上述步骤s102中,通过预设嵌入延迟窗方法为各输入变量选择嵌入维数和嵌入延时,并对赋予嵌入维数和嵌入延时后的至少一个输入变量进行相重构得到多元变量嵌入延迟向量。
[0106]
s103、使用预设kpca模型分别对所述训练嵌入延迟向量和所述测试嵌入延迟向量进行特征提取,得到对应的训练主元和测试主元;
[0107]
s104、基于所述训练主元和测试主元对预先构建的油谱数据训练模型进行训练,得到训练好的油谱数据预测模型。
[0108]
s105、将获取的历史油谱数据输入所述油谱数据预测模型中,得到油谱数据预测值。
[0109]
本发明提供的油谱数据预测方法,在构建油谱数据预测模型时,采用预设互信息算法从预先获取的油谱数据样本集中选择得到与预设目标变量相关的至少一个输
入变量,得到多元变量时间序列,可以选择原始输入变量中即油谱数据样本集中最优特征的子集,从而降低输入变量的数量,并提高预测模型的精度;而且,通过输入多元时间序列即多种组分气体的浓度来预测某一种或某几种气体的浓度,而不仅仅只是通过油中单一溶解气体的浓度来作预测模型,可获得更丰富更全面的特征气体发展变化的信息,能够考虑到油中溶解气体组分之间相互关联、影响和共同发展的特点,提高了输入变量选择的有效性;通过预设嵌入延迟窗方法为至少一个输入变量赋予对应的嵌入维数和嵌入延时并进行相重构,充分利用了系统的丰富信息,提高了预测的准确率;并且利用预设kpca模型对重构相空间进行特征提取,达到降维、除噪、消除变量间相关性的效果。
[0110]
在一个实施例中,上述步骤s101所述的采用预设互信息算法从预先获取的油谱数据样本集中筛选与预设目标变量相关的至少一个输入变量,包括:
[0111]
s1011、根据所述预先获取的油谱数据样本集和预设目标变量通过下述公式1得到所述预先获取的油谱数据样本集中每一个变量的评价函数值:
[0112][0113]
其中,其中,为变量xi的噪声部分,为变量xi的有效信号部分,y为预设目标变量,|s|为已选特征子集s中的变量个数,xs为已选变量,为条件互信息,in(xi;xs)为标准化互信息,i为变量的序号;
[0114]
所述条件互信息通过下述公式5得到:
[0115][0116]
其中,为与y的互信息,为与的互信息,为y与的互信息,为的熵。
[0117]
所述标准化互信息通过下述公式6得到:
[0118][0119]
其中,i(xi;xs)为xi与xs的互信息,h(xi)为xi的熵,h(xs)为xs的熵。
[0120]
所述变量xi的噪声部分和有效部分的划分方法,可以参照现有技术中的描述,此处不作具体限定。如,可以是,应用基于频域的方法,将时间序列信号转为频域信号进行考察,噪声部分的频率区间和有效信号的频率区间是不同的,在频域内设置滤波器,如设置低通滤波器,可以滤除较高频的噪声信号,从而将有效信号与噪声信号相分离。
[0121]
s1012、根据所述评价函数值从所述预先获取的油谱数据样本集中筛选得到与预设目标变量相关的至少一个输入变量。
[0122]
本发明采用的改进的标准化互信息算法进行输人变量选择,提高了输入变量选择的有效性,其变量选择结果与油劣化分解的热力学理论相吻合。
[0123]
在一个实施例中,上述步骤s102所述的根据预设嵌入延迟窗方法为所述至少一个输入变量赋予对应的嵌入维数和嵌入延时,并进行相重构得到对应的训练嵌入延迟向量和测试嵌入延迟向量,包括:
[0124]
设输入向量x(h)=[x1(h),x2(h),

,xn(h)]
t
,h=1,2,...,n,h为多元变量时间序列,xi(h)为第i个变量在h时刻的值。对每一个变量,选择合理的嵌入维数mi和嵌入延时τi,i=1,2,...,n,得到多元变量嵌入延迟向量为:
[0125][0126]
由此,得到训练嵌入延迟向量集x∈rn×m,y∈rn×1和测试嵌入延迟向量集其中,m=∑mi。
[0127]
其中,所述嵌入维数mi和嵌入延时τi选择过程,可以参照现有技术中描述,此处不作具体限定,如,可以是参照席剑辉,韩敏.主成分分析与神经网络的结合在多变量序列预测中的应用[j].自动化学报,1007,24(5):719-724.中方法进行选择。
[0128]
经过上述步骤s102相空间重构得到的多元变量嵌入延迟向量,虽然包含更多更丰富的系统动态信息,但同时相重构也使得输入变量的维数增大,冗余或不相关的变量也加入到模型中,掩盖了重要变量的作用,影响学习算法性能。为此,在上述步骤s103中本发明引入kpca模型对多元变量嵌入延迟向量进行特征提取,在实现降维的同时,还能够滤除部分数据噪声,消除变量间的相关性,以期提高机器学习效率。本发明利用kelm强大的非线性映射能力,以kpca提取的主元作为kelm的输入,建立油谱数据预测模型。
[0129]
具体是:在kpca建模过程中引入非线性映射φ,将输入空间xn×m(n为样本数,m为变量数)映射到高维特征空间,然后在特征空间中进行主元分析,求取主元。此处,以训练主元的求取过程为例进行说明,实现过程描述如下:
[0130]
输入:训练嵌入延迟向量集xn×m和预设核参数集,设r∈{2-4
,2-3
,...,10,...,2
18
}。
[0131]
输出:kpca核参数r、主元数k。
[0132]
在一个实施例中,上述步骤s103所述的使用预设kpca模型分别对所述训练嵌入延迟向量和所述测试嵌入延迟向量进行特征提取,得到对应的训练主元和测试主元,包括:
[0133]
将所述训练嵌入延迟向量和所述测试嵌入延迟向量进行标准化处理,得到标准化后的训练嵌入延迟向量和标准化后的测试嵌入延迟向量;
[0134]
根据预设核函数计算所述标准化后的训练嵌入延迟向量和标准化后的测试嵌入延迟向量对应的核矩阵;所述预设核函数可以根据实际需要进行选择,如,可以为径向基核函数;
[0135]
计算所述核矩阵的特征值,并根据所述特征值通过下述公式2得到对应训练主元和测试主元:
[0136][0137]
其中,tk为训练主元,vk为特征向量,为系数向量,φ是关于变量x的非线性映射,k为主元个数。
[0138]
上述不等式组1通过计算映射数据在特征向量vk上的投影,从而计算训练主元tk。具体地,νk是特征方程k=νdν
t
中的特征向量,可以表示为:
[0139][0140]
其中,ai为系数向量,φ为关于输入变量x的非线性映射。
[0141]
作为一个具体的实施例,上述步骤s103具体包括:
[0142]
s1031、按下式对训练嵌入延迟向量集xn×m进行标准化:
[0143][0144]
式中,σi和μi分别为第i个变量的标准差和均值。
[0145]
s1032、从预设核参数集中选择第一个元素作为核参数r。
[0146]
s1033、根据预设核函数计算得到核矩阵k,本发明实施例中选择径向基核函数作为预设核函数,计算公式如下:
[0147][0148]
其中,r为核参数,||||为求范数运算。
[0149]
s1034、根据下式求解所述核矩阵k的特征值:
[0150]
k=vdv
t

[0151]
式中,k为核矩阵,d=diag(λ1,λ2,...,λn)为特征值构成的对角矩阵;ν=[ν1,ν2,...,νn],νi是特征值λi所对应的特征向量。
[0152]
上述步骤s1033和s1034中,根据核矩阵k计算得到的每个特征值所对应的特征向量是相互正交的,将提取出来的特征向量作为变量,则变量之间相互正交,消除了变量之间的相关性。
[0153]
s1035、按下式计算特征值对应的renyi熵,并将其降幂排列,e(λ1,ν1)》e(λ2,ν2)》...》e(λn,νn):
[0154][0155]
式中,为特征值对应的的renyi熵,λi为特征值,为特征值对应的特征向量,l为全1列向量。
[0156]
s1036、按下式计算得到n-1个信息衰减率idr(λi,νi),如果idr(λi,νi)小于预设信息衰减率阈值,则主元数k=i且k《m;如果不满足,则k=m-1:
[0157][0158]
其中,i=1,...,n,e(λi,νi)为特征空间中第i个特征值和特征向量所携带的信息量的大小,所述预设信息衰减率阈值可以根据实际需要进行设置,如可以是15%。
[0159]
s1037、按下式计算累计信息率air:
[0160][0161]
式中,air表征不同kpca模型参数携带的信息量,e(λi,νi)表征特征空间中第i个特征值和特征向量所携带的信息量的大小。
[0162]
s1038、判断预设核参数集是否检阅完成:若是,则转至步骤s1039;否则选择参数集下一素作为核参数r,转至步骤s1033。
[0163]
s1039、选择最大air所对应的核参数和主元数作为最终输出。
[0164]
上述步骤s1039中,最大air所对应的主元数是经过预设kpca模型进行特征提取后的主元数,比原始输入主元数小,通过选择最大air所对应的核参数和主元数作为最终输出,实现降维。
[0165]
本发明实施例中,通过计算不同kpca模型参数对应的信息量,从而可以筛选出最大累积信息率air所对应的kpca模型参数,这种模型参数对应的kpca模型提取出来的特征主元具有最大的有效信息率,能够滤除部分数据噪声。
[0166]
本发明实施例中所述测试主元的计算方法与所述训练主元的计算方法一致,此处不再赘述。
[0167]
本发明实施例通过核主元分析的方法,将原始数据空间映射到高维特征空间中进行主元分析,可以降低数据维数,从而降低参数的数量;而且,在构建预测模型的过程中,对于kpca模型参数的选取上,采用将kpca与信息熵结合的方式,在高维空间中采用renyi熵信息测度来确定模型的参数,从而避免了模型参数选择的盲目性,从而提高了预测模型的计算效率。
[0168]
在一个实施例中,上述步骤s104所述的基于所述训练主元和测试主元对预先构建的油谱数据训练模型进行训练,得到训练好的油谱数据预测模型,包括:
[0169]
s1041、将所述训练主元输入预先构建的油谱数据训练模型进行训练,得到训练后的油谱数据模型;
[0170]
其中,所述预先构建的油谱数据训练模型是通过下述方式得到的:
[0171]
极限学习机elm是一种单隐层前馈神经网络,有效地克服了基于梯度学习算法的神经网络缺陷,具有良好的泛化能力核极快的学习速度。然而,隐含层参数的随机选取造成elm学习性能具有不稳定性,将核函数引入elm,能够有效提高elm求解的稳定性和解决回归问题的能力。
[0172]
基本elm算法的神经网络函数为:
[0173]
f(x)=h(x)β;
[0174]
式中,h(x)为神经网络中神经元对应的激活函数;β为输出层权重向量。h(x)计算公式如下:
[0175]
h(x)=g(wx+b);
[0176]
其中,g(x)为激活函数,w是激活权重,b是偏置量,g(x)作用是增加了神经网络模型的非线性。
[0177]
elm算法通过输出误差最小化保证预测精度,输出权重β最小化保证网络的泛化能力,采用最小二乘法求解输出权重β,并根据回归理论,增加正常数1/c,求解结果更稳定,泛化能力更强。输出权重β计算公式为:
[0178][0179]
式中,h为隐含层矩阵,h
*
为h的广义逆矩阵,o为预测目标值向量。
[0180]
本发明实施例将核函数引入elm,elm算法中的公式可用核矩阵形式表示,即:
[0181]
ω
elm
=hh
t

elm(i,j)
=h(xi)h(xj)=k(xi,xj);
[0182]
因此,kelm输出函数表示为:
[0183][0184]
可以看出,引入核函数后,kelm算法不再需要设置隐含层参数,但核函数参数r和广义逆矩阵的参数c仍影响回归预测性能,本发明采用交叉验证法选择kelm中参数c,r∈{2-4
,2-3
,...,10,...,2
18
}。
[0185]
s1042、将所述测试主元输入所述训练后的油谱数据模型中得到预测值;
[0186]
上述步骤s1042中,以测试主元作为所述训练后的油谱数据模型的输入,根据所述kelm输出函数求得预测值。
[0187]
s1043、确定所述预测值和预设目标值的比较结果,并根据所述比较结果调整所述训练后的油谱数据模型,并重复上述模型训练的过程,直至所述比较结果符合预设期望值,得到训练好的油谱数据预测模型。
[0188]
在一个实施例中,上述步骤s1043所述的确定所述预测值和预设目标值的比较结果,并根据所述比较结果调整所述训练后的油谱数据模型,并重复上述模型训练的过程,直至所述比较结果符合预设期望值,得到训练好的油谱数据预测模型,包括:
[0189]
s10431、将所述预测值和预设目标值代入下述公式3或下述公式4,得到对应的方均根误差或相对方均根误差:
[0190][0191][0192]
其中,e
rmse
为方均根误差,e
rrmse
为相对方均根误差,n
t
为预测样本数,f(xi)为预测值,yi为预设目标值;
[0193]
本发明实施例通过方均根误差e
rmse
和相对方均根误差e
rrmse
对所述训练后的油谱数据模型进行预测性能评价。
[0194]
s10432、判断所述方均根误差或相对方均根误差是否符合预设期望值;若否,执行步骤s10433;若是,执行步骤s10434;
[0195]
s10433、根据所述方均根误差或相对方均根误差调整所述训练后的油谱数据模型,并重复上述模型训练的过程;
[0196]
s10434、获取训练好的油谱数据预测模型。
[0197]
基于同一发明构思,本发明实施例还提供一种油谱数据预测装置,如图3所示,包括:
[0198]
模型训练模块201,用于采用预设互信息算法从预先获取的油谱数据样本集中筛选与预设目标变量相关的至少一个输入变量;所述油谱数据样本集包括训练样本集和测试样本集,对应地,所述至少一个输入变量包括训练输入变量和测试输入变量;根据预设嵌入延迟窗方法为所述至少一个输入变量赋予对应的嵌入维数和嵌入延时,并进行相重构得到对应的训练嵌入延迟向量和测试嵌入延迟向量;使用预设kpca模型分别对所述训练嵌入延迟向量和所述测试嵌入延迟向量进行特征提取,得到对应的训练主元和测试主元;基于所述训练主元和测试主元对预先构建的油谱数据训练模型进行训练,得到训练好的油谱数据预测模块;
[0199]
预测模块202,用于将获取的历史油谱数据输入所述油谱数据预测模型中,得到油谱数据预测值。
[0200]
本发明实施例中油谱数据预测装置的具体实现方式,可以参照油谱数据预测方法中的具体描述,此处不再赘述。
[0201]
实施例二
[0202]
在换流变压器内部充满了绝缘油,可以对运行中的变压器进行散热作用,避免变压器组件因过热而损坏。但是当变压器组件发生故障而产生过热现象或局部放电现象时,与变压器组件相接触的油就可能会因为这些热故障或电故障而导致化学键断裂,伴随产生各种化学反应,从而产生co2、ch4、h2以及c2h2等各种气体。将油中溶解的气体分离出来就产生了油谱数据。
[0203]
在油谱中,不同成分的气体组成和比例会对应于不同类型的故障,如大量h2和一般量的ch4表示其对应的故障可能是局部放电(partial discharge,pd),而大量h2与c2h2则表示对应故障可能是低能量放电(low energy discharge,led),如表1所示。因此,对油谱数据进行监测和收集,通过对历史油谱数据进行分析建模,可以预测未来一段时间内油谱数据的变化情况,从而可以预测出换流站变压器的工作状态。作为一个具体的实施例,不同成分的气体与不同类型故障的对应关系如表1所示:
[0204][0205]
·
:high importance,

:medium importance
[0206]
表1
[0207]
基于此,本发明实施例提供一种换流站变压器工作状态预测方法,如图4所示,包括:
[0208]
s301、获取如上实施例一所述的油谱数据预测方法得到的油谱数据预测值;
[0209]
上述步骤s301中,将采集到的换流站变压器的短期数据集输入所述油谱数据预测模型中,得到油谱数据预测值。
[0210]
s302、根据预先构建的油谱数据与换流站变压器工作状态的映射关系(例如表1所示),确定所述油谱数据预测值对应的换流站变压器的预测工作状态。
[0211]
基于同一发明构思,本发明实施例提供一种换流站变压器工作状态预测装置,如图5所示,包括:
[0212]
模型训练模块401,用于采用预设互信息算法从预先获取的油谱数据样本集中筛选与预设目标变量相关的至少一个输入变量;所述油谱数据样本集包括训练样本集和测试样本集,对应地,所述至少一个输入变量包括训练输入变量和测试输入变量;根据预设嵌入延迟窗方法为所述至少一个输入变量赋予对应的嵌入维数和嵌入延时,并进行相重构得到对应的训练嵌入延迟向量和测试嵌入延迟向量;使用预设kpca模型分别对所述训练嵌入延迟向量和所述测试嵌入延迟向量进行特征提取,得到对应的训练主元和测试主元;基于所述训练主元和测试主元对预先构建的油谱数据训练模型进行训练,得到训练好的油谱数据预测模块;
[0213]
预测模块402,用于将获取的历史油谱数据输入所述油谱数据预测模型中,得到油谱数据预测值;
[0214]
工作状态确定模块403,用于根据预先构建的油谱数据与换流站变压器工作状态的映射关系,确定所述油谱数据预测值对应的换流站变压器的预测工作状态。
[0215]
实施例三
[0216]
本发明实施例提供一种油谱数据预测模型构建方法,如图6包括:
[0217]
s501、采用预设互信息算法从预先获取的油谱数据样本集中筛选与预设目标变量相关的至少一个输入变量;所述油谱数据样本集包括训练样本集和测试样本集,对应地,所述至少一个输入变量包括训练输入变量和测试输入变量;
[0218]
s501、根据预设嵌入延迟窗方法为所述至少一个输入变量赋予对应的嵌入维数和嵌入延时,并进行相重构得到对应的训练嵌入延迟向量和测试嵌入延迟向量;
[0219]
s501、使用预设kpca模型分别对所述训练嵌入延迟向量和所述测试嵌入延迟向量进行特征提取,得到对应的训练主元和测试主元;
[0220]
s501、基于所述训练主元和测试主元对预先构建的油谱数据训练模型进行训练,得到训练好的所述油谱数据预测模型。
[0221]
本发明实施例中油谱数据预测模型构建方法的具体实现方式,可以参照油谱数据预测方法中的具体描述,此处不再赘述。
[0222]
基于同一发明构思,本发明实施例提供一种油谱数据预测模型构建装置,如图7所示,包括:
[0223]
筛选模块601,用于采用预设互信息算法从预先获取的油谱数据样本集中筛选与预设目标变量相关的至少一个输入变量;所述油谱数据样本集包括训练样本集和测试样本集,对应地,所述至少一个输入变量包括训练输入变量和测试输入变量;
[0224]
相重构模块602,用于根据预设嵌入延迟窗方法为所述至少一个输入变量赋予对应的嵌入维数和嵌入延时,并进行相重构得到对应的训练嵌入延迟向量和测试嵌入延迟向量;
[0225]
特征提取模块603,用于使用预设kpca模型分别对所述训练嵌入延迟向量和所述测试嵌入延迟向量进行特征提取,得到对应的训练主元和测试主元;
[0226]
模型训练模块604,用于基于所述训练主元和测试主元对预先构建的油谱数据训练模型进行训练,得到训练好的油谱数据预测模型。
[0227]
基于同一发明构思,本发明实施例提供一种计算机可读存储介质,其上存储有计算机指令,该指令被处理器执行时实现如上所述的油谱数据预测方法、所述的换流站变压器工作状态预测方法或所述的油谱数据预测模型构建方法。
[0228]
基于同一发明构思,本发明实施例提供一种电子设备700,如图8所示,包括:处理器701、用于存储处理器701可执行命令的存储器702;其中,处理器701被配置为可执行如上所述的油谱数据预测方法、所述的换流站变压器工作状态预测方法或所述的油谱数据预测模型构建方法。
[0229]
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
[0230]
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0231]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0232]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0233]
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

技术特征:


1.一种油谱数据预测方法,其特征在于,包括:将获取的历史油谱数据输入预先得到的油谱数据预测模型中,得到油谱数据预测值;其中,所述油谱数据预测模型通过下述方式得到:采用预设互信息算法从预先获取的油谱数据样本集中筛选与预设目标变量相关的至少一个输入变量;所述油谱数据样本集包括训练样本集和测试样本集,对应地,所述至少一个输入变量包括训练输入变量和测试输入变量;根据预设嵌入延迟窗方法为所述至少一个输入变量赋予对应的嵌入维数和嵌入延时,并进行相重构得到对应的训练嵌入延迟向量和测试嵌入延迟向量;使用预设kpca模型分别对所述训练嵌入延迟向量和所述测试嵌入延迟向量进行特征提取,得到对应的训练主元和测试主元;基于所述训练主元和测试主元对预先构建的油谱数据训练模型进行训练,得到训练好的所述油谱数据预测模型。2.根据权利要求1所述的油谱数据预测方法,其特征在于,所述采用预设互信息算法从预先获取的油谱数据样本集中筛选与预设目标变量相关的至少一个输入变量,包括:根据所述预先获取的油谱数据样本集和预设目标变量通过下述公式1得到所述预先获取的油谱数据样本集中每一个变量的评价函数值:其中,其中,为变量x
i
的噪声部分,为变量x
i
的有效信号部分,y为预设目标变量,|s|为已选特征子集s中的变量个数,x
s
为已选变量,为条件互信息,i
n
(x
i
;x
s
)为标准化互信息,i为变量的序号;根据所述评价函数值从所述预先获取的油谱数据样本集中筛选得到与预设目标变量相关的至少一个输入变量。3.根据权利要求1所述的油谱数据预测方法,其特征在于,所述使用预设kpca模型分别对所述训练嵌入延迟向量和所述测试嵌入延迟向量进行特征提取,得到对应的训练主元和测试主元,包括:将所述训练嵌入延迟向量和所述测试嵌入延迟向量进行标准化处理,得到标准化后的训练嵌入延迟向量和标准化后的测试嵌入延迟向量;根据预设核函数计算所述标准化后的训练嵌入延迟向量和标准化后的测试嵌入延迟向量对应的核矩阵;计算所述核矩阵的特征值,并根据所述特征值通过下述公式2得到对应训练主元和测试主元:其中,t
k
为训练主元,v
k
为特征向量,为系数向量,φ是关于变量x的非线性映射,k为主元个数。4.根据权利要求1所述的油谱数据预测方法,其特征在于,所述基于所述训练主元和
测试主元对预先构建的油谱数据训练模型进行训练,得到训练好的油谱数据预测模型,包括:将所述训练主元输入预先构建的油谱数据训练模型进行训练,得到训练后的油谱数据模型;将所述测试主元输入所述训练后的油谱数据模型中得到预测值;确定所述预测值和预设目标值的比较结果,并根据所述比较结果调整所述训练后的油谱数据模型,并重复上述模型训练的过程,直至所述比较结果符合预设期望值,得到训练好的油谱数据预测模型。5.根据权利要求4所述的油谱数据预测方法,其特征在于,所述确定所述预测值和预设目标值的比较结果,并根据所述比较结果调整所述训练后的油谱数据模型,并重复上述模型训练的过程,直至所述比较结果符合预设期望值,得到训练好的油谱数据预测模型,包括:将所述预测值和预设目标值代入下述公式3或下述公式4,得到对应的方均根误差或相对方均根误差:对方均根误差:其中,e
rmse
为方均根误差,e
rrmse
为相对方均根误差,n
t
为预测样本数,f(x
i
)为预测值,y
i
为预设目标值;判断所述方均根误差或相对方均根误差是否符合预设期望值;若否,根据所述方均根误差或相对方均根误差调整所述训练后的油谱数据模型,并重复上述模型训练的过程;若是,获取训练好的油谱数据预测模型。6.一种换流站变压器工作状态预测方法,其特征在于,包括:获取根据权利要求1-5任一项所述的油谱数据预测方法得到的油谱数据预测值;根据预先构建的油谱数据与换流站变压器工作状态的映射关系,确定所述油谱数据预测值对应的换流站变压器的预测工作状态。7.一种油谱数据预测装置,其特征在于,包括:模型训练模块,用于采用预设互信息算法从预先获取的油谱数据样本集中筛选与预设目标变量相关的至少一个输入变量;所述油谱数据样本集包括训练样本集和测试样本集,对应地,所述至少一个输入变量包括训练输入变量和测试输入变量;根据预设嵌入延迟窗方法为所述至少一个输入变量赋予对应的嵌入维数和嵌入延时,并进行相重构得到对应的训练嵌入延迟向量和测试嵌入延迟向量;使用预设kpca模型分别对所述训练嵌入延迟向量和所述测试嵌入延迟向量进行特征提取,得到对应的训练主元和测试主元;基于所述训练主元和测试主元对预先构建的油谱数据训练模型进行训练,得到训练好的油谱数据预测模块;预测模块,用于将获取的历史油谱数据输入所述油谱数据预测模型中,得到油
谱数据预测值。8.一种换流站变压器工作状态预测装置,其特征在于,包括:模型训练模块,用于采用预设互信息算法从预先获取的油谱数据样本集中筛选与预设目标变量相关的至少一个输入变量;所述油谱数据样本集包括训练样本集和测试样本集,对应地,所述至少一个输入变量包括训练输入变量和测试输入变量;根据预设嵌入延迟窗方法为所述至少一个输入变量赋予对应的嵌入维数和嵌入延时,并进行相重构得到对应的训练嵌入延迟向量和测试嵌入延迟向量;使用预设kpca模型分别对所述训练嵌入延迟向量和所述测试嵌入延迟向量进行特征提取,得到对应的训练主元和测试主元;基于所述训练主元和测试主元对预先构建的油谱数据训练模型进行训练,得到训练好的油谱数据预测模块;预测模块,用于将获取的历史油谱数据输入所述油谱数据预测模型中,得到油谱数据预测值;工作状态确定模块,用于根据预先构建的油谱数据与换流站变压器工作状态的映射关系,确定所述油谱数据预测值对应的换流站变压器的预测工作状态。9.一种计算机可读存储介质,其上存储有计算机指令,其特征在于,该指令被处理器执行时实现如权利要求1-5任一项所述的油谱数据预测方法或如权利要求6所述的换流站变压器工作状态预测方法。10.一种电子设备,其特征在于,包括:处理器、用于存储处理器可执行命令的存储器;其中,处理器被配置为可执行如权利要求1-5任一项所述的油谱数据预测方法或如权利要求6所述的换流站变压器工作状态预测方法。

技术总结


本发明公开一种油谱数据预测方法、装置及设备,该方法包括:将获取的历史油谱数据输入预先得到的油谱数据预测模型中,得到油谱数据预测值;油谱数据预测模型通过下述方式得到:采用预设互信息算法从预先获取的油谱数据样本集中筛选与预设目标变量相关的至少一个输入变量;根据预设嵌入延迟窗方法为至少一个输入变量赋予对应的嵌入维数和嵌入延时,并进行相重构得到对应的嵌入延迟向量;使用预设KPCA模型对嵌入延迟向量进行特征提取,得到训练主元和测试主元;基于训练主元和测试主元对预先构建的油谱数据训练模型进行训练,得到训练好的油谱数据预测模型。能够获得更丰富更全面的特征气体发展变化的信息,提高了预测准确率。提高了预测准确率。提高了预测准确率。


技术研发人员:

王林 毛臻炫 桂辉阳 祝海峰 唐力 丰驰尧 谢保鸡

受保护的技术使用者:

中国南方电网有限责任公司超高压输电公司天生桥局

技术研发日:

2022.11.18

技术公布日:

2023/3/24

本文发布于:2024-09-20 15:35:43,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/1/79212.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:色谱   所述   变量   数据
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议