一种冗余数据清洗方法、装置、设备及介质与流程



1.本发明属于数据清洗技术领域,具体涉及一种冗余数据清洗方法、装置、设备及介质。


背景技术:



2.由于供电所系统涉及供电所、源侧、用电侧设备以及气候条件等海量多维数据,在数据信息产生、量测、传输及接收过程中容易出现数据冗余情况,导致上传至系统中台的数据信息存在失真情况,不利于供电所系统的统一管理与业务开展。因而研究供电所冗余数据清洗技术,获取更加准确规范监测数据,对于保障供电所安全与高效运行具有重大意义。
3.国内外专家学者针对电力系统数据处理已开展了一些研究。现有技术中存在一种基于复合数据结构压缩感知的综合能源数据压缩采集方法,并考虑到数据存在的异常和缺失情况,提出了基于改进k-means聚类的异常数据识别方法,但其忽略了对于冗余数据的考虑。现有技术中还包括基于云计算的电力大数据清洗模型,对于电力大数据进行了数据存储、数据辨识与数据清洗的研究,但缺乏对于数据失真情况的考虑。针对传统的用户异常用电模式检测模型存在投入高、效率低的问题,提出了包含数据清洗-特征筛选-模型训练的用户异常用电全周期检测模型。
4.以上研究促进了数据清洗技术在电力系统的推广与应用。但是有关供电所场景下的数据清洗技术研究仍较少且不够深入,缺乏对于数据冗余情况的考虑,为供电所的安全与高效运行带来了问题与挑战。


技术实现要素:



5.本发明的目的在于提供一种冗余数据清洗方法、装置、设备及介质,以解决现有供电所数据清洗技术缺乏对于数据冗余情况的考虑,导致供电所监测数据的准确性与可靠性低的技术问题。
6.为实现上述目的,本发明采用如下技术方案予以实现:
7.第一方面,一种冗余数据清洗方法,包括以下步骤:
8.获取供电所冗余数据;
9.对供电所冗余数据进行滤波处理得到滤波数据序列;
10.计算滤波数据序列中每组滤波数据的信息熵值,并根据每组滤波数据的信息熵值计算每组滤波数据对应的融合权重;
11.根据融合权重对滤波数据进行叠加得到融合数据并输出。
12.本发明的进一步改进在于:所述供电所冗余数据包括电网电压幅值、电网节点有功功率、电网节点无功功率、电网线路有功负荷和电网线路无功负荷。
13.本发明的进一步改进在于:所述滤波处理为卡尔曼滤波处理。
14.本发明的进一步改进在于:所述卡尔曼滤波处理包括预测处理和校正处理。
15.本发明的进一步改进在于:所述根据每组滤波数据的信息熵值计算每组滤波数据
对应的融合权重时,根据滤波数据序列计算输出概率,在根据输出概率计算信息熵值,最后根据信息熵值计算融合权重。
16.本发明的进一步改进在于:所述计算滤波数据序列中每组滤波数据的信息熵值时,采用信息熵理论。
17.第二方面,一种冗余数据清洗装置,包括:
18.冗余数据获取模块:用于获取供电所冗余数据;
19.滤波模块:用于对供电所冗余数据进行滤波处理得到滤波数据序列;
20.融合权重计算模块:用于计算滤波数据序列中每组滤波数据的信息熵值,并根据每组滤波数据的信息熵值计算每组滤波数据对应的融合权重;
21.融合数据输出模块:用于根据融合权重对滤波数据进行叠加得到融合数据并输出。
22.第三方面,一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述一种冗余数据清洗方法。
23.第四方面,一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述一种冗余数据清洗方法。
24.与现有技术相比,本发明至少包括以下有益效果:
25.1、本发明先对冗余数据进行初次滤波处理,过滤了一定噪声数据;在此基础上计算融合权重和信息熵值,最后得到融合数据,进一步提升了融合数据准确性;
26.2、本发明采用的信息熵理论计算信息熵,不仅保证了对于融合前信息的有效提取,同时提升了融合后数据的准确性。
附图说明
27.构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
28.图1是本发明一种冗余数据清洗方法的流程图;
29.图2是本发明一种冗余数据清洗方法实施例1中冗余数据融合相对误差图;
30.图3是本发明一种冗余数据清洗装置的系统框图。
具体实施方式
31.下面将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
32.以下详细说明均是示例性的说明,旨在对本发明提供进一步的详细说明。除非另有指明,本发明所采用的所有技术术语与本发明所属领域的一般技术人员的通常理解的含义相同。本发明所使用的术语仅是为了描述具体实施方式,而并非意图限制根据本发明的示例性实施方式。
33.实施例1
34.一种冗余数据清洗方法,如图1所示,包括以下步骤:
35.s1、获取供电所冗余数据;
36.供电所冗余数据包括电网电压幅值ui、电网节点有功功率pi、电网节点无功功率qi、电网线路有功负荷p
ij
和电网线路无功负荷q
ij

37.s2、通过卡尔曼滤波处理供电所冗余数据得到滤波数据序列;
38.在s2中卡尔曼滤波具体可分为预测和校正两部分,具体包括以下步骤:
39.s21、对于k组供电所冗余数据[x1,x2,...,xk],进行预测处理;
[0040][0041]
p
i-=ap
i-1at
+q;
[0042]
式中:为i时刻先验状态估计量;为i-1时刻后验状态估计量;a为上一状态到当前状态的状态转移系数;b为控制输入到当前状态的状态转移系数;ui为控制输入变量;p
i-为先验估计误差协方差;p
i-1
为后验估计误差协方差;q为过程噪声协方差。
[0043]
s22、对预测处理结果进行校正处理得到滤波数据序列;
[0044][0045][0046][0047]
式中:ki为卡尔曼增益;h为量测系数;r为量测噪声协方差;zi为i时刻量测量;i为单位系数。
[0048]
将k组冗余数据序列[x1,x2,...,xk]进行卡尔曼滤波处理即可得到滤波数据序列。
[0049]
s3、计算滤波数据序列中每组滤波数据的信息熵值,并根据每组滤波数据的信息熵值计算每组滤波数据对应的融合权重;
[0050][0051][0052][0053]
式中:e为信息熵值;表示滤波数据序列中第i行第j列的值;λ为输出概率;w为融合权重;n为每组滤波数据的长度。
[0054]
s4、根据融合权重对滤波数据进行叠加得到融合数据并输出。
[0055][0056]
式中:为滤波数据融合得到的数据序列。
[0057]
经过上述四个步骤的滤波融合之后,实现对供电所冗余数据的有效清洗。
[0058]
下面以某供电所中的实际数据为例,对所提基于数据融合的供电所冗余数据清洗方法进行验证。表1中冗余数据1与冗余数据2为该供电所系统中某分布式电源电流数据。
[0059]
表1供电所冗余数据
[0060]
[0061]
[0062][0063]
由表1可以看出冗余数据1与冗余数据2存在对于某分布式电源电流数据的重复采集,并且存在一定误差。基于所提方法进行数据清洗后的结果如图2所示。由图2可以看出,所提方法将冗余数据进行有效融合,并且融合数据相比于融合前的冗余数据相对误差更小,更加接近真实值。
[0064]
实施例2
[0065]
一种冗余数据清洗装置,如图2所示,包括:
[0066]
冗余数据获取模块:用于获取供电所冗余数据;
[0067]
滤波模块:用于通过卡尔曼滤波处理供电所冗余数据得到滤波数据序列;
[0068]
融合权重计算模块:用于计算滤波数据序列中每组滤波数据的信息熵值,并根据每组滤波数据的信息熵值计算每组滤波数据对应的融合权重;
[0069]
融合数据输出模块:用于根据融合权重对滤波数据进行叠加得到融合数据并输出。
[0070]
实施例3
[0071]
一种计算机设备,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述的一种冗余数据清洗方法。
[0072]
实施例4
[0073]
一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现上述的一种冗余数据清洗方法。
[0074]
由技术常识可知,本发明可以通过其它的不脱离其精神实质或必要特征的实施方
案来实现。因此,上述公开的实施方案,就各方面而言,都只是举例说明,并不是仅有的。所有在本发明范围内或在等同于本发明的范围内的改变均被本发明包含。
[0075]
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0076]
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0077]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0078]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0079]
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。

技术特征:


1.一种冗余数据清洗方法,其特征在于,包括以下步骤:获取供电所冗余数据;对供电所冗余数据进行滤波处理得到滤波数据序列;计算滤波数据序列中每组滤波数据的信息熵值,并根据每组滤波数据的信息熵值计算每组滤波数据对应的融合权重;根据融合权重对滤波数据进行叠加得到融合数据并输出。2.根据权利要求1所述的一种冗余数据清洗方法,其特征在于,所述供电所冗余数据包括电网电压幅值、电网节点有功功率、电网节点无功功率、电网线路有功负荷和电网线路无功负荷。3.根据权利要求1所述的一种冗余数据清洗方法,其特征在于,所述滤波处理为卡尔曼滤波处理。4.根据权利要求3所述的一种冗余数据清洗方法,其特征在于,所述卡尔曼滤波处理包括预测处理和校正处理。5.根据权利要求1所述的一种冗余数据清洗方法,其特征在于,所述根据每组滤波数据的信息熵值计算每组滤波数据对应的融合权重时,根据滤波数据序列计算输出概率,在根据输出概率计算信息熵值,最后根据信息熵值计算融合权重。6.根据权利要求1所述的一种冗余数据清洗方法,其特征在于,所述计算滤波数据序列中每组滤波数据的信息熵值时,采用信息熵理论。7.一种冗余数据清洗装置,其特征在于,包括:冗余数据获取模块:用于获取供电所冗余数据;滤波模块:用于对供电所冗余数据进行滤波处理得到滤波数据序列;融合权重计算模块:用于计算滤波数据序列中每组滤波数据的信息熵值,并根据每组滤波数据的信息熵值计算每组滤波数据对应的融合权重;融合数据输出模块:用于根据融合权重对滤波数据进行叠加得到融合数据并输出。8.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述一种冗余数据清洗方法。9.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述一种冗余数据清洗方法。

技术总结


本发明属于数据清洗技术领域,具体涉及一种冗余数据清洗方法、装置、设备及介质。包括以下步骤:获取供电所冗余数据;对供电所冗余数据进行滤波处理得到滤波数据序列;计算滤波数据序列中每组滤波数据的信息熵值,并根据每组滤波数据的信息熵值计算每组滤波数据对应的融合权重;根据融合权重对滤波数据进行叠加得到融合数据并输出。本发明先对冗余数据进行初次滤波处理,过滤了一定噪声数据;在此基础上计算融合权重和信息熵值,最后得到融合数据,进一步提升了融合数据准确性。进一步提升了融合数据准确性。进一步提升了融合数据准确性。


技术研发人员:

孙亮 唐旭 张新鹤 岳国荣 钟鸣 杨泳 许皓 魏然 齐文凯 姚立国

受保护的技术使用者:

国家电网有限公司 中国电力科学研究院有限公司

技术研发日:

2022.09.22

技术公布日:

2022/12/16

本文发布于:2024-09-24 21:18:05,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/1/41067.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:数据   冗余   供电所   所述
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议