提升非侵入式负荷辨识准确度的改进型自编码器

文章编号:1005-5630(2021)02-0008-08
DOI : 10.3969/j.issn.1005-5630.2021.02.002
提升非侵入式负荷辨识准确度的
改进型自编码器
稀疏编码朱炜昕,王亚刚
(上海理工大学 光电信息与计算机工程学院,上海 200093)
摘要:非侵入式负荷辨识能够实现电器能耗监测、提高能源使用效率。针对电器混合能耗分解的任务,提出了一种包含改进型去噪自编码器的神经网络方法,用于分解低频采样的混合功率。该方法首先对不同电器分别训练一个卷积去噪自编码器神经网络,然后使用滑动窗口的方式将原始电表采样功率数据通过相应神经网络逐一进行局部分解,最后合成目标电器的干净时序功率数据。研究表明,在REDD 数据集上进行实验时,该方法对电器负荷分解准确度较现有方法提高至少12%。准确度的提升归因于本方法在网络结构上加入了卷积层、批归一化和修正线性单元,并在样本预处理上零值化所有半运行训练样本标签,促使神经网络能充分地利用其有限的容量。
关键词:非侵入式负荷辨识;电器能耗分解;自编码器;神经网络中图分类号:TP 391    文献标志码:A
Accuracy improved denoising autoencoder for
non-intrusive load monitoring
ZHU Weixin ,WANG Yagang
(School of Optical-Electrical and Computer Engineering, University of Shanghai for
Science and Technology, Shanghai 200093, China )
Abstract:  Non-intrusive  load  monitoring  facilitates  the  monitoring  of  electric  appliance  energy usage  and  the  improvement  on  energy  efficiency. Focusing  on  the  task  of  disaggregating  mixed energy consumption, this paper proposes a method that involves improved denoising autoencoder neural network to disaggregate mixed power sampled at low frequency. This method firstly trains a convolutional denoising autoencoder network for every electric appliance. Subsequently, the sliding window method is employed to disaggregate the mixed power segments, which are later combined to  form  the  clean  complete  disaggregated  time  series  power  data. Th
e  research  shows  that  the
收稿日期 :2020-12-01
基金项目 :国家自然科学基金(61074087、 61703277、 11502145)
作者简介 :朱炜昕(1990—),男,硕士研究生,研究方向为模式识别、系统辨识。E-mail :****************通信作者 :王亚刚(1967—),男,教授,研究方向为系统辨识、智能控制系统。E-mail :************
第 43 卷    第 2 期光    学    仪    器
Vol. 43,No. 22021 年 4 月
OPTICAL INSTRUMENTS
April ,2021
experiment on the REDD dataset demonstrates at least 12% improvement on disaggregation accuracy compared with current methods; and this improvement in performance attributes to the stru
ctural change that adds convolutional layers, batch normalization and rectified linear unit, as well as the sample preprocessing that innovatively zeros out labels of samples containing incomplete active sections forcing the network to better exploit its limited capacity.
Keywords:  non-intrusive load monitoring;electric applianc energy disaggregation;autoencoder;neural network
引 言
随着全球变暖,世界各国越来越重视能源大量消耗对环境带来的负面影响。在2008年全球气候峰会上,多国政府承诺逐步降低碳排放量,并推动能源效率提升。在用电方面,实时采集电器能耗信息有助于用户和电厂合理安排用电时间,从而提高用电效率[1]。采集电器能耗信息的方法通常分为侵入式负载监测和非侵入式负载监测两大类方法,其中:侵入式负载监测方法是对每个电器安装独立分电表来获取其能耗信息,而非侵入式负载监测方法是从总电表数据提取电路中每个电器能耗信息[2]。虽然侵入式负载监测在测量单个电器信息的准确度上有优势,但由于经济成本和可行性等因素,非侵入式负载监测成为更受欢迎的方法[3-4]。非侵入式负载监测的分解问题最先由Hart提出,主要围绕聚类算法进行分解[5],随后出现了组合优化[6]、稀疏编码[7-8],隐马尔可夫模型[9-10]、动态时间规整[11],特征库匹配[12]、深度神经网络[13-17]等方法。
非侵入式负载监测(NILM)一般用于电器分类、状态辨别、能耗分解等任务,其步骤一般分为数据采集、特征提取、信号分离等步骤。数据采集有高低频之分,一般高频可以达到100 MHz,低频则低于1 kHz。特征提取包括电器自身运行时的瞬时特征和稳态特征,比如电流、有功功率、无功功率等[4]。为了能够有效量化和比较各个算法的效果,分析算法的有效性和通用性,REDD[18]、UK-DALE[19]等公开的数据集提供了不同天数的多种家用电器的用电数据。
在近几年的研究中,主要针对低频特征的神经网络方法被不断地应用到NILM中。文献[13]对比了3种人工神经网络的模型来实现NILM 的效果:1)长短时记忆循环神经网络(LSTM),用来对单个电器的时序功率数据做序列到序列的估计;2)去噪自编码器(dAE),用来对单个电器的时序功率数据做序列到序列的估计;3)卷积神经网络(CNN),又称为Rectangle Net,用来对电器启停时刻和平均运行功率做序列到点的估计。文献[14]则进一步在文献[13]提出的dAE网络基础上进行了大量的实验,较为全面地挖掘了dAE在电能分解上的能力,验证了卷积层数、池化层、采样频率等结构性因素对dAE网络分解效果的影响,并且对比了基于隐马尔可夫模型的AFAMAP算法[11],说明了dAE方法在强噪音环境下的分解效果优于AFAMAP算法,此外还使用了神经网络以外的辅助手段来提高负荷分解的准确度。文献[15]提出了一种结合高频特征的神经网络来对电器进行分类。文献[16]提出了一种LSTM循环神经网络,结合非因果结构与贝叶斯参数优化框架对电器功率进行回归估计。文献[17]从电器状态聚类出发,将状态和功率等信息输入深度神经网络以估计下一时刻的电器状态和功率。
在分解混合电器能耗的任务中,dAE作为一种序列到序列的信号重建的方法,在重建信息的分辨率上比序列到点估计方法有优势。并且dAE 在文献[13]中表现的准确度比LSTM循环神经网络和Rectangle Net更有潜力。虽然文献[14]针对dAE方法已做了较为全面的研究,但是dAE的准确度仍然有较大的提升空间。因此,本文提出一种改进型dAE方法,对网络结构适当增加卷积层,结合批归一化(batch normalization, BN)和修正线性单元(ReLU),并创新性地对半运行训练样本标签做零值化预处理,以提高负荷分解的准确度。
第 2 期朱炜昕,等:提升非侵入式负荷辨识准确度的改进型自编码器•  9  •
1    自编码器方法
自编码器(AE )由编码器(Encoder )和解码器(Decoder )两个部分组成。编码器将输入信息转换成一个能够表达输入信息的表示向量。解码器则把这个表示向量还原成输入信息。图1是卷积自编码器结构,其中间部分是表示向量,其左边
部分至输入层是编码器,其右边部分至输出层是解码器。为了使模型能够更好地泛化,中间表示向量的维度会被设为低于输入信息的维度,以促使表示向量只保留主要的信息。dAE 在AE 的基础上通过对带噪音的输入数据训练,使其能够重建干净信号,达到去除噪音的效果
[20]
输入
卷积卷积卷积卷积卷积卷积
编码器解码器
全连接全连接所有电器混合功率
表示
输出
目标电器干净功率
图 1  卷积自编码器结构
Fig. 1    Convolutional dAE topology
如果将电器的时序用电功率视为干净的信号,其他电器的用电功率视为噪音,则可以将dAE 应用于电能分解,并可将分解问题表述为
y (t )t y i (t )i t ∑
j  i y j (t )t 式中:  为所有电器在  时刻的混合功率;
为目标电器  在  时刻的功率;  是其
他电器在  时刻的功率和。NILM 的表述中一般会包含一个随机误差项[4]
,但由于其他电器的功率和本身是噪音且远远大于随机误差,因此可忽略此随机误差项。
y (t )y i (t )由于不同电器用电模式的变化,会使其功率产生起伏变化,类似一维图像,因此在dAE 中采用卷积层来帮助模型提取图像特征。图1中的编码器和解码器分别包含3个卷积层和1个全连接层。网络的输入为固定长度的混合功率,输出为目标电器的干净运行功率。由于每种电器的典型运行长度不一,且太大或太小的输入长度在实验中显示出降低网络分解效果的问题,本文针对不同电器的典型运行时长选取不同的网络输入长度。此外,由于最终目的是从一段不固定长度的混合功率  (图1最左边竖直放置的波形图)中分离出单个电器的干净功率  (图1最右边竖直放置的波形图),而dAE 网络仅仅是对一小段固定长度的混合信号进行分解,所以要把网络
产生的局部估计值拼接起来,以得到最终的完整且干净的单电器功率。
由于网络的输入样本可能包含重叠的部分,因此输出结果也有重叠,如图2所示,窗口109 300~109 900的分解结果分别和窗口108 950~109 550与窗口109 650~110 250的分解结果有部分重叠。为了从重叠的估计中确定最终的估计值,文献[13]使用了所有估计值的算数平均数,但文献[14]指出算数平均数不能有效解决估计值低估的问题,因此采用中位数。而本文针对本文的训练方法提出并使用了修正中位数。文献[13]、文献[ 14]的训练样本是直接截取原始数据中的混合样本和干净样本作为训练数据的样本和标签,因此使用平均数和中位数是合理的。但本文提出将包含不完整运行区间的样本作为负样本,使其标签值为零。这样能够提高模型(指本文提出的网络结构)对非零值的估计准确度,但同时会人为地造成过多的零估计值,因此需要引入修正中位数来消除这些零估计值的影响。修正逻辑是剥离零估计值后,再取中位数,因此修正中位数不再是0.5,而是位于0.5
和1之间。中位数的表达式为
r w r <w 式中:  和  分别为目标电器的平均运行时长和窗口长度,且  。
•  10  •光    学    仪    器第 43 卷
2    实 验
2.1    评价指标
P i R i E i 本文采用文献[14]使用的针对能量估计的Precision 指标(  ),Recall 指标(  ),F 1指标和NEP (normalized error  in  assigned  power )指标(  )。Precision 指标反映了实际功率占分解出的功率的比例,其表达式为
=1
min(ˆy i (t ),y i (t ))∑T
t =1
ˆy i (t )
(3)
i ˆy i (t )y i (t )i t T 式中:  为目标电器编号;  、  分别为电器  在  时刻的估计功率和实际功率;  为测试数据的总时长,按采样点个数计。
Recall 指标反映了分解出的功率占实际功率
的比例,其表达式为
F 1指标是Precision 指标和Recall 指标的调和平均数,其表达式为
NEP 指标度量分解误差占真实功率的比例,其表达式为
2.2    数据集
REDD 数据集
[18]
包含了6个美国家庭且每
个家庭大约20种电器的单独数据和总电表的数据,单个电器的采样间隔为3 s 。其中一个实验是对某个家庭的用电情况进行了约为30 d 的采样,约70万个采样点,由于总电表的部分数据存在明显异常,所以采用了所有电器数据的叠加来代替总电表数据。实验在3种运行特征较为独特的电器上进行,分别是洗碗机、微波炉、冰箱。冰箱的运行功率相对较低,功率变化单调,
运行时长相对固定,但经常启动。洗碗机是不常用电器,运行时功率起伏变化较为独特,运行时长相对固定。微波炉经常启动,功率高但变化比较单调,运行时长差异大。
首先,通过阈值的方法在原始时序数据上定位电器的运行区间。从零时刻开始扫描每个采样点,如果连续多个采样点的功率达到运行功率阈值以上,且个数达到运行时长阈值以上,则记为开始运行。如果出现多个连续采样点的功率达到
运行功率阈值以下,且个数达到停止时长阈值以上,则记为运行结束,并将运行开始到运行结束的这段采样点记为一个运行区间。
然后,从下一个采样点开始重复以上判定。运行区间的判定阈值见表1。各电器的运行区间
统计信息见表2。表中原始数据是由电表按固定时间间隔采集的,因此时长和采样点个数是等价的。
2.3    网络输入
每个电器生成5 000个正样本和5 000个负样本并分别作为训练集和验证集。正样本为包含
108 800
109 000
109 200
109 400
109 600109 800110 000110 200110 400采样点
窗口 108 950~109 550 估计功率窗口 109 650~110 250 估计功率窗口 109 300~109 900 估计功率目标电器实际功率
图 2  3个重叠的分解窗口
Fig. 2    Three overlapping disaggregation windows
第 2 期
朱炜昕,等:提升非侵入式负荷辨识准确度的改进型自编码器
•  11  •
完整运行区间的样本,标签为目标电器的单电器功率。负样本为不包含完整运行区间的样本。与已有方法不同的是,本方法要求所有负样本的标签被零值化,即不包含运行区间和只包含部分运行区间的样本标签均被置为零向量。训练集和验证集的比例为8∶2,其中真实样本和合成样本各占一半。训练集和验证集样本产生于60万个采样点(约21 d),测试样本产生于另外10万个采样点(约3.5 d)。样本长度(即窗口长度),见表2。
此外,合成样本和标签的方法如下:
1)针对目标电器生成标签,将目标电器的运行样本放入一个窗口的随机位置,但保证运行区间完整。
2)其他电器分别有25%的几率被放入窗口中的任意位置作为噪声,将标签和噪声叠加起来合成一个正样本。同时,合成对应的负样本,即生成噪声部分,并使其对应的标签为零向量。
3)对每个电器的输入数据进行归一化,使用的均值和方差来自于所有原始混合数据。对每个电器的标签数据进行最小、最大规范化,其最小值设为0,其最大值设为表2中最高功率的最小值。2.4    网络结构
本文采用的网络结构如表3所示,由3层卷积(Conv),2层全连接(Fc),3层反卷积(Deconv)组
成。第1层全连接的输出维度固定为128。卷积层和反卷积层的卷积核维数为4,步长数为1,填充数为0。输入输出维数匹配各电器的窗口长度(N个采样点)。此外,每个卷积层(除最后一层)和全连接层包含批归一化层和修正线性单元激活层。表4为各个电器模型的参数量统计信息,可见本文采用的网络比较轻型,有利于实时检测。
表 3  网络结构
Tab. 3  Network structure
网络层卷积核维数步长数填充数输出维数
Input———N*1
Conv-1410(N−3)*8
Conv-2410(N−6)*8
Conv-3410(N−9)*8
Fc-1———128
Fc-2———(N−9)*8 Deconv-3410(N−6)*8 Deconv-2410(N−3)*8 Deconv-1410N*1
表 4  3种电器的模型统计数据
Tab. 4  Statistics of models for three devices
电器参数数量/106个浮点运算次数/106次模型大小/106 Byte 冰箱  1.2  2.6  4.9
洗碗机  5.111.020.5
微波炉0.20.40.7
2.5    网络训练
网络搭建在PyTorch平台上,使用CPU(Intel i5-7200U 2.5 GHz)训练,操作系统是Windows 10。用平均平方误差作为网络训练的损失函数,使用ADAM优化器进行迷你批梯度下降。网络的主要超参数设置见表5,其他设置采用PyTorch 默认值。通过预实验发现,学习率小于0.01时
表 1  运行区间的判定阈值Tab. 1    Criteria of the active segment
电器运行功率
阈值/W
运行时长
阈值/个
停止时长
阈值/个
冰箱1001010
洗碗机10100100
微波炉1001020
其他201010
注:运行时长阈值和停止时长阈值均由采样点个数表示,采样间隔3 s。
表 2  电器运行区间的统计信息以及窗口长度Tab. 2    Statistics of active sections and window length
电器运行次数
最高功率/W运行时长/个
窗口长度/个最小值最大值平均值最大值
冰箱64220123592991739600
洗碗机1812101566183624312500
微波炉2491416290637966100
注:运行时长和窗口长度均由采样点个数表示,采样间隔3 s。
•  12  •光学仪器第 43 卷

本文发布于:2024-09-22 09:41:19,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/3/378856.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:电器   功率   运行   分解   数据   样本   卷积   方法
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议