一种源荷组合概率预测方法、装置及存储介质

1.本发明涉及一种源荷组合概率预测方法、装置及存储介质，属于电力系统技术领域。

背景技术：

2.在以往的源荷预测研究中，大多将新能源发电侧和负荷侧分开考虑进行预测。研究通过改进lstm(long short-term memory，长短时记忆)遗忘门提高概率预测的准确性，并引入分位数回归的概念。在光伏概率预测方面，概率预测通过非参数估计方法实现；在光伏概率密度预测中，常采用模拟退火算法获得近似最优解；然后，利用核密度估计方法将条件分位数预测结果与概率密度预测结果进行拟合。虽然lstm网络可以绕过单元从而记住更长的时间步骤，因此可以消除一些梯度消失的问题，然而lstm并没有解决全部问题，lstm仍然有一条从过去单元到当前单元的顺序路径，这条路使得模型训练更加复杂；另外，虽然lstm及其衍生能够记住大量更长期的信息，但是它们只能记住100个量级的序列，不能记住更长的序列。
3.谷歌团队提出的transformer网络放弃了rnn循环神经网络模型，完全依赖注意机制来提取序列之间的关系。transformer的一个重要特征是注意力机制，它使该网络能够并行读取和计算数据，并解决rnn及其变体的远程依赖问题。transformer结构从理论上将传播路径压缩到最短，这使得网络能够处理更复杂的数据信息，并缩短计算时间。transformer网络解决了更长序列的问题，但是transformer通常被用于处理语言类的问题，在将transformer应用在电力预测时，面对大量的数据集，transformer往往又存在输入数据的处理问题。

技术实现要素：

4.本发明的目的在于克服现有技术中的不足，提供一种源荷组合概率预测方法、装置及存储介质，可以增强源荷预测的准确性。
5.为达到上述目的，本发明是采用下述技术方案实现的：
6.第一方面，本发明提供了一种源荷组合概率预测方法，包括：
7.采集源荷历史数据及对应的气象数据；
8.对所述源荷历史数据及气象数据进行预处理，获得完整可用的数据组合；
9.将预处理后的数据组合输入至预构建并训练好的多个convmt预测模型中，获得多个源荷组合预测结果；
10.将各源荷组合预测结果与各自对应的权重相乘，并将乘积进行求和运算，获得最终的源荷组合概率预测结果；
11.其中，所述convmt预测模型是采用cnn特征提取模块替换transformer模型中编码器原有的多头注意力模块后，再采用源荷历史数据及同时间尺度的气象数据训练获取的；所述权重是以pinball损失函数最小为目标，通过遗传算法进行优化后获取的。
12.结合第一方面，进一步的，所述convmt预测模型的训练方法包括：
13.依据预设的时间间隔采集多组源荷历史数据及对应的气象数据；
14.根据所采集的多组源荷历史数据及对应的气象数据构建原始数据集；
15.对原始数据集进行预处理，获得多组完整可用的包含源荷历史数据及对应的气象数据的数据组合，形成样本集；
16.按照数据组合的采样时间将所述样本集划分为训练集和测试集，所述测试集中数据组合的采样时间均晚于所述训练集中数据组合的采样时间；
17.从训练集中选取多组数据组合分别输入至多个convmt预测模型中进行训练，获取多个convmt预测模型的训练集源荷预测结果；
18.将测试集中的源荷历史数据作为真实值，将同一时刻的训练集源荷预测结果作为预测值，根据真实值与预测值计算mape值；
19.以mape值最小为优化目标对convmt预测模型进行参数优化，获取最终训练好的convmt预测模型。
20.结合第一方面，进一步的，所述预处理包括：
21.对源荷历史数据及对应的气象数据进行异常值检测，若存在异常值，则采用邻近正常值代替所述异常值；
22.对源荷历史数据及对应的气象数据处理异常数据后进行归一化处理，线性变换到(1，2)范围内。
23.结合第一方面，进一步的，所述原始数据集是采用bootstrap方法从所采集的源荷历史数据及对应的气象数据中选取多组数据组合而构建的。
24.结合第一方面，进一步的，所述pinball损失函数的表达式如下：
[0025][0026]
式中：为pinball损失函数值；i为指示函数；α为在预设的分位数下源荷组合概率预测结果的分布函数；y
i,t
为负荷的真实值；为所求分位点；当时，即等价为平均绝对误差，所求得的分位点即为中位数；n为样本个数；t为日前预测的输出长度。
[0027]
结合第一方面，进一步的，分布函数α的值通过下述方法确定：
[0028]
(1)α
pmax
+α
pmin
＝1
[0029]
(2)α
pmax-α
pmin
＝p％
[0030]
式中，α
pmax
为pmax曲线对应的α值，α
pmin
为pmin曲线对应的α值，p介于0-100之间，p％表示真实值落在pmin和pmax曲线之间的概率。
[0031]
结合第一方面，进一步的，所述源荷历史数据包括电网发电侧的风力发电量和光伏发电量、以及电网负荷侧的用电量；所述气象数据包括与源荷数据相关的温度、湿度、压强、辐照度和风速。
[0032]
结合第一方面，进一步的，所述cnn特征提取模块为3
×
3的cnn特征提取模块，相应的，所述convmt预测模型的编码器的输入采用13
×
72的数据矩阵，所述数据矩阵是由以下8种数据组成的13维矩阵：
[0033]
风电、光伏、负荷、压强、湿度、温度、风速、辐照度。
[0034]
第二方面，进一步的，本发明提供一种源荷组合概率预测装置，包括：
[0035]
采集模块：用于采集源荷历史数据及对应的气象数据；
[0036]
预处理模块：用于对所述源荷历史数据及气象数据进行预处理，获得完整可用的数据组合；
[0037]
预测模块：用于将预处理后的数据组合输入至预构建并训练好的多个convmt预测模型中，获得多个源荷组合预测结果；
[0038]
获取模块：用于将各源荷组合预测结果与各自对应的权重相乘，并将乘积进行求和运算，获得最终的源荷组合概率预测结果；
[0039]
其中，所述convmt预测模型是采用cnn特征提取模块替换transformer模型中编码器原有的多头注意力模块后，再采用源荷历史数据及同时间尺度的气象数据训练获取的；所述权重是以pinball损失函数最小为目标，通过遗传算法进行优化后获取的。
[0040]
结合第二方面，进一步的，该装置还包括所述训练模块，所述训练模块包括：
[0041]
数据集构建单元：用于依据预设的时间间隔采集多组源荷历史数据及对应的气象数据，并根据所采集多组源荷历史数据及对应的气象数据构建原始数据集；
[0042]
样本集形成单元：用于对原始数据集进行预处理，获得多组完整可用的包含源荷历史数据及对应的气象数据的数据组合，形成样本集；
[0043]
样本集划分单元：用于按照数据组合的采样时间将所述样本集划分为训练集和测试集，所述测试集中数据组合的采样时间均晚于所述训练集中数据组合的采样时间；
[0044]
训练单元：用于从训练集中选取多组数据组合分别输入至多个convmt预测模型中进行训练，获取多个convmt预测模型的训练集源荷预测结果；
[0045]
mape值计算单元：用于将测试集中的源荷历史数据作为真实值，将同一时刻的训练集源荷预测结果作为预测值，根据真实值与预测值计算mape值；
[0046]
参数优化单元：用于以mape值最小为优化目标对convmt预测模型进行参数优化，获取最终训练好的convmt预测模型。
[0047]
第三方面，本发明提供一种源荷组合概率预测装置，包括处理器及存储介质；
[0048]
所述存储介质用于存储指令；
[0049]
所述处理器用于根据所述指令进行操作以执行第一方面任一项所述方法的步骤。
[0050]
第四方面，本发明提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现第一方面任一项所述方法的步骤。
[0051]
与现有技术相比，本发明所达到的有益效果：
[0052]
本发明采用的convmt预测模型是采用cnn特征提取模块替换transformer模型中编码器原有的多头注意力模块后，再采用源荷历史数据及同时间尺度的气象数据训练获取的；所述各个convmt模型预测的源荷组合预测结果的权重，是以pinball损失函数最小为目标，通过遗传算法优化之后获取的；
[0053]
采用cnn特征提取模块替换transformer模型中编码器原有的多头注意力模块，可以提取数据特征，避免了由于源荷和气象数据内部耦合性关系不明确导致无法手动选择特征参数的问题，避免了早期复杂的数据处理操作。
附图说明
[0054]
图1是本发明实施例提供的源荷组合概率预测方法的流程图；
[0055]
图2是本发明实施例提供的convmt预测模型的结构示意图；
[0056]
图3是采用本发明实施例提供的源荷组合概率预测方法预测的风电预测结果图；
[0057]
图4是采用本发明实施例提供的源荷组合概率预测方法预测的光伏预测结果图；
[0058]
图5是采用本发明实施例提供的源荷组合概率预测方法预测的负荷预测结果图。
具体实施方式
[0059]
下面通过附图以及具体实施例对本发明技术方案做详细的说明，应当理解本技术实施例以及实施例中的具体特征是对本技术技术方案的详细的说明，而不是对本技术技术方案的限定，在不冲突的情况下，本技术实施例以及实施例中的技术特征可以相互组合。
[0060]
实施例一：
[0061]
图1是本发明实施例一提供的一种源荷组合概率预测方法的流程图。本流程图仅仅示出了本实施例所述方法的逻辑顺序，在互不冲突的前提下，在本发明其它可能的实施例中，可以以不同于图1所示的顺序完成所示出或描述的步骤。
[0062]
本实施例提供的源荷组合概率预测方法可应用于终端，可以由源荷组合概率预测装置来执行，该装置可以由软件和/或硬件的方式实现，该装置可以集成在终端中，例如：任一具备通信功能的智能手机，平板电脑或计算机设备。参见图1，本实施的方法具体包括如下步骤：
[0063]
步骤一：采集源荷历史数据及对应的气象数据；
[0064]
新能源发电侧和负荷侧都受到天气因素的影响，比如：太阳辐射强度、温度、等天气因素对光伏发电存在巨大影响；负载侧的功耗也将根据天气条件而变化，比如：夏季空调使用量增加导致用电量增加。
[0065]
因此，在本发明实施例中不仅考虑了源荷历史数据，同时考虑了气象数据，以进一步提高预测结果的准确性。作为本发明的一种实施例，源荷历史数据可以包括：电网发电侧的风力发电量和光伏发电量、以及电网负荷侧的用电量；所述气象数据可以包括温度、湿度、压强、辐照度和风速。需要说明的是，源荷历史数据与气象数据作为一个数据组合，应为同一时间尺度，两者相对应。
[0066]
步骤二：对所述源荷历史数据及气象数据进行预处理，获得完整可用的数据组合；
[0067]
在某些实施例中，所采集的源荷历史数据及对应的气象数据中会存在少量异常数据，为此，在将数据输入至convmt预测模型之前，需要对所述源荷历史数据及对应的气象数据进行异常值检测，对于异常值可以使用邻近的正常值代替；
[0068]
为了消除奇异数据导致的不良影响以及加速后续损失函数的收敛，在本发明实施例中，对于异常处理后的数据还需要进一步进行归一化处理，将数据线性变换到(1,2)范围内，归一化处理的具体公式如公式(1)所示：
[0069][0070]
式中：x
′
为归一化后的数据值，x为原数据值，x
min
为数据集中该类数据的最小值，x
max
为数据集中该类数据的最大值。
[0071]
步骤三：将预处理后的数据组合输入至预构建并训练好的多个convmt预测模型中，获得多个源荷组合预测结果；
[0072]
本发明实施例所述的convmt(probability-cnn-multi-transformer)预测模型是基于transformer模型构建、采用源荷历史数据及同时间尺度的气象数据训练获取的；具体而言，convmt预测模型是采用cnn特征提取模块替换transformer模型中编码器原有的多头注意力模块获取的。
[0073]
如图2所示，是本发明实施例提供的convmt预测模型的结构示意图，convmt预测模型是在transformer模型的基础上构建的，transformer模型主要包括位置嵌入、编码器和解码器部分，其中编码器和解码器均包含多头注意力层、前向传播层和带掩码的前向传播层等。convmt预测模型去掉了transformer模型的位置嵌入部分，采用cnn特征提取模块代替transformer模型中编码器的多头注意力模块，用于提取源荷和气象数据之间的特征。由于源荷和气象数据内部耦合性关系并不明确，难以手动选择特征，加入cnn特征提取模块后，预测模型不需要手动选择特征参数，在数据集上训练权重后，可以通过cnn特征提取模块直接获得数据特征，避免早期复杂的数据处理。如表1所示，是本发明实施例提供的一种convmt预测模型参数表：
[0074]
表1 convmt预测模型参数表
[0075]
参数类型参数值编码器层数8编码器输出维数256解码器前向层大小256解码器多头注意力头数8解码器层数8
[0076]
可选的，cnn特征提取模块为3
×
3的cnn特征提取模块，convmt预测模型的编码器的输入采用13
×
72的数据矩阵，所述数据矩阵是由以下8种数据组成的13维矩阵：
[0077]
风电、光伏、负荷、压强、湿度、温度、风速、辐照度。
[0078]
convmt预测模型中3个解码器的输入1、输入2、输入3分别是风电、光伏、负载和对应气象数据的历史数据。把输入1、输入2、输入3的数据合并形成的二维矩阵就是构成编码器的输入部分。convmt预测模型使用这种输入结构可以将源荷的关联性代入预测模型，并实现对风电、光伏和负载三者有功功率的分别预测。
[0079]
convmt预测模型中的前向传播层用于提供非线性特征变换能力。
[0080]
步骤四：将各源荷组合预测结果与各自对应的权重相乘，并将乘积进行求和运算，获得最终的源荷组合概率预测结果；
[0081]
需要说明的是，在本技术中源荷组合概率预测结果是指：使用单编码器多解码器结构将源荷耦合性代入convmt模型进行预测，并用分位数表示预测结果的预测。
[0082]
在本发明实施例中使用pinball(弹球)损失函数优化获取所述权重，pinball损失函数是一个用来衡量概率预测结果准确性的函数，根据pinball损失函数计算公式计算弹球损失值，弹球损失值越小，概率预测结果越准确。
[0083]
pinball损失函数作为遗传算法的目标函数，在优化过程中需要手动输入分位数的相关信息。pinball损失函数可定义为
[0084][0085]
式中：为pinball损失函数值；i为指示函数；α为在预设的分位数下源荷组合概率预测结果的分布函数；y
i,t
为负荷的真实值；为所求分位点；当时，即等价为平均绝对误差，所求得的分位点即为中位数；n为样本个数；t为日前预测的输出长度，此处为1h。
[0086]
多组源荷组合预测结果可视为一个正态分布，在正态分布中，中点处为真实值的概率最大，以此处为中心向两边扩展可以得到真实值落在某区间内的总概率。因此，分布函数α的值通过下述方法确定：
[0087]
(1)α
pmax
+α
pmin
＝1
[0088]
(2)α
pmax-α
pmin
＝p％
[0089]
式中，α
pmax
为pmax曲线对应的α值，α
pmin
为pmin曲线对应的α值，p介于0-100之间，p％表示真实值落在pmin和pmax曲线之间的概率。
[0090]
采用遗传算法进行优化过程中，适应度函数值的计算公式如下：
[0091][0092]
式中，loss
10
是优化前的pinball loss函数结果，lossi为训练模型i的pinball损失函数结果；i＝1,2,3,
…
n，n表示convmt预测模型的总个数。
[0093]
电压越限惩罚函数为：
[0094][0095][0096]
式中，f是加入越限惩罚函数后的适应度函数值；λ是一个比f更高数量级的一个大值用于增大公式后面部分的值，使该个体在后续步骤更容易被淘汰；pi是个体i被赋予的权重值；p
il
是一中间参数，用于引入分段函数值，从而区分不同情况下的权重值，使权重值越限时得以受到惩罚；p
imax
是优化对象权重要求范围的最大值；p
imin
是优化对象权重要求范围的最小值；
[0097]
遗传算法适应度为：
[0098][0099]
以convmt预测模型作为个体，在遗传算法中的遗传操作方法使用赌法，保留适应度最大的个体，个体i被选取的概率pi为：
[0100]
[0101]
式中：fi是第i个convmt预测模型加入越限惩罚函数后的适应度函数值；
[0102]
遗传算法中取两个个体，根据交叉概率判别是否需要进行交叉操作，如满足交叉概率要求，则进行交叉操作，交叉概率公式为：
[0103][0104]
式中，pc是个体i进行交叉操作的概率；p
c1
、p
c2
是两个设定好的值，在本发明实施例中，p
c1
＝0.9，p
c2
＝0.6；f
avg
是当代种的平均适应度值；f
max
是当代种的最大个体适应度值；f'是需要交叉的两个个体中较大的适应度值。
[0105]
遗传算法中取一个个体，根据变异概率判断是否需要进行变异操作，如满足变异概率要求，则进行变异操作，变异概率公式为：
[0106][0107]
式中，pm为个体需要进行变异操作的概率；p
m1
、p
m2
是两个设定好的值，p
m1
＝0.1，p
m2
＝0.01；f
avg
是当代种的平均适应度值；f
max
是当代种的最大个体适应度值；f"是变异个体的适应度值。
[0108]
淘汰操作的概率设置为p
tt
＝0.1，得出需淘汰的个体数n
tt
，用第n
tt
个个体的值覆盖前面n
tt
个个体的值。
[0109]
假设：convmt预测模型输出的源荷组合预测的3组结果中的风电结果为(单位：mwh)：
[0110]
1001，895，1102，1233
[0111]
999，897，1101，1235
[0112]
1000，896，1100，1232
[0113]
风电的真实值为：1000，897，1102，1234
[0114]
在90分位数下，计算90min曲线结果时，pinball损失损失函数公式中的各参数为
[0115][0116]
n＝3，t＝4，α＝5％，y
i,1
＝1000，y
i,2
＝897，y
i,3
＝1102，y
i,4
＝1234。
[0117]
同时，假设通过遗传算法优化pinball损失后的权重分别为：
[0118]
0.32，0.34，0.32，0.33
[0119]
0.35，0.33，0.33，0.33
[0120]
0.33，0.33，0.35，0.32
[0121]
则最终的90min曲线对应点的结果4个数据分别为：
[0122]
0.32
×
1001+0.35
×
999+0.33
×
1000＝999.97
[0123]
0.34
×
895+0.33
×
897+0.33
×
896＝895.99
[0124]
0.32
×
1102+0.33
×
1101+0.35
×
1100＝1100.97
[0125]
0.33
×
1233+0.33
×
1235+0.34
×
1232＝1233.32
[0126]
其他概率预测曲线的计算方法同理。
[0127]
作为本发明的一种实施例，所述convmt预测模型的训练方法包括：
[0128]
步骤a：依据预设的时间间隔采集多组源荷历史数据及对应的气象数据，并根据所采集的数据构建原始数据集；
[0129]
时间间隔为预设时间，在本发明实施例中，数据采集的总时间长度可以为两年，时间间隔可以设置为1个小时。
[0130]
步骤b：对原始数据集进行预处理，获得多组完整可用的包含源荷历史数据及对应的气象数据的数据组合，形成样本集；
[0131]
对原始数据集进行预处理的方法同前文步骤二中记载方法相同，即包括异常值处理，以及对异常值处理后的数据进行归一化处理，使原始数据集中的数据线性变换到(1,2)范围内。
[0132]
步骤c：按照数据组合的采样时间将所述样本集划分为训练集和测试集，所述测试集中数据组合的采样时间均晚于所述训练集中数据组合的采样时间；
[0133]
以两年的采样时间总长度为例，训练集可以包含前23个月的源荷历史数据及对应的气象数据，测试集包括最后1个月的源荷历史数据及对应的气象数据。这样划分的目的在于采用训练集中的数据组合进行预测最后1个月的源荷组合概率时，可以将测试集中的源荷历史数据作为真实值对预测结果进行验证。
[0134]
步骤d：从训练集中选取多组数据组合分别输入至多个convmt预测模型中进行训练，获取多个训练后的convmt预测模型及对应的训练集源荷预测结果；
[0135]
作为本发明的一种实施例，用于训练convmt预测模型的数据组合可以使用bootstrap方法选取。bootstrap方法是一种统计估计方法，利用bootstrap方法从训练集中选取多组数据组合输入至convmt预测模型中进行训练，该方法不需要对convmt预测模型进行其他假设，也不需要添加新的观测值，具有鲁棒性强、效率高的特点。
[0136]
步骤e：将测试集中的源荷历史数据作为真实值，将同一时刻的训练集源荷预测结果作为预测值，根据真实值与预测值计算mape值；
[0137]
对于训练后的convmt预测模型得到的源荷预测结果，需要进一步优化，在本发明实施例中使用的是平均绝对百分比误差(mape)函数进行优化，mape值计算公式如下：
[0138][0139]
式中，为预测值，yi为真实值，m为convmt预测模型预测数据点的总个数。在预测中，一般认为mape值小于10时，对应的预测值精度较高，若存在某个真实值为0，mape就无法进行计算，因此，对于异常处理后的数据进行归一化处理，使源荷历史数据缩放到1至2之间，便于使用mape函数进行优化，来得到最终的预测结果，mape值可以用于评判最终预测结果的准确性。
[0140]
步骤f：以mape值最小为优化目标对convmt预测模型进行参数优化，获取最终训练好的convmt预测模型。
[0141]
训练过程中，采用测试集对预测结果进行验证时，若当前预测模型所得预测结果优于前次训练的得到的预测结果，则保存该预测模型参数，否则丢弃该预测模型。通过多次
训练后，选择在测试集数据中表现最好的预测模型作为最终的训练好的预测模型。
[0142]
如图3～5所示，是采用bootstrap方法从样本集中选取出20组数据组合对20个convmt预测模型进行训练，然后利用遗传优化算法对弹球损失函数进行优化，得到最终的概率预测结果。3张图中横坐标表示时间，单位为小时(h)；纵坐标依据预测数据种类的不同，分别为风电功率、光伏功率、负荷功率，单位为mwh；true曲线代表真实验证集的功率数据。90max和90min分别代表真实值落在90max和90min曲线之间区间的概率为90％时的上限与下限；在源荷组合概率预测结果中，90min曲线对应α＝5％的情况，90max曲线对应α＝95％的情况，60min曲线对应α＝20％的情况，60max曲线对应α＝80％的情况从图中可以看出，true曲线基本上可以被图中90分位点的最大功率值和最小功率值包围住，负荷预测图中的概率区间较窄。原因可能是负荷功率的不确定性小于新能源的不确定性。新能源发电受到天气因素的强烈影响，并随天气变化而发生巨大波动。光伏发电基本上取决于太阳辐射强度，不确定性相对较小，风力发电还受到风速和气压等因素的影响，不确定性更大。在实际预测过程中，由于气象因素的预测也具有很大的不确定性，会进一步加大预测产生的误差。这些因素的综合作用使得新能源发电具有很强的波动性和不规律性，增加了新能源预测的不确定性。虽然负荷也受到天气因素的影响，但影响程度没有那么大，总体负荷功率仍呈现出相对明确的规律性，所以相较之下负荷预测的结果比新能源预测的结果好。
[0143]
实施例二：
[0144]
本实施例提供一种源荷组合概率预测装置，所述装置包括：
[0145]
采集模块：用于采集源荷历史数据及对应的气象数据；
[0146]
预处理模块：用于对所述源荷历史数据及气象数据进行预处理，获得完整可用的数据组合；
[0147]
预测模块：用于将预处理后的数据组合输入至预构建并训练好的多个convmt预测模型中，获得多个源荷组合预测结果；
[0148]
获取模块：将各源荷组合预测结果与各自对应的权重相乘，并将乘积进行求和运算，获得最终的概率预测结果；
[0149]
其中，所述convmt预测模型是基于transformer模型构建、采用源荷历史数据及同时间尺度的气象数据训练获取的；具体而言，convmt预测模型是采用cnn特征提取模块替换transformer模型中编码器原有的多头注意力模块获取的。所述权重是以pinball损失函数最小为目标，通过遗传算法优化之后获取的。在优化获取所述权重时，预设的分位数需要预先输入至pinball损失函数中。
[0150]
本发明实施例提供的装置，还包括所述训练模块，所述训练模块包括：
[0151]
数据集构建单元：用于依据预设的时间间隔采集多组源荷历史数据及对应的气象数据，构建原始数据集；
[0152]
样本集形成单元：用于对原始数据集进行预处理，获得多组完整可用的包含源荷历史数据及对应的气象数据的数据组合，形成样本集；
[0153]
样本集划分单元：用于按照数据组合的采样时间将所述样本集划分为训练集和测试集，所述测试集中数据组合的采样时间均晚于所述训练集中数据组合的采样时间；
[0154]
训练单元：用于从训练集中选取多组数据组合分别输入至多个convmt预测模型中进行训练，获取多个训练后的convmt预测模型及对应的训练集源荷预测结果；
[0155]
mape值计算单元：用于将测试集中的源荷历史数据作为真实值，将同一时刻的训练集源荷预测结果作为预测值，根据真实值与预测值计算mape值；
[0156]
参数优化单元：用于以mape值最小为优化目标对convmt预测模型进行参数优化，获取最终训练好的convmt预测模型。
[0157]
本发明实施例所提供的源荷组合概率预测装置可执行本发明任意实施例所提供的源荷组合概率预测方法，具备执行方法相应的功能模块和有益效果。
[0158]
实施例三：
[0159]
本发明实施例还提供了一种源荷组合概率预测装置，包括处理器及存储介质；
[0160]
所述存储介质用于存储指令；
[0161]
所述处理器用于根据所述指令进行操作以执行实施例一所述方法的步骤。
[0162]
实施例四：
[0163]
本发明实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现实施例一所述方法的步骤。
[0164]
本领域内的技术人员应明白，本技术的实施例可提供为方法、系统、或计算机程序产品。因此，本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0165]
本技术是参照根据本技术实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0166]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0167]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0168]
以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明技术原理的前提下，还可以做出若干改进和变形，这些改进和变形也应视为本发明的保护范围。

技术特征：

1.一种源荷组合概率预测方法，其特征在于，包括：采集源荷历史数据及对应的气象数据；对所述源荷历史数据及气象数据进行预处理，获得完整可用的数据组合；将预处理后的数据组合输入至预构建并训练好的多个convmt预测模型中，获得多个源荷组合预测结果；将各源荷组合预测结果与各自对应的权重相乘，并将乘积进行求和运算，获得最终的源荷组合概率预测结果；其中，所述convmt预测模型是采用cnn特征提取模块替换transformer模型中编码器原有的多头注意力模块后，再采用源荷历史数据及同时间尺度的气象数据训练获取的；所述权重是以pinball损失函数最小为目标，通过遗传算法进行优化后获取的。2.根据权利要求1所述的源荷组合概率预测方法，其特征在于，所述convmt预测模型的训练方法包括：依据预设的时间间隔采集多组源荷历史数据及对应的气象数据；根据所采集的多组源荷历史数据及对应的气象数据构建原始数据集；对原始数据集进行预处理，获得多组完整可用的包含源荷历史数据及对应的气象数据的数据组合，形成样本集；按照数据组合的采样时间将所述样本集划分为训练集和测试集，所述测试集中数据组合的采样时间均晚于所述训练集中数据组合的采样时间；从训练集中选取多组数据组合分别输入至多个convmt预测模型中进行训练，获取多个convmt预测模型的训练集源荷预测结果；将测试集中的源荷历史数据作为真实值，将同一时刻的训练集源荷预测结果作为预测值，根据真实值与预测值计算mape值；以mape值最小为优化目标对convmt预测模型进行参数优化，获取最终训练好的convmt预测模型。3.根据权利要求1或2所述的源荷组合概率预测方法，其特征在于，所述预处理包括：对源荷历史数据及对应的气象数据进行异常值检测，若存在异常值，则采用邻近正常值代替所述异常值；对源荷历史数据及对应的气象数据处理异常数据后进行归一化处理，线性变换到(1，2)范围内。4.根据权利要求2所述的源荷组合概率预测方法，其特征在于，所述原始数据集是采用bootstrap方法从所采集的源荷历史数据及对应的气象数据中选取多组数据组合而构建的。5.根据权利要求1所述的源荷组合概率预测方法，其特征在于，所述pinball损失函数的表达式如下：式中：为pinball损失函数值；i为指示函数；α为在预设的分位数下源荷组合概率预测结果的分布函数；y
i,t
为负荷的真实值；为所求分位点；当时，即等价为平
均绝对误差，所求得的分位点即为中位数；n为样本个数；t为日前预测的输出长度。6.权利要求5所述的源荷组合概率预测方法，其特征在于，分布函数α的值通过下述方法确定：(1)α
nmax
+α
nmin
＝1(2)α
nmax-α
nmin
＝n％式中，α
nmax
为nmax曲线对应的α值，α
nmin
为nmin曲线对应的α值，n介于0-100之间，n％表示真实值落在nmin和nmax曲线之间的概率。7.根据权利要求1所述的源荷组合概率预测方法，其特征在于，所述源荷历史数据包括电网发电侧的风力发电量和光伏发电量、以及电网负荷侧的用电量；所述气象数据包括与源荷数据相关的温度、湿度、压强、辐照度和风速。8.根据权利要求1所述的源荷组合概率预测方法，其特征在于，所述cnn特征提取模块为3
×
3的cnn特征提取模块，相应的，所述convmt预测模型的编码器的输入采用13
×
72的数据矩阵，所述数据矩阵是由以下8种数据组成的13维矩阵：风电、光伏、负荷、压强、湿度、温度、风速、辐照度。9.一种源荷组合概率预测装置，其特征在于，包括：采集模块：用于采集源荷历史数据及对应的气象数据；预处理模块：用于对所述源荷历史数据及气象数据进行预处理，获得完整可用的数据组合；预测模块：用于将预处理后的数据组合输入至预构建并训练好的多个convmt预测模型中，获得多个源荷组合预测结果；获取模块：用于将各源荷组合预测结果与各自对应的权重相乘，并将乘积进行求和运算，获得最终的源荷组合概率预测结果；其中，所述convmt预测模型是采用cnn特征提取模块替换transformer模型中编码器原有的多头注意力模块后，再采用源荷历史数据及同时间尺度的气象数据训练获取的；所述权重是以pinball损失函数最小为目标，通过遗传算法进行优化后获取的。10.根据权利要求9所述的源荷组合概率预测装置，其特征在于，该装置还包括所述训练模块，所述训练模块包括：数据集构建单元：用于依据预设的时间间隔采集多组源荷历史数据及对应的气象数据，并根据所采集多组源荷历史数据及对应的气象数据构建原始数据集；样本集形成单元：用于对原始数据集进行预处理，获得多组完整可用的包含源荷历史数据及对应的气象数据的数据组合，形成样本集；样本集划分单元：用于按照数据组合的采样时间将所述样本集划分为训练集和测试集，所述测试集中数据组合的采样时间均晚于所述训练集中数据组合的采样时间；训练单元：用于从训练集中选取多组数据组合分别输入至多个convmt预测模型中进行训练，获取多个convmt预测模型的训练集源荷预测结果；mape值计算单元：用于将测试集中的源荷历史数据作为真实值，将同一时刻的训练集源荷预测结果作为预测值，根据真实值与预测值计算mape值；参数优化单元：用于以mape值最小为优化目标对convmt预测模型进行参数优化，获取最终训练好的convmt预测模型。
11.一种源荷组合概率预测装置，其特征在于，包括处理器及存储介质；所述存储介质用于存储指令；所述处理器用于根据所述指令进行操作以执行根据权利要求1～8任一项所述方法的步骤。12.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现权利要求1～8任一项所述方法的步骤。

技术总结

本发明公开了一种源荷组合概率预测方法、装置及存储介质，方法包括：采集源荷历史数据及对应的气象数据，并进行预处理，获得完整可用的数据组合；将预处理后的数据组合输入训练好的多个ConvMT预测模型中，获得多个预测结果；将各源荷组合预测结果与各自对应的权重相乘，并将乘积进行求和运算，获得最终的源荷组合概率预测结果；其中，所述ConvMT预测模型是采用CNN特征提取模块替换Transformer模型中编码器原有的多头注意力模块后，再采用源荷历史数据及同时间尺度的气象数据训练获取的；所述权重是以Pinball损失函数最小为目标，通过遗传算法进行优化后获取的。本发明可以增强源荷预测的准确性。荷预测的准确性。荷预测的准确性。