一种池化结构设计方法、装置、电子设备及存储介质与流程



1.本发明涉及神经网络领域,特别涉及一种池化结构设计方法、装置、电子设备及计算机可读存储介质。


背景技术:



2.池化为人工神经网络中重要的算子,可以降低特征图的尺寸,并保持某种不变性,例如旋转、平移、伸缩等。相关技术中,传统计算机处理池化运算的效率较低,不利于提升神经网络的运算效率。


技术实现要素:



3.本发明的目的是提供一种池化结构设计方法、装置、电子设备及计算机可读存储介质,可使用mzi(mach

zehnder interferometer,马赫曾德尔干涉仪)构建的级联结构实现池化功能,能够依靠光运算效率高的优势提升池化运算效率,进而可提升神经网络的运算效率。
4.为解决上述技术问题,本发明提供一种池化结构设计方法,包括:
5.获取mzi及其对应的传输矩阵,将所述mzi的左分光器和右分光器间的分光比调整为预设分光比,并利用所述预设分光比对所述传输矩阵进行变形;
6.将所述mzi的移相器对应的相位值调整为预设相位值,并利用变形后的传输矩阵及所述预设相位值确定所述mzi的输入端与输出端之间的转换表达式
7.利用所述转换表达式及目标池化运算表达式,确定所述mzi的级联结构,以使所述级联结构实现所述目标池化运算表达式对应的池化功能。
8.可选地,所述移相器为镀有金属薄膜的波导材料。
9.可选地,所述将所述mzi的两个移相器对应的相位值调整为预设相位值,包括:
10.通过施加外部电压改变镀有金属薄膜的波导材料的折射率的方式将所述mzi的两个移相器对应的相位值调整为预设相位值。
11.可选地,所述将所述mzi的两个移相器对应的相位值调整为预设相位值,包括:
12.通过等离子体弥散效应和电光效应改变镀有金属薄膜的波导材料的折射率的方式将所述mzi的两个移相器对应的相位值调整为预设相位值。
13.可选地,所述预设分光比为50:50,所述利用所述预设分光比对所述传输矩阵进行变形,包括:
14.所述传输矩阵为:
[0015][0016]
其中,r1和r2分别表示所述左分光器和所述右分光器的反射率,t1和t2均为中间参数,i表示虚数,e表示指数,θ和φ分别表示所述mzi的输入端至输出端方向上顺序排列的两个移相器的相位值;当所述预设分光比为50:50时,所述u
bs2
(r2)和所述u
bs1
(r1)变换为如下形式:
[0017][0018]
利用所述u
bs2
(r2)和所述u
bs1
(r1)变换后的表达式以及欧拉公式对所述传输矩阵进行变形,得到:
[0019][0020]
可选地,所述θ和所述φ对应的预设相位值依次为和所述利用变形后的传输矩阵及所述预设相位值确定所述mzi的输入端与输出端之间的转换表达式,包括:
[0021]
利用所述变形后的传输矩阵确定所述mzi的第一输入端、第二输入端和第一输出端、第二输出端的转换关系:
[0022][0023]
其中,l1、l2、l1′
、l2′
分别表示所述第一输入端、所述第二输入端、所述第一输出端和所述第二输出端;基于欧拉公式对所述转换关系中的输出端l1′
进行变形,得到所述第一输入端、所述第二输入端和所述第一输出端之间的初始转换表达式:
[0024][0025]
将和带入所述初始转换表达式,得到所述第一输入端、所述第二输入端和所述第一输出端之间的转换表达式:
[0026][0027]
可选地,所述目标池化运算表达式为其中n
×
n为池化核的尺寸,xi为池化层输入神经元,y为池化层输出神经元;基于所述第一输入端、所述第二输入端和所述第一输出端之间的转换表达式及所述目标池化运算表达式确定的级联结构包括:第一级至第2m级mzi组;第一级mzi组包含2m个mzi,第m级至第2m级mzi组分别包含1个mzi,其他级mzi组包含的mzi数量均为上一级mzi组中mzi数量的一半;第一级至第m-1级mzi组中,每个mzi组的mzi被俩俩划分至一个子组,第一级至第m-1级mzi组中每个mzi组的子组的两个第一输出端分别与下一级mzi组中对应的mzi的第一输入端和第二输入端一一对应连接,第m级至第2m-1级mzi组中每个mzi的第一输出端均与下一级mzi组中对应的mzi的第一输入端连接;第一级mzi组中所有mzi的输入端与需要进行池化的数据一一对应,第2m级mzi组的第一输出端为对输入的各数据进行池化所得结果的输出端。
[0028]
本发明还提供一种池化结构设计装置,包括:
[0029]
变形模块,用于获取mzi及其对应的传输矩阵,将所述mzi的左分光器和右分光器间的分光比调整为预设分光比,并利用所述预设分光比对所述传输矩阵进行变形;
[0030]
转换表达式确定模块,用于将所述mzi的移相器对应的相位值调整为预设相位值,并利用变形后的传输矩阵及所述预设相位值确定所述mzi的输入端与输出端之间的转换表达式;
[0031]
级联结构确定模块,用于利用所述转换表达式及目标池化运算表达式,确定所述mzi的级联结构,以使所述级联结构实现所述目标池化运算表达式对应的池化功能。
[0032]
本发明还提供一种电子设备,包括:
[0033]
存储器,用于存储计算机程序;
[0034]
处理器,用于执行所述计算机程序时实现如上所述池化结构设计方法的步骤。
[0035]
本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,所述计算机程序被处理器执行时实现如上所述池化结构设计方法的步骤。
[0036]
本发明提供一种池化结构设计方法,包括:获取mzi及其对应的传输矩阵,将所述
mzi的左分光器和右分光器间的分光比调整为预设分光比,并利用所述预设分光比对所述传输矩阵进行变形;将所述mzi的移相器对应的相位值调整为预设相位值,并利用变形后的传输矩阵及所述预设相位值确定所述mzi的输入端与输出端之间的转换表达式;利用所述转换表达式及目标池化运算表达式,确定所述mzi的级联结构,以使所述级联结构实现所述目标池化运算表达式对应的池化功能。
[0037]
可见,本发明首先可获取mzi及其对应的传输矩阵,并可将mzi的左分光器和右分光器间的分光比调整为预设分光比,进而根据这一预设分光比对mzi的传输矩阵进行首轮变形;随后,本发明还可对mzi的移相器对应的相位值调整为预设相位值,并基于这一预设相位值对上述传输矩阵进行又一轮变形,得到mzi的输入端与输出端之间的转换表达式;最后,本发明将根据这一转换表达式以及目标池化运算表达式确定所述mzi的级联结构,以使所述级联结构实现所述目标池化运算表达式对应的池化功能,即可使用mzi构建的级联结构实现池化功能,能够依靠光运算效率高的优势提升池化运算效率,进而可提升神经网络的运算效率。本发明还提供一种池化结构设计装置、电子设备及计算机可读存储介质,具有上述有益效果。
附图说明
[0038]
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
[0039]
图1为本发明实施例所提供的一种池化结构设计方法的流程图;
[0040]
图2为本发明实施例所提供的一种mzi的示意图;
[0041]
图3为本发明实施例所提供的一种mzi二级级联的示意图;
[0042]
图4为本发明实施例所提供的一种mzi级联结构的示意图;
[0043]
图5为本发明实施例所提供的一种池化结构设计装置的结构框图。
具体实施方式
[0044]
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0045]
池化为人工神经网络中重要的算子,可以降低特征图的尺寸,并保持某种不变性,例如旋转、平移、伸缩等。相关技术中,传统计算机处理池化运算的效率较低,不利于提升神经网络的运算效率。有鉴于此,本发明可提供一种池化结构设计方法,可利用mzi(mach

zehnder interferometer,马赫曾德尔干涉仪)构建级联结构,以利用该级联结构实现池化功能,进而可依靠光运算效率高的优势提升池化运算效率,并可提升神经网络的运算效率。请参考图1,图1为本发明实施例所提供的一种池化结构设计方法的流程图,该方法可以包括:
[0046]
s101、获取mzi及其对应的传输矩阵,将mzi的左分光器和右分光器间的分光比调
整为预设分光比,并利用预设分光比对传输矩阵进行变形。
[0047]
mzi是一种可用于光计算的干涉仪,其具体结构如图2所示,其中该图中的l1和l2表示mzi的两个输入端,l1′
和l2′
表示mzi的两个输出端,θ和φ分别表示mzi的输入端至输出端方向上顺序排列的两个移相器,同时θ和φ也可以表示这两个移相器具体对应的相位值。mzi的传输矩阵具体为如下形式:
[0048][0049]
其中u
mzi
表示mzi,bs1、bs2分别表示左分光器和右分光器,r1和r2分别表示左分光器和右分光器的反射率,t1和t2均为中间参数,i表示虚数,e表示指数。在本发明实施例中,为了对上述传输矩阵进行简化,可首先将mzi中的两个分光器的分光比调整为预设分光比,进而可基于这一预设分光比对传输矩阵进行初步简化。需要说明的是,本发明实施例并不限定具体的预设分光比,可根据实际应用需求进行设定。优选地,上述预设分光比可以为50:50,此时利用预设分光比对传输矩阵进行变形的步骤,可以包括:
[0050]
传输矩阵为:
[0051][0052]
其中,r1和r2分别表示左分光器和右分光器的反射率,t1和t2均为中间参数,i表示虚数,e表示指数,θ和φ分别表示mzi的输入端至输出端方向上顺序排列的两个移相器的相位值;当预设分光比为50:50时,u
bs2
(r2)和u
bs1
(r1)变换为如下形式:
[0053][0054]
利用u
bs2
(r2)和u
bs1
(r1)变换后的表达式以及欧拉公式将传输矩阵进行变形,得到:
[0055][0056]
其中欧拉公式又可称为欧拉定理。应当说明的是,本发明实施例并不限定利用u
bs2
(r2)和u
bs1
(r1)变换后的表达式以及欧拉公式将传输矩阵进行变形的具体过程,可参考相关的数学转化方法。当然,可以理解的是,当预设分光比为其他值时,u
bs2
(r2)和u
bs1
(r1)可能具有其他形式,此时u
mzi
也可能会被简化变形为其他形式,可根据实际应用需求进行设定。
[0057]
s102、将mzi的移相器对应的相位值调整为预设相位值,并利用变形后的传输矩阵及预设相位值确定mzi的输入端与输出端之间的转换表达式。
[0058]
在本发明实施例中,mzi的两个移相器可具有可编程功能。换句话说,可将这两个移相器对应的相位值进行任意调整。也正是如此,本发明实施例可将mzi的两个移相器的相位值均调整为预设相位值,并基于这一预设相位值对上述传输矩阵进行再次简化,以得到mzi的输入端与输出端之间形式更加简单的转换表达式,并基于该表达式确定可实现池化运算的mzi级联结构。需要说明的是,本发明实施例并不限定上述两个移相器具体对应的预设相位值,可根据实际应用需求进行设定。优选地,θ和φ对应的预设相位值可以依次为和利用变形后的传输矩阵及预设相位值确定mzi的输入端与输出端之间的转换表达式,可以包括:
[0059]
利用变形后的传输矩阵确定mzi的第一输入端、第二输入端和第一输出端、第二输出端的转换关系:
[0060][0061]
其中,l1、l2、l1′
、l2′
分别表示第一输入端、第二输入端、第一输出端和第二输出端;基于欧拉公式对转换关系中的输出端l1′
进行变形,得到第一输入端、第二输入端和第一输出端之间的初始转换表达式:
[0062]
[0063]
将和带入初始转换表达式,得到第一输入端、第二输入端和第一输出端之间的转换表达式:
[0064][0065]
换句话说,在本发明实施例最终构造的级联结构中,仅会使用mzi的输入端l1、输入端l2与输出端l1′
进行运算。当然,可以理解的是,当θ和φ设置有其他预设相位值时,上述输入端l1、输入端l2与输出端l1′
间的转化表达式也可以为其他形式。
[0066]
进一步,需要说明的是,本发明实施例并不限定移相器的具体实现方式,为实现编程功能,上述两个移相器均可以为镀有金属薄膜的波导材料。此时,将移相器的相位值调整为预设相位值的具体方式,既可以为通过施加外部电压改变镀有金属薄膜的波导材料的折射率以实现相移,也可以通过等离子体弥散效应和电光效应改变镀有金属薄膜的波导材料的折射率以实现相移,即可在一段波导材料上镀上金属薄膜,通过施加外部电压控制金属薄膜加热导致波导温度变化来改变折射率,实现相移,也可以利用等离子体弥散效应(改变电子和空穴的浓度)和电光效应改变波导折射率来引入相移,从而以上述简便有效的方式实现移相器。
[0067]
在一种可能的情况中,将mzi的两个移相器对应的相位值调整为预设相位值,可以包括:
[0068]
通过施加外部电压改变镀有金属薄膜的波导材料的折射率的方式将mzi的两个移相器对应的相位值调整为预设相位值。
[0069]
在一种可能的情况中,将mzi的两个移相器对应的相位值调整为预设相位值,可以包括:
[0070]
通过等离子体弥散效应和电光效应改变镀有金属薄膜的波导材料的折射率的方式将mzi的两个移相器对应的相位值调整为预设相位值。
[0071]
s103、利用转换表达式及目标池化运算表达式,确定mzi的级联结构,以使级联结构实现目标池化运算表达式对应的池化功能。
[0072]
相关技术中,常见的池化方法包括最大池化和平均池化,其中平均池化为计算池化核中神经元的平均值作为输出。平均池化中的一次运算可以表示为:
[0073][0074]
其中n
×
n为池化核的尺寸,xi为池化层输入神经元,y为池化层输出神经元,当n=4时,池化层中的一次运算可以表示为:
[0075]
y=(x1+x2+

+x
16
)/16
[0076]
基于上述第一输入端、第二输入端与第一输出端之间的转换表达式,可首先对mzi进行二级级联。如图3所示,其中l1、l2表示第一级mzi组中的第一mzi的第一输入端和第二输入端,l1′
表示第一mzi的第一输出端;l3、l4表示第一级mzi组中的第二mzi的第一输入端和第二输入端,l3′
表示第一mzi的第一输出端,l1′
和l3′
分别与第二级mzi组的mzi的第一输入
端和第二输入端相连,l
″1表示第二级mzi组的mzi的输出端;与各mzi的第二输出端相连,表示丢弃。上述二级级联的数学表达式为:
[0077][0078]
以此类推,级联四级最终的输出l

为:
[0079][0080]
其中,l1~l
16
表示第一级mzi组中各mzi的输入端;后面再级联四个单输入mzi,可得到:
[0081][0082]
可见,mzi级联可实现多个输入求均值,进而通过对mzi进行级联即可实现4*4池化操作中的16个数求均值的运算。mzi的级联结构如图4所示,其中该结构用到19个mzi,l1~l
16
表示输入端,l

表示最终的输出端,l

的实部为l1~l
16
的平均值。另外也可以基于单个mzi通过控制输入来实现上述结构的双端口mzi部分,如下表所示,总共分为四层,第i层的输出作为第i+1层的输入,其中表示第i层的第j个光信号,通过控制模块将输入依次送入mzi,暂存mzi的输出并作为下一层的输入,最终的输出后面的四个单端口mzi也可以基于同一个mzi通过控制模块串行实现。
[0083][0084]
值得指出的是,该神经网络池化架构可以扩展到不同尺寸的池化运算,例如当实现2
×
2的平均池化时,层数为2,第一层输入2组,第二层输入1组,最后经过两次单端口mzi
即可。下面对mzi级联结构的一般形式进行介绍:
[0085]
在一种可能的情况中,目标池化运算表达式为其中n
×
n为池化核的尺寸,xi为池化层输入神经元,y为池化层输出神经元;基于第一输入端、第二输入端和第一输出端之间的转换表达式及目标池化运算表达式确定的级联结构包括:第一级至第2m级mzi组;第一级mzi组包含2m个mzi,第m级至第2m级mzi组分别包含1个mzi,其他级mzi组包含的mzi数量均为上一级mzi组中mzi数量的一半;第一级至第m-1级mzi组中,每个mzi组的mzi被俩俩划分至一个子组,第一级至第m-1级mzi组中每个mzi组的子组的两个第一输出端分别与下一级mzi组中对应的mzi的第一输入端和第二输入端一一对应连接,第m级至第2m-1级mzi组中每个mzi的第一输出端均与下一级mzi组中对应的mzi的第一输入端连接;第一级mzi组中所有mzi的输入端与需要进行池化的数据一一对应,第2m级mzi组的第一输出端为对输入的各数据进行池化所得结果的输出端。
[0086]
为便于理解子组以及mzi间的层级关系,同样请参考图4,其中由虚线框1所围出的两个mzi即为第一级mzi组中的一个子组,而由虚线框2所围出的两个mzi即为第二级mzi组中的一个子组,剩余的子组及层级设置情况以此类推。本发明实施例基于mzi实现人工神经网络中的池化操作,实验证明,不仅易于控制,可以省去光电转换带来的额外消耗,并且所需mzi数量较少,映射方法较准确,具有明显的速度、功耗和面积优势。需要说明的是,上述m值可根据常规池化核的尺寸进行设置,例如m可以为2或4。
[0087]
基于上述实施例,本发明首先可获取mzi及其对应的传输矩阵,并可将mzi的左分光器和右分光器间的分光比调整为预设分光比,进而根据这一预设分光比对mzi的传输矩阵进行首轮变形;随后,本发明还可对mzi的移相器对应的相位值调整为预设相位值,并基于这一预设相位值对上述传输矩阵进行又一轮变形,得到mzi的输入端与输出端之间的转换表达式;最后,本发明将根据这一转换表达式以及目标池化运算表达式确定所述mzi的级联结构,以使所述级联结构实现所述目标池化运算表达式对应的池化功能,即可使用mzi构建的级联结构实现池化功能,能够依靠光运算效率高的优势提升池化运算效率,进而可提升神经网络的运算效率。
[0088]
下面对本发明实施例提供的池化结构设计装置、电子设备及计算机可读存储介质进行介绍,下文描述的池化结构设计装置、电子设备及计算机可读存储介质与上文描述的池化结构设计方法可相互对应参照。
[0089]
请参考图5,图5为本发明实施例所提供的一种池化结构设计装置的结构框图,该装置可以包括:
[0090]
变形模块501,用于获取mzi及其对应的传输矩阵,将mzi的左分光器和右分光器间的分光比调整为预设分光比,并利用预设分光比对传输矩阵进行变形;
[0091]
转换表达式确定模块502,用于将mzi的移相器对应的相位值调整为预设相位值,并利用变形后的传输矩阵及预设相位值确定mzi的输入端与输出端之间的转换表达式;
[0092]
级联结构确定模块503,用于利用转换表达式及目标池化运算表达式,确定mzi的级联结构,以使级联结构实现目标池化运算表达式对应的池化功能。
[0093]
可选地,移相器为镀有金属薄膜的波导材料。
[0094]
可选地,变形模块501,可以包括:
[0095]
第一相位值调整子模块,用于通过施加外部电压改变镀有金属薄膜的波导材料的折射率的方式将mzi的两个移相器对应的相位值调整为预设相位值。
[0096]
可选地,变形模块501,可以包括:
[0097]
第二相位值调整子模块,用于通过等离子体弥散效应和电光效应改变镀有金属薄膜的波导材料的折射率的方式将mzi的两个移相器对应的相位值调整为预设相位值。
[0098]
可选地,预设分光比为50:50,变形模块501,可以包括:变形子模块,用于:
[0099]
传输矩阵为:
[0100][0101]
其中,r1和r2分别表示左分光器和右分光器的反射率,t1和t2均为中间参数,i表示虚数,e表示指数,θ和φ分别表示mzi的输入端至输出端方向上顺序排列的两个移相器的相位值;当预设分光比为50:50时,u
bs2
(r2)和u
bs1
(r1)变换为如下形式:
[0102][0103]
利用u
bs2
(r2)和u
bs1
(r1)变换后的表达式以及欧拉公式对传输矩阵进行变形,得到:
[0104][0105]
可选地,θ和φ对应的预设相位值依次为和转换表达式确定模块502,可以包括:转换表达式确定子模块,用于:
[0106]
利用变形后的传输矩阵确定mzi的第一输入端、第二输入端和第一输出端、第二输出端的转换关系:
[0107][0108]
其中,l1、l2、l1′
、l2′
分别表示第一输入端、第二输入端、第一输出端和第二输出端;基于欧拉公式对转换关系中的输出端l1′
进行变形,得到第一输入端、第二输入端和第一输出端之间的初始转换表达式:
[0109][0110]
将和带入初始转换表达式,得到第一输入端、第二输入端和第一输出端之间的转换表达式:
[0111][0112]
可选地,目标池化运算表达式为其中n
×
n为池化核的尺寸,xi为池化层输入神经元,y为池化层输出神经元;基于第一输入端、第二输入端和第一输出端之间的转换表达式及目标池化运算表达式确定的级联结构包括:第一级至第2m级mzi组;第一级mzi组包含2m个mzi,第m级至第2m级mzi组分别包含1个mzi,其他级mzi组包含的mzi数量均为上一级mzi组中mzi数量的一半;第一级至第m-1级mzi组中,每个mzi组的mzi被俩俩划分至一个子组,第一级至第m-1级mzi组中每个mzi组的子组的两个第一输出端分别与下一级mzi组中对应的mzi的第一输入端和第二输入端一一对应连接,第m级至第2m-1级mzi组中每个mzi的第一输出端均与下一级mzi组中对应的mzi的第一输入端连接;第一级mzi组中所有mzi的输入端与需要进行池化的数据一一对应,第2m级mzi组的第一输出端为对输入的各数据进行池化所得结果的输出端。
[0113]
本发明实施例还提供一种电子设备,包括:
[0114]
存储器,用于存储计算机程序;
[0115]
处理器,用于执行计算机程序时实现如上述的池化结构设计方法的步骤。
[0116]
由于电子设备部分的实施例与池化结构设计方法部分的实施例相互对应,因此电子设备部分的实施例请参见池化结构设计方法部分的实施例的描述,这里不再赘述。
[0117]
本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计
算机程序,计算机程序被处理器执行时实现上述任意实施例的池化结构设计方法的步骤。
[0118]
由于计算机可读存储介质部分的实施例与池化结构设计方法部分的实施例相互对应,因此存储介质部分的实施例请参见池化结构设计方法部分的实施例的描述,这里不再赘述。
[0119]
说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
[0120]
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
[0121]
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(ram)、内存、只读存储器(rom)、电可编程rom、电可擦除可编程rom、寄存器、硬盘、可移动磁盘、cd-rom、或技术领域内所公知的任意其它形式的存储介质中。
[0122]
以上对本发明所提供的一种池化结构设计方法、装置、电子设备及存储介质进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。

技术特征:


1.一种池化结构设计方法,其特征在于,包括:获取mzi及其对应的传输矩阵,将所述mzi的左分光器和右分光器间的分光比调整为预设分光比,并利用所述预设分光比对所述传输矩阵进行变形;将所述mzi的移相器对应的相位值调整为预设相位值,并利用变形后的传输矩阵及所述预设相位值确定所述mzi的输入端与输出端之间的转换表达式;利用所述转换表达式及目标池化运算表达式,确定所述mzi的级联结构,以使所述级联结构实现所述目标池化运算表达式对应的池化功能。2.根据权利要求1所述的池化结构设计方法,其特征在于,所述移相器为镀有金属薄膜的波导材料。3.根据权利要求2所述的池化结构设计方法,其特征在于,所述将所述mzi的两个移相器对应的相位值调整为预设相位值,包括:通过施加外部电压改变镀有金属薄膜的波导材料的折射率的方式将所述mzi的两个移相器对应的相位值调整为预设相位值。4.根据权利要求2所述的池化结构设计方法,其特征在于,所述将所述mzi的两个移相器对应的相位值调整为预设相位值,包括:通过等离子体弥散效应和电光效应改变镀有金属薄膜的波导材料的折射率的方式将所述mzi的两个移相器对应的相位值调整为预设相位值。5.根据权利要求1至4任一项所述的池化结构设计方法,其特征在于,所述预设分光比为50:50,所述利用所述预设分光比对所述传输矩阵进行变形,包括:所述传输矩阵为:其中,r1和r2分别表示所述左分光器和所述右分光器的反射率,t1和t2均为中间参数,i表示虚数,e表示指数,θ和φ分别表示所述mzi的输入端至输出端方向上顺序排列的两个移相器的相位值;当所述预设分光比为50:50时,所述u
bs2
(r2)和所述u
bs1
(r1)变换为如下形式:利用所述u
bs2
(r2)和所述u
bs1
(r1)变换后的表达式以及欧拉公式对所述传输矩阵进行变形,得到:
6.根据权利要求5所述的池化结构设计方法,其特征在于,所述θ和所述φ对应的预设相位值依次为和所述利用变形后的传输矩阵及所述预设相位值确定所述mzi的输入端与输出端之间的转换表达式,包括:利用所述变形后的传输矩阵确定所述mzi的第一输入端、第二输入端和第一输出端、第二输出端的转换关系:其中,l1、l2、l1′
、l2′
分别表示所述第一输入端、所述第二输入端、所述第一输出端和所述第二输出端;基于欧拉公式对所述转换关系中的输出端l1′
进行变形,得到所述第一输入端、所述第二输入端和所述第一输出端之间的初始转换表达式:将和带入所述初始转换表达式,得到所述第一输入端、所述第二输入端和所述第一输出端之间的转换表达式:7.根据权利要求6所述的池化结构设计方法,其特征在于,所述目标池化运算表达式为其中n
×
n为池化核的尺寸,x
i
为池化层输入神经元,y为池化层输出神经元;基于所述第一输入端、所述第二输入端和所述第一输出端之间的转换表达式及所述目标池化运算表达式确定的级联结构包括:第一级至第2m级mzi组;第一级mzi组包含2m个mzi,第m级至第2m级mzi组分别包含1个mzi,其他级mzi组包含的mzi数量均为上一级mzi组中mzi数
量的一半;第一级至第m-1级mzi组中,每个mzi组的mzi被俩俩划分至一个子组,第一级至第m-1级mzi组中每个mzi组的子组的两个第一输出端分别与下一级mzi组中对应的mzi的第一输入端和第二输入端一一对应连接,第m级至第2m-1级mzi组中每个mzi的第一输出端均与下一级mzi组中对应的mzi的第一输入端连接;第一级mzi组中所有mzi的输入端与需要进行池化的数据一一对应,第2m级mzi组的第一输出端为对输入的各数据进行池化所得结果的输出端。8.一种池化结构设计装置,其特征在于,包括:变形模块,用于获取mzi及其对应的传输矩阵,将所述mzi的左分光器和右分光器间的分光比调整为预设分光比,并利用所述预设分光比对所述传输矩阵进行变形;转换表达式确定模块,用于将所述mzi的移相器对应的相位值调整为预设相位值,并利用变形后的传输矩阵及所述预设相位值确定所述mzi的输入端与输出端之间的转换表达式;级联结构确定模块,用于利用所述转换表达式及目标池化运算表达式,确定所述mzi的级联结构,以使所述级联结构实现所述目标池化运算表达式对应的池化功能。9.一种电子设备,其特征在于,包括:存储器,用于存储计算机程序;处理器,用于执行所述计算机程序时实现如权利要求1至7任一项所述池化结构设计方法的步骤。10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述池化结构设计方法的步骤。

技术总结


本发明提供一种池化结构设计方法、装置、电子设备及存储介质,涉及神经网络领域,方法包括:获取MZI及其对应的传输矩阵,将MZI的左分光器和右分光器间的分光比调整为预设分光比,并利用预设分光比对传输矩阵进行变形;将MZI的移相器对应的相位值调整为预设相位值,并利用变形后的传输矩阵及预设相位值确定MZI的输入端与输出端之间的转换表达式;利用转换表达式及目标池化运算表达式,确定MZI的级联结构,以使级联结构实现目标池化运算表达式对应的池化功能;可使用MZI构建的级联结构实现池化功能,能够依靠光运算效率高的优势提升池化运算效率,进而可提升神经网络的运算效率。进而可提升神经网络的运算效率。进而可提升神经网络的运算效率。


技术研发人员:

黄萍 吴睿振 陈静静 王凛

受保护的技术使用者:

山东云海国创云计算装备产业创新中心有限公司

技术研发日:

2022.09.16

技术公布日:

2022/12/26

本文发布于:2024-09-24 18:20:27,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/4/49307.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:所述   相位   表达式   移相器
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议