语音数据的处理方法、电子设备及存储介质与流程



1.本技术涉及计算机技术领域,尤其涉及语音数据的处理方法、电子设备及存储介质。


背景技术:



2.搭载有处理语音数据的深度学习模型的边缘端侧设备可以进行语音识别或声纹识别等工作,实现机器与人即时的沟通及身份识别等功能,处理语音数据的深度学习模型部署过程中需要较高的算力成本,在算力不充足的边缘设备上经常会遇到推理实时性较差的问题。
3.目前出现了使用winograd快速卷积算法来加速语音数据处理时卷积运算占据大部分时间的问题,通过用增加的加法运算次数替换减少的乘法运算次数,缩短卷积计算所需要的时间。
4.但winograd快速卷积算法在一些量化模型处理语音数据时,经常会发生数据计算溢出,影响深度学习模型的部署和语音数据的处理。


技术实现要素:



5.本技术旨在至少解决现有技术中存在的技术问题之一。为此,本技术提出一种语音数据的处理方法,防止语音数据的winograd快速卷积发生数据计算溢出。
6.根据本技术第一方面实施例的语音数据的处理方法,包括:
7.获取待处理的语音数据的输入量化特征权重变换矩阵
8.获取所述权重变换矩阵的权值公共因子;
9.基于所述权值公共因子,对所述权重变换矩阵中的权值进行取整处理,得到目标权重变换矩阵;
10.对所述输入量化特征和所述目标权重变换矩阵进行winograd变换和矩阵相乘处理,得到目标量化矩阵;
11.对所述目标量化矩阵进行winograd反变换;
12.基于所述权值公共因子,对所述目标量化矩阵的winograd反变换输出结果进行处理,得到所述语音数据的输出量化特征。
13.根据本技术实施例的语音数据的处理方法,通过权值公共因子对winograd变换前的权重变换矩阵和winograd反变换输出结果进行处理,调整量化模型的整型数据动态范围,有效防止数据计算溢出,提升语音数据的处理速度,加快语音数据处理相关深度学习模型的部署。
14.根据本技术的一个实施例,所述基于所述权值公共因子,对所述权重变换矩阵中的权值进行取整处理,得到目标权重变换矩阵,包括:
15.将所述权重变换矩阵中的权值乘以所述权值公共因子,得到所述目标权重变换矩阵。
16.根据本技术的一个实施例,所述基于所述权值公共因子,对所述目标量化矩阵的winograd反变换输出结果进行处理,得到所述语音数据的输出量化特征,包括:
17.将所述目标量化矩阵中最后一列和最后一行的winograd反变换输出结果除所述权值公共因子,得到所述输出量化特征。
18.根据本技术的一个实施例,所述目标量化矩阵的winograd反变换输出结果采用所述winograd反变换输出结果的两倍整数型数据格式存储。
19.根据本技术的一个实施例,所述对所述输入量化特征和所述目标权重变换矩阵进行winograd变换和矩阵相乘处理,得到目标量化矩阵,包括:
20.对所述输入量化特征和所述目标权重变换矩阵分别进行winograd变换,得到变换后特征矩阵和变换后权重矩阵;
21.将所述变换后特征矩阵和所述变换后权重矩阵按照批量矩阵乘法进行相乘,得到所述目标量化矩阵。
22.根据本技术的一个实施例,所述将所述变换后特征矩阵和所述变换后权重矩阵按照批量矩阵乘法进行相乘,得到所述目标量化矩阵,包括:
23.将所述变换后特征矩阵和所述变换后权重矩阵输入至添加第一参数的批量矩阵乘函数接口,得到所述批量矩阵乘函数接口输出的所述目标量化矩阵。
24.根据本技术的一个实施例,所述对所述输入量化特征和所述目标权重变换矩阵分别进行winograd变换,得到变换后特征矩阵和变换后权重矩阵,包括:
25.基于所述输入量化特征和所述输入量化特征的特征变换矩阵进行winograd变换,得到所述变换后特征矩阵;
26.基于所述变换后权重矩阵和量化卷积核进行winograd变换,得到所述变换后权重矩阵。
27.根据本技术第二方面实施例的语音数据的处理装置,包括:
28.第一获取模块,用于获取待处理的语音数据的输入量化特征和权重变换矩阵;
29.第二获取模块,用于获取所述权重变换矩阵的权值公共因子;
30.第一处理模块,用于基于所述权值公共因子,对所述权重变换矩阵中的权值进行取整处理,得到目标权重变换矩阵;
31.第二处理模块,用于对所述输入量化特征和所述目标权重变换矩阵进行winograd变换和矩阵相乘处理,得到目标量化矩阵;
32.第三处理模块,用于对所述目标量化矩阵进行winograd反变换;
33.第四处理模块,用于基于所述权值公共因子,对所述目标量化矩阵的winograd反变换输出结果进行处理,得到所述语音数据的输出量化特征。
34.根据本技术第三方面实施例的电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述任一种所述语音数据的处理方法。
35.根据本技术第四方面实施例的非暂态计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述语音数据的处理方法。
36.根据本技术第五方面实施例的计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述语音数据的处理方法。
37.本技术实施例中的上述一个或多个技术方案,至少具有如下技术效果之一:
38.通过权值公共因子对winograd变换前的权重变换矩阵和winograd反变换输出结果进行处理,调整量化模型的整型数据动态范围,有效防止数据计算溢出,提升语音数据的处理速度,加快语音数据处理相关深度学习模型的部署。
39.进一步的,将目标量化矩阵中最后一列和最后一行的winograd反变换输出结果除权值公共因子,调整目标量化矩阵的整型数据动态范围,防止winograd反变换输出的数据计算溢出。
40.更进一步的,目标量化矩阵的winograd反变换输出结果采用winograd反变换输出结果的两倍整数型数据格式存储,可以保持权值矩阵转换过程计算的正确性。
41.本技术的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本技术的实践了解到。
附图说明
42.为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
43.图1是本技术实施例提供的语音数据的处理方法的流程示意图之一;
44.图2是本技术实施例提供的语音数据的处理方法的流程示意图之二;
45.图3是本技术实施例提供的语音数据的处理方法的流程示意图之三;
46.图4是本技术实施例提供的语音数据的处理装置的结构示意图;
47.图5是本技术实施例提供的电子设备的结构示意图。
具体实施方式
48.下面结合附图和实施例对本技术的实施方式作进一步详细描述。以下实施例用于说明本技术,但不能用来限制本技术的范围。
49.在本技术实施例的描述中,需要说明的是,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
50.在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本技术实施例的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
51.下面结合图1至图3描述本技术实施例的语音数据的处理方法,该方法的执行主体可以为终端设备的控制器,或者云端,或者边缘服务器。
52.如图1所示,本技术实施例的语音数据的处理方法包括步骤110至步骤160。
53.步骤110、获取待处理的语音数据的输入量化特征和权重变换矩阵。
54.在该步骤中,可以将待处理的语音数据输入至语音处理模型的量化卷积层进行特征提取,获得待处理的语音数据所对应的输入量化特征和权重变换矩阵。
55.需要说明的是,一般模型内部的计算采用浮点数计算,浮点数的计算会消耗比较大的计算资源,在该实施例中,语音处理模型可以是进行语音数据处理的量化模型,采用整数型(int)的数据计算,大大减小消耗的计算资源。
56.在该实施例中,待处理的语音数据的输入量化特征是整数型的特征数据,在实际执行中,输入量化特征可以是8位整数型的数据,也即输入量化特征是int8量化后的数据。
57.可以理解的是,输入量化特征进行winograd快速卷积处理所使用的权重变换矩阵也可以是8位整数型的数据。
58.步骤120、获取权重变换矩阵的权值公共因子。
59.可以理解的是,输入量化特征进行卷积处理所需的多个权值按照对应的行和列排列,得到权重变换矩阵。
60.在该步骤中,获取权重变换矩阵的权值公共因子,也即获取权重变换矩阵中多个权值的公共因子。
61.需要说明的是,权重变换矩阵的权值可以为带小数的权值。
62.在实际执行中,可以采用最大似然法、主轴迭代法、加权最小二乘法、广义加权最小二乘法及最小残差法等提取公共因子的方法,获取权重变换矩阵的权值公共因子。
63.例如,权重变换矩阵g如下式
[0064][0065]
在该实施例中,获取的权重变换矩阵g的权值公共因子为24。
[0066]
步骤130、基于权值公共因子,对权重变换矩阵中的权值进行取整处理,得到目标权重变换矩阵。
[0067]
在该步骤中,根据权重变换矩阵的权值公共因子,将权重变换矩阵的进行取整处理,得到一个新的权重变换矩阵,也即目标权重变换矩阵。
[0068]
需要说明的,利用权值公共因子对权重变换矩阵的权值进行取整处理时,对权重变换矩阵内的所有权值进行相同的处理,仅将原先的权重变换矩阵的小数权值处理为整数权值,权重变换矩阵的权重分布情况不变。
[0069]
例如,利用权值公共因子24对权重变换矩阵g进行取整处理,得到目标权重变换矩阵g

,如下所示:
[0070][0071]
其中,权重变换矩阵g和目标权重变换矩阵g

均为6行3列的矩阵,权重变换矩阵g和目标权重变换矩阵g

的权重分布情况不变。
[0072]
在实际执行中,在语音处理模型的量化卷积层对输入量化特征和权重变换矩阵进行winograd快速卷积处理之前,设置数据预处理模块,利用权值公共因子实现对权重变换矩阵中的权值的取整处理。
[0073]
步骤140、对输入量化特征和目标权重变换矩阵进行winograd变换和矩阵相乘处理,得到目标量化矩阵。
[0074]
在该步骤中,对输入量化特征进行winograd变换,进行矩阵变换和数据重排,实现winograd快速卷积算法中的输入变换(input transform);对目标权重变换矩阵进行winograd变换,进行矩阵变换和数据重排,实现winograd快速卷积算法中的权值变换(filter transform)。
[0075]
将输入量化特征和目标权重变换矩阵进行winograd变换得到的矩阵进行矩阵相乘处理,可以通过批量矩阵乘法(batched-gemm)进行矩阵相乘,得到目标量化矩阵。
[0076]
步骤150、对目标量化矩阵进行winograd反变换。
[0077]
在该步骤中,对目标量化矩阵进行winograd反变换,进行数据重排和矩阵变换,实现winograd快速卷积算法中的输出变换(output transform)。
[0078]
步骤160、基于权值公共因子,对目标量化矩阵的winograd反变换输出结果进行处理,得到语音数据的输出量化特征。
[0079]
在实际执行中,在语音处理模型的量化卷积层对输入量化特征和目标权重变换矩阵进行批量矩阵相乘之后,设置数据后处理模块,利用权值公共因子实现winograd快速卷积算法中的输出变换时防止数据计算溢出。
[0080]
例如,输入量化特征可以是8位整数型的数据(int8),目标权重变换矩阵也是8位整数型的数据(int8)。
[0081]
将输入量化特征和目标权重变换矩阵进行winograd变换得到的矩阵进行矩阵相乘处理,执行int16*int16计算,对目标量化矩阵进行winograd反变换,是将目标量化矩阵中的数据转换为int16数据输出的过程。
[0082]
语音信号是幅度随时间连续变化的模拟信号,语音数据是由语音信号转换得到的时间和幅度均离散的数字信号,快速、高效地对语音数据进行操作,获得预期的结果,是语音数据处理的关键。
[0083]
在实际执行中,通过整数型的数据计算,可以减小消耗的计算资源,加快语音数据的处理速度。
[0084]
相关技术中,使用winograd快速卷积算法在量化模型处理语音数据时,语音数据中时间和幅度对应的整型数据的变化范围较大,量化模型的整型数据动态范围有限,经常会发生数据计算溢出,影响深度学习模型的部署和语音数据的处理。在该实施例中,通过权
值公共因子,对目标量化矩阵的winograd反变换的int16数据输出进行处理,调整量化模型的整型数据动态范围,有效防止数据计算溢出,得到最终输出的语音数据的输出量化特征。通过提取公共因子,实现防止数据溢出的winograd快速卷积算法,可有效的直接部署在实际生产环境中的语音处理模型,具体的加速部署的步骤如下所述:
[0085]
如图3所示,步骤一、部署加载语音处理模型。
[0086]
步骤二、判断语音处理模型的卷积层是否为量化卷积层,也即判断卷积层是否可以处理整数型的特征数据。
[0087]
步骤三、判断是否满足winograd快速卷积算法的加速条件。
[0088]
步骤四、根据输入量化特征的宽高,判断winograd快速卷积的输入量化特征的特征变换矩阵。
[0089]
步骤五、根据输入量化特征的宽高,确定输出结果的数量,选择对应的f(4x4,3x3)winograd int8的快速卷积或f(2x2,3x3)winograd int8的快速卷积。
[0090]
其中,f(4x4,3x3)winograd int8表示8位整数型数据使用winograd快速卷积算法,4x4表示输出结果为16个,3x3表示卷积层的卷积核为3x3卷积核。
[0091]
f(2x2,3x3)winograd int8表示8位整数型数据使用winograd快速卷积算法,2x2表示输出结果为4个,3x3表示卷积层的卷积核为3x3卷积核。
[0092]
下面介绍一个具体的实施例。
[0093]
在实现语音唤醒的语音处理模型的量化卷积层上设置数据预处理模块和数据后处理模块,部署于终端设备。
[0094]
进行winograd的快速卷积处理,可有效地解决语音唤醒推理时间过长,无法实时处理而导致语音数据丢帧的问题,例如,从发出“小美小美”的唤醒关键词指令到终端设备反馈“你说”,整个语音链路时延从18毫秒降低到9毫秒以内,语音处理模型整体推理性能提升了一倍。根据本技术实施例提供的语音数据的处理方法,通过权值公共因子对winograd变换前的权重变换矩阵和winograd反变换输出结果进行处理,调整量化模型的整型数据动态范围,有效防止数据计算溢出,提升语音数据的处理速度,加快语音数据处理相关深度学习模型的部署。
[0095]
上述语音数据的处理方法步骤130包括:
[0096]
将权重变换矩阵中的权值乘以权值公共因子,得到目标权重变换矩阵。
[0097]
在该实施例中,将权重变换矩阵中的所有权值均乘以该权重变换矩阵的权值公共因子,得到目标权重变换矩阵,目标权重变换矩阵中所有的权值均为整数。
[0098]
例如,权重变换矩阵g如下式
[0099][0100]
在该实施例中,获取的权重变换矩阵g的权值公共因子为24。
[0101]
将权重变换矩阵g的所有权值乘以权值公共因子24,得到目标权重变换矩阵g

,如下所示:
[0102][0103]
其中,0权值乘以权值公共因子后,仍然为0权值。
[0104]
相关技术中,通过将winograd变换前的权重变换矩阵的小数权值通过四舍五入转换为整数权值,这种方式会使权重变换矩阵的权重分布情况改变,降低winograd快速卷积处理的计算精度。
[0105]
在该实施例中,通过在进行winograd变换之前,将权重变换矩阵中不可整除的小数权值,通过乘以权值公共因子将小数权值预处理转换成相应的整数权值,权重变换矩阵中的所有权值均乘以权值公共因子,目标权重变换矩阵和权重变换矩阵的权重分布情况不变,保证winograd快速卷积处理的计算精度。
[0106]
上述语音数据的处理方法步骤160包括:
[0107]
将目标量化矩阵中最后一列和最后一行的winograd反变换输出结果除权值公共因子,得到输出量化特征。
[0108]
输入量化特征和目标权重变换矩阵进行批量矩阵相乘得到目标量化矩阵,目标量化矩阵内的数据进行winograd反变换,得到对应的winograd反变换输出结果。
[0109]
在目标量化矩阵中最后一列和最后一行输出winograd反变换输出结果前,将目标量化矩阵中最后一列和最后一行的winograd反变换输出结果除权值公共因子,调整目标量化矩阵的整型数据动态范围,防止winograd反变换输出的数据计算溢出。
[0110]
例如,输入量化特征可以是8位整数型的数据(int8),目标权重变换矩阵也是8位整数型的数据(int8)。
[0111]
将输入量化特征和目标权重变换矩阵进行winograd变换得到的矩阵进行矩阵相乘处理,执行int16*int16计算,对目标量化矩阵进行winograd反变换,是将目标量化矩阵中的数据转换为int16数据输出的过程。
[0112]
在目标量化矩阵的最后一列和最后一行转int16数据输出前,将最后一列和最后
一行的数据除权值公共因子,防止数据计算溢出,得到语音数据的输出量化特征。
[0113]
在该实施例中,目标量化矩阵的winograd反变换输出结果采用winograd反变换输出结果的两倍整数型数据格式存储。
[0114]
例如,输入量化特征和目标权重变换矩阵进行winograd变换得到的矩阵进行矩阵相乘处理,执行int16*int16计算,目标量化矩阵的winograd反变换输出结果采用int32的数据格式存储。
[0115]
其中,int32是int16的两倍整数型数据格式。
[0116]
在该实施例中,目标量化矩阵的winograd反变换输出结果是int16的计算结果,int16的计算结果使用int32数据格式来存储,可以保持权值矩阵转换过程计算的正确性。
[0117]
上述语音数据的处理方法步骤140包括:
[0118]
对输入量化特征和目标权重变换矩阵分别进行winograd变换,得到变换后特征矩阵和变换后权重矩阵;
[0119]
将变换后特征矩阵和变换后权重矩阵按照批量矩阵乘法进行相乘,得到目标量化矩阵。
[0120]
在该实施例中,对输入量化特征进行winograd变换,进行矩阵变换和数据重排,得到变换后特征矩阵,实现winograd快速卷积算法中的输入变换。
[0121]
在实际执行中,基于输入量化特征和输入量化特征的特征变换矩阵进行winograd变换,得到变换后特征矩阵。
[0122]
在该实施例中,对目标权重变换矩阵进行winograd变换,进行矩阵变换和数据重排,得到变换后权重矩阵,实现winograd快速卷积算法中的权值变换。
[0123]
在实际执行中,基于变换后权重矩阵和量化卷积核进行winograd变换,得到变换后权重矩阵。
[0124]
winograd快速卷积算法的计算公式如下:
[0125]
y=a
t
[[ggg
t
]

[b
t
db]]a
[0126]
其中,d为输入量化特征,g为量化卷积核,b为特征变换矩阵,g为权重变换矩阵,g为输出特征逆变换矩阵,y为经过winograd快速卷积计算之后的输出量化特征。
[0127]

为哈达玛积,表示矩阵对应位置相乘,变换后特征矩阵和变换后权重矩阵基于哈达玛积的矩阵运算方式实现批量矩阵相乘。
[0128]
在该实施例中,[ggg
t
]表示变换后权重矩阵,[b
t
db]表示变换后特征矩阵;a为输出特征逆变换矩阵,[[ggg
t
]

[b
t
db]]和a以及a
t
的计算过程为winograd反变换的输出过程。
[0129]
下面介绍一个具体的实施例。
[0130]
如图2所示,d为输入量化特征,g为量化卷积核,b为特征变换矩阵,g为权重变换矩阵。
[0131]
通过提取权重变换矩阵g的权值公共因子,进行矩阵参数预处理,将权重变换矩阵g中不可整除的小数权值,通过乘以权值公共因子将小数权值预处理转换成相应的整数权值,得到目标权重变换矩阵g


[0132]
基于输入量化特征d和输入量化特征d的特征变换矩阵b进行winograd变换,进行矩阵变化和数据重排,得到变换后特征矩阵。
[0133]
基于目标权重变换矩阵g

和为量化卷积核g进行winograd变换,进行矩阵变化和
数据重排,得到变换后权重矩阵。
[0134]
将变换后特征矩阵和变换后权重矩阵进行批量矩阵相乘,得到目标量化矩阵。
[0135]
对目标量化矩阵进行winograd反变换,进行数据重排,将目标量化矩阵中最后一列和最后一行的winograd反变换输出结果除权值公共因子,调整目标量化矩阵的整型数据动态范围,进行矩阵变换,得到输出量化特征y。
[0136]
在一些实施例中,将变换后特征矩阵和变换后权重矩阵输入至添加第一参数的批量矩阵乘函数接口,得到批量矩阵乘函数接口输出的目标量化矩阵。
[0137]
在该实施例中,进行变换后特征矩阵和变换后权重矩阵的批量矩阵相乘的处理时,将通常使用的批量矩阵乘函数接口中加入第一参数,也即在批量矩阵乘法(batched-gemm)的函数内部,把变换后特征矩阵和变换后权重矩阵的矩阵对应位置相乘的计算结果保存出去之前,先乘第一参数。
[0138]
可以理解的是,可在批量矩阵乘函数外部调用处,通过第一参数对矩阵索引进行判断,其中,对矩阵索引进行判断第一参数可以传入1或者权值公共因子,将权重变换矩阵进行取整的预处理过程中通过权值公共因子除掉的矩阵系数,在批量矩阵乘法计算时做逆运算添加回来。
[0139]
例如,输入量化特征可以是8位整数型的数据(int8),目标权重变换矩阵也是8位整数型的数据(int8)。
[0140]
将输入量化特征和目标权重变换矩阵进行winograd变换得到的矩阵进行矩阵相乘处理,执行int16*int16计算,在标准int16*int16批量矩阵乘函数接口添加第一参数,在批量矩阵乘法函数中,把int32的计算结果保存出去之前,先乘第一参数。
[0141]
下面对本技术实施例提供的语音数据的处理装置进行描述,下文描述的语音数据的处理装置与上文描述的语音数据的处理方法可相互对应参照。
[0142]
如图4所示,本技术实施例提供的语音数据的处理装置包括:
[0143]
第一获取模块410,用于获取待处理的语音数据的输入量化特征和权重变换矩阵;
[0144]
第二获取模块420,用于获取权重变换矩阵的权值公共因子;
[0145]
第一处理模块430,用于基于权值公共因子,对权重变换矩阵中的权值进行取整处理,得到目标权重变换矩阵;
[0146]
第二处理模块440,用于对输入量化特征和目标权重变换矩阵进行winograd变换和矩阵相乘处理,得到目标量化矩阵;
[0147]
第三处理模块450,用于对目标量化矩阵进行winograd反变换;
[0148]
第四处理模块460,用于基于权值公共因子,对目标量化矩阵的winograd反变换输出结果进行处理,得到语音数据的输出量化特征。
[0149]
根据本技术实施例提供的语音数据的处理装置,通过权值公共因子对winograd变换前的权重变换矩阵和winograd反变换输出结果进行处理,调整量化模型的整型数据动态范围,有效防止数据计算溢出,提升语音数据的处理速度,加快语音数据处理相关深度学习模型的部署。
[0150]
在一些实施例中,第一处理模块430用于将权重变换矩阵中的权值乘以权值公共因子,得到目标权重变换矩阵。
[0151]
在一些实施例中,第四处理模块460用于基将目标量化矩阵中最后一列和最后一
行的winograd反变换输出结果除权值公共因子,得到输出量化特征。
[0152]
在一些实施例中,目标量化矩阵的winograd反变换输出结果采用winograd反变换输出结果的两倍整数型数据格式存储。
[0153]
在一些实施例中,第二处理模块440用于对输入量化特征和目标权重变换矩阵分别进行winograd变换,得到变换后特征矩阵和变换后权重矩阵;
[0154]
将变换后特征矩阵和变换后权重矩阵按照批量矩阵乘法进行相乘,得到目标量化矩阵。
[0155]
在一些实施例中,第二处理模块440用于将变换后特征矩阵和变换后权重矩阵输入至添加第一参数的批量矩阵乘函数接口,得到批量矩阵乘函数接口输出的目标量化矩阵。
[0156]
在一些实施例中,第二处理模块440用于基于输入量化特征和输入量化特征的特征变换矩阵进行winograd变换,得到变换后特征矩阵;
[0157]
基于变换后权重矩阵和量化卷积核进行winograd变换,得到变换后权重矩阵。
[0158]
图5示例了一种电子设备的实体结构示意图,如图5所示,该电子设备可以包括:处理器(processor)510、通信接口(communications interface)520、存储器(memory)530和通信总线540,其中,处理器510,通信接口520,存储器530通过通信总线540完成相互间的通信。处理器510可以调用存储器530中的逻辑指令,以执行语音数据的处理方法,该方法包括:获取待处理的语音数据的输入量化特征和权重变换矩阵;获取权重变换矩阵的权值公共因子;基于权值公共因子,对权重变换矩阵中的权值进行取整处理,得到目标权重变换矩阵;对输入量化特征和目标权重变换矩阵进行winograd变换和矩阵相乘处理,得到目标量化矩阵;对目标量化矩阵进行winograd反变换;基于权值公共因子,对目标量化矩阵的winograd反变换输出结果进行处理,得到语音数据的输出量化特征。
[0159]
此外,上述的存储器530中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本技术各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0160]
进一步地,本技术还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各方法实施例所提供的语音数据的处理方法,该方法包括:获取待处理的语音数据的输入量化特征和权重变换矩阵;获取权重变换矩阵的权值公共因子;基于权值公共因子,对权重变换矩阵中的权值进行取整处理,得到目标权重变换矩阵;对输入量化特征和目标权重变换矩阵进行winograd变换和矩阵相乘处理,得到目标量化矩阵;对目标量化矩阵进行winograd反变换;基于权值公共因子,对目标量化矩阵的winograd反变换输出结果进行处理,得到语音数据的输出量化特征。
[0161]
另一方面,本技术实施例还提供一种非暂态计算机可读存储介质,其上存储有计
算机程序,该计算机程序被处理器执行时实现以执行上述各实施例提供的语音数据的处理方法,该方法包括:获取待处理的语音数据的输入量化特征和权重变换矩阵;获取权重变换矩阵的权值公共因子;基于权值公共因子,对权重变换矩阵中的权值进行取整处理,得到目标权重变换矩阵;对输入量化特征和目标权重变换矩阵进行winograd变换和矩阵相乘处理,得到目标量化矩阵;对目标量化矩阵进行winograd反变换;基于权值公共因子,对目标量化矩阵的winograd反变换输出结果进行处理,得到语音数据的输出量化特征。
[0162]
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
[0163]
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
[0164]
最后应说明的是:以上实施例仅用以说明本技术的技术方案,而非对其限制;尽管参照前述实施例对本技术进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本技术各实施例技术方案的精神和范围。
[0165]
以上实施方式仅用于说明本技术,而非对本技术的限制。尽管参照实施例对本技术进行了详细说明,本领域的普通技术人员应当理解,对本技术的技术方案进行各种组合、修改或者等同替换,都不脱离本技术技术方案的精神和范围,均应涵盖在本技术的权利要求范围中。

技术特征:


1.一种语音数据的处理方法,其特征在于,包括:获取待处理的语音数据的输入量化特征和权重变换矩阵;获取所述权重变换矩阵的权值公共因子;基于所述权值公共因子,对所述权重变换矩阵中的权值进行取整处理,得到目标权重变换矩阵;对所述输入量化特征和所述目标权重变换矩阵进行winograd变换和矩阵相乘处理,得到目标量化矩阵;对所述目标量化矩阵进行winograd反变换;基于所述权值公共因子,对所述目标量化矩阵的winograd反变换输出结果进行处理,得到所述语音数据的输出量化特征。2.根据权利要求1所述的语音数据的处理方法,其特征在于,所述基于所述权值公共因子,对所述权重变换矩阵中的权值进行取整处理,得到目标权重变换矩阵,包括:将所述权重变换矩阵中的权值乘以所述权值公共因子,得到所述目标权重变换矩阵。3.根据权利要求1所述的语音数据的处理方法,其特征在于,所述基于所述权值公共因子,对所述目标量化矩阵的winograd反变换输出结果进行处理,得到所述语音数据的输出量化特征,包括:将所述目标量化矩阵中最后一列和最后一行的winograd反变换输出结果除所述权值公共因子,得到所述输出量化特征。4.根据权利要求3所述的语音数据的处理方法,其特征在于,所述目标量化矩阵的winograd反变换输出结果采用所述winograd反变换输出结果的两倍整数型数据格式存储。5.根据权利要求1-4任一项所述的语音数据的处理方法,其特征在于,所述对所述输入量化特征和所述目标权重变换矩阵进行winograd变换和矩阵相乘处理,得到目标量化矩阵,包括:对所述输入量化特征和所述目标权重变换矩阵分别进行winograd变换,得到变换后特征矩阵和变换后权重矩阵;将所述变换后特征矩阵和所述变换后权重矩阵按照批量矩阵乘法进行相乘,得到所述目标量化矩阵。6.根据权利要求5所述的语音数据的处理方法,其特征在于,所述将所述变换后特征矩阵和所述变换后权重矩阵按照批量矩阵乘法进行相乘,得到所述目标量化矩阵,包括:将所述变换后特征矩阵和所述变换后权重矩阵输入至添加第一参数的批量矩阵乘函数接口,得到所述批量矩阵乘函数接口输出的所述目标量化矩阵。7.根据权利要求5所述的语音数据的处理方法,其特征在于,所述对所述输入量化特征和所述目标权重变换矩阵分别进行winograd变换,得到变换后特征矩阵和变换后权重矩阵,包括:基于所述输入量化特征和所述输入量化特征的特征变换矩阵进行winograd变换,得到所述变换后特征矩阵;基于所述变换后权重矩阵和量化卷积核进行winograd变换,得到所述变换后权重矩阵。8.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算
机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述语音数据的处理方法。9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至7任一项所述语音数据的处理方法。10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述语音数据的处理方法。

技术总结


本申请涉及计算机领域,提供一种语音数据的处理方法、电子设备及存储介质,该方法包括:获取待处理的语音数据的输入量化特征和权重变换矩阵;获取权重变换矩阵的权值公共因子;基于权值公共因子,对权重变换矩阵中的权值进行取整处理,得到目标权重变换矩阵;对输入量化特征和目标权重变换矩阵进行winograd变换和矩阵相乘处理,得到目标量化矩阵;对目标量化矩阵进行winograd反变换;基于权值公共因子,对目标量化矩阵的winograd反变换输出结果进行处理,得到语音数据的输出量化特征。该方法通过权值公共因子对winograd变换前的权重变换矩阵和winograd反变换输出结果进行处理,有效防止数据计算溢出。有效防止数据计算溢出。有效防止数据计算溢出。


技术研发人员:

丁维浩

受保护的技术使用者:

美的集团股份有限公司

技术研发日:

2022.06.29

技术公布日:

2022/10/11

本文发布于:2024-09-24 07:24:06,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/1/27833.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:矩阵   权重   所述   特征
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议