音源分离程序、音源分离方法以及音源分离装置

1.本发明涉及音源分离程序、音源分离方法以及音源分离装置。2.本技术基于2020年2月28日在美国临时申请的62/982，755提出，并要求其优先权，在此引入其内容。

背景技术

：
：：3.利用麦克风收音的信号多是音源信号与杂音信号混合成的混合信号。对于这样的混合信号，作为在没有音源方向等先验信息时推导音源信号的方法，已知有盲音源分离的方法。在盲音源分离中，对于混合信号使用分离矩阵w对音源进行分离。此处，在音源数是n个、麦克风数是m个时，分离矩阵w为n行×m列的矩阵。此处，用混合前的音源s与混合矩阵a的积表示所观测的信号x。并且，分离矩阵w是该混合矩阵a的逆矩阵a-1。作为求分离矩阵w的方法，例如有独立分量分析(ica：independentcomponentanalysis)、独立向量分析(iva：independentvectoranalysis)等。4.而且，作为进行盲音源分离的方法，近年来提出有使用辅助函数的auxica(辅助函数型独立分量分析，例如参照非专利文献1)，auxiva(辅助函数型独立向量分析，例如参照非专利文献2)等。5.在auxiva中，通过迭代最小化下式(1)的辅助函数q进行分离矩阵的推导。需要说明的是，在数学式中，大写粗体字母表示矩阵，小写粗体变量表示向量，普通小写变量表示标量。6.[数学式1][0007][0008]在式(1)中，k是音源信号的指数，f是表示频率的指数，f是频率的总数。wf＝(w1f……wkf)h是要推导的分离矩阵，m是音源数(＝麦克风数)，h是共轭转置。另外，vkf是利用ica，iva等方法通过不同的方法计算出的半正定矩阵。由于将式(1)关于分离矩阵wf进行最小化并不简单，auxiva使用下式(2)、下式(3)的更新式对行向量逐个依次更新。[0009][数学式2][0010][0011][数学式3][0012][0013]需要说明的是，在式(2)中，vkf是下式(4)。[0014][数学式4][0015][0016]其中，em是只有第m个元素为1且其他元素为0的k维单位向量。在此，称该方法为迭代投影(ip：iterativeprojection)。[0017]现有技术文献[0018]非专利文献[0019]非专利文献1：n.onoands.miyabe,“auxiliary-function-basedindependentcomponentanalysisforsuper-gaussiansources”,proc.lva/ica,vol.6365,no.6,pp.165-172,sep.2010.[0020]非专利文献2：n.ono,“stableandfastupdaterulesforindependentvectoranalysisbasedonauxiliaryfunctiontechnique”,inproc.ieeewaspaa,newpaltz,ny,usa,oct.2011,pp.189-192.技术实现要素：[0021]发明要解决的技术问题[0022]然而，在现有技术ip这样的方法中，存在随着麦克风数增加，式(2)中逆矩阵运算的计算成本增大的课题。[0023]本发明就是鉴于上述的问题点所作出的，其目的在于，提供不进行逆矩阵的计算而能够高速地进行音源分离的音源分离程序、音源分离方法以及音源分离装置。[0024]用于解决技术问题的方案[0025]为了达成上述目的，在本发明的一方案的音源分离程序中，使计算机执行：获取音响信号，将获取到的所述音响信号从时域转换到频域，对于转换到所述频域的音响信号，对分离矩阵进行基于初等行变换的更新并将包含分离向量的二次形式和所述分离矩阵的行列式在内的目标函数迭代最小化，从而进行音源分离。[0026]另外，在本发明的一方案的音源分离程序中，也可以是使所述计算机执行：按照每个频率f且在k＝1，……，m之间利用下式的基于所述初等行变换的转换式进行更新，[0027][数学式5][0028][0029]使用所述函数求解未知向量vkf＝(v1，……，vm)t(t表示转置，k是音源信号的编号即从1至麦克风数m的整数，f是表示频率的指数)，wf＝(w1f，……，wkf)h是分离矩阵，h是共轭转置，k是音源数，m是对所述音响信号进行收音的麦克风数，k＝m。[0030]另外，在本发明的一方案的音源分离程序中，也可以是使所述计算机执行：按照每个频率f，对分离矩阵wf乘以第k列确定为使所述函数最小化且第k列以外是单位矩阵的矩阵由此来对分离矩阵wf进行更新，通过反复进行所述更新处理来求解所述分离矩阵wf。[0031]另外，在本发明的一方案的音源分离程序中，也可以是所述函数是下式，[0032][数学式6][0033][0034]所述分离矩阵wf是(w1f……wkf)h，f是频率的总数，h是共轭转置，vkf是加权协方差矩阵。[0035]为了达成上述目的，本发明的一方案的音源分离方法包括：具备多个麦克风的收音部获取音响信号，音源分离部将获取到的所述音响信号从时域转换到频域，所述音源分离部对于转换到所述频域的音响信号，对分离矩阵进行基于初等行变换的更新并将包含分离向量的二次形式和所述分离矩阵的行列式在内的目标函数迭代最小化，从而进行音源分离。[0036]为了达成上述目的，本发明的一方案的音源分离装置包括：收音部，具备获取音响信号的多个麦克风；以及音源分离部，将获取到的所述音响信号从时域转换到频域，对于转换到所述频域的音响信号，对分离矩阵进行基于初等行变换的更新并将包含分离向量的二次形式和所述分离矩阵的行列式在内的目标函数迭代最小化，从而进行音源分离。[0037]发明效果[0038]根据本发明，不进行逆矩阵的计算而能够高速地进行音源分离。附图说明[0039]图1是示出盲音源分离处理的概要的图。[0040]图2是示出实施方式的音源分离装置的结构的一例的图。[0041]图3是用于说明基于初等行变换的更新的图。[0042]图4是用于说明了使用辅助函数的辅助系数法的概要的图。[0043]图5是示出实施方式的音源分离的iss算法的一例的图。[0044]图6是示出比较例的ip算法的图。[0045]图7是用于说明实施方式的更新的高效化的图。[0046]图8是用于模拟的房间的混响时间的直方图。[0047]图9是示出反复10m次后的sdr的图。[0048]图10是示出反复10m次后的sir的图。[0049]图11是示出每次反复运算时的图。具体实施方式[0050]以下，对本发明的实施方式一边参照附图一边进行说明。[0051](概要)[0052]首先，对实施方式的概要进行说明。图1是示出盲音源分离处理的概要的图。如图1那样地，在盲音源分离中，使用分离滤波器(分离矩阵)w，将分离音从混合音中分离。在本实施方式中，利用矩阵的秩(rank)1更新来进行分离矩阵w的计算，替代按照每个行向量更新。由此，在本实施方式中，能够实现盲音源分离的进一步高速化。[0053](音源分离装置的结构例)[0054]接下来，对音源分离装置的结构例进行说明。[0055]图2是示出本实施方式中音源分离装置1的结构的一例的图。如图2所示，音源分离装置1具备获取部11、音源分离部12以及输出部13。[0056]音源分离部12具备stft部121、分离部122以及逆stft部123。[0057](音源分离装置的动作)[0058]接下来，参照图1对音源分离装置1的动作进行说明。[0059]音源分离装置1将音源信号从麦克风2(收音部)收音到的混合信号中分离。需要说明的是，麦克风2是由多个麦克风构成的麦克风阵列。[0060]获取部11获取麦克风2输出的混合信号(音响信号)。获取部11将混合信号从模拟信号转换成数字信号，将转换后的混合信号输出到音源分离部12。[0061]音源分离部12可以是例如个人计算机、cpu(中央处理器)，dsp(数字信号处理装置)，asic(特定用途集成电路)等。[0062]stft部121利用短时傅里叶变换(short-timefouriertransform)将获取部11输出的混合信号从时域变换到频域。[0063]分离部122通过使辅助函数迭代最小化，替代对于短时傅里叶变换后的混合信号的分离矩阵w来进行音源分离。需要说明的是，关于辅助函数、处理算法等在后叙述。[0064]逆stft部123利用逆短时傅里叶变换，将分离部122分离出的频域的音源信号从频域转换到时域。[0065]输出部13将音源分离部12分离出的音源信号输出到外部装置(例如扬声器)。[0066](信号处理的例)[0067]接下来，对音源分离处置中的信号处理的例进行说明。[0068]需要说明的是，在以下例中，以auxiva(辅助函数型独立向量分析)为例进行说明，但不限于此。实施方式的分离矩阵的更新规则也能够适用于auxica(辅助函数型独立分量分析)，ilrma(独立低秩矩阵分析：independentlow-rankmatrix)等。[0069]混合有用m个麦克风收音的k个音源的混合音能够表示为下式(5)。需要说明的是，在实施方式中使用的数学式中，大写粗体字母表示矩阵，小写粗体变量表示向量，普通小写变量表示标量。[0070][数学式7][0071][0072]在式(5)中，x＾m[t]是第m个麦克风的信号，s＾k[t]是第k个音源信号，a＾mk[t]是麦克风信号与音源信号的脉冲响应。另外，星号表示卷积运算。在时域频域中，卷积成为每个频率的乘法运算，成为下式(6)这样。[0073][数学式8][0074][0075]在式(6)中，xmfn是将x＾m[t]短时傅里叶变换后的，skfn是将s＾k[t]短时傅里叶变换后的，amk[f]是将a＾mk[t]离散傅里叶变换后的。f(＝1，……，f)是离散频段，n(＝1，……，n)是频率的指数。需要说明的是，式(6)是在傅里叶变换比脉冲响应充分长时有效的近似值。当用向量将频率f下的麦克风信号与音源信号分组时，能够如下式(7)那样将麦克风信号表现为音源信号的线性混合。[0076][数学式9][0077]xfn＝afsfn...(7)[0078]在式(7)中，af是基于(af)mk＝amkf的混合矩阵。[0079]独立向量分析(iva：independentvectoranalysis)的目的是求出下式(8)中的分离矩阵wf(＝[w1f，……，wmf]h)。[0080][数10][0081]yfn＝wfxfn...(8)[0082]在式(8)中，yfn是分离信号。在iva中，假设信息源在统计上是独立的，假设音源信号的分布是球状的超高斯分布(p(sk1n，……，skfn)～e-g(√(σfskfn))，g是例如拉普拉斯函数g(r)＝r或柯西函数g(r)＝-log(1+r2/v))。在auxiva中，在这些假设的情况下通过迭代最小化下式(9)的辅助函数q而进行分离矩阵的推导。[0083][数学式11][0084][0085]换言之，式(9)是由分离向量的二次形式(第1项)与分离矩阵的行列式(第2项)形成的函数。需要说明的是，式(9)也可以包含其他项。另外，式(9)的第2项不限于行列式的对数，也可以是其他形式。[0086]另外，在式(9)中，vkf为下式(10)。[0087][数学式12][0088][0089]另外，在式(10)中是依赖于音源模型而确定的非线性函数，例如为另外，rkn为下式(11)。[0090][数学式13][0091][0092]在现有的auxiva等中，使用下式(12)、(13)逐个依次更新行向量。在以下的说明中，称这样的方法为ip(iterativeprojection：迭代投影)。[0093][数学式14][0094]wkf←(wfvkf)-1ek...(12)[0095][数学式15][0096][0097]在这样的ip法中，随着麦克风数增加，式(12)的逆矩阵运算的计算成本变大。[0098](本实施方式的iss方法)[0099]接下来，对本实施方式的方法进行说明。需要说明的是，本实施方式的方法也称为iss(iterativesourcesteering：迭代源控制)。[0100]在本实施方式中，替代按照每个行向量更新分离矩阵w，如下式(14)的那样进行基于初等行变换的更新求出分离矩阵w。需要说明的是，在基于初等行变换的更新中，按照每个频率f且在k＝1，……，m之间反复处理。[0101][数学式16][0102][0103]在式(14)中，vkf(＝(v1kf，……，vmkf)t(t表示转置)))是计算出的未知向量。[0104]图3用于说明基于初等行变换的更新的图。g101示出的区域是用于说明基于本实施方式的iss方法的更新的图。在实施方式中，对于分离矩阵wf(g103)，通过将第k列(g103)以外作为对角矩阵(g102)的矩阵左乘，进行基于初等行变换的更新。[0105]g111所示的区域是用于说明基于现有的ip方法的更新的图。在现有的ip方法中，进行分离矩阵第k行(g113)的更新。[0106]式(14)中的未知向量vkf的计算能够通过出将下式(15)的辅助函数q(vkf)最小化的vkf而进行。[0107][数学式17][0108][0109]在式(15)中当省略f时成为下式(16)这样。[0110][数学式18][0111][0112]在式(16)中，vm为下式(17)。[0113][数学式19][0114][0115]在式(15)、(16)中，星号*表示复共轭。[0116]需要说明的是，辅助函数q能够分割为对每个频率f的贡献，在以下的说明中省略频率指数f而进行标记。该最小化问题(下式(18))能够如下式(19)的那样求解。需要说明的是，式(18)的c是复数整体的集合。[0117][数学式20][0118][0119][数学式21][0120][0121]不省略f的情况成为下式(20)。[0122][数学式22][0123][0124]此处，当适用矩阵的行列式相关的定理是，成为下式(21)这样。[0125][数学式23][0126][0127]在式(16)中，当省去常数项时辅助函数q能够简化为下式(22)这样。[0128][数学式24][0129][0130]当对v＊mk取复素微分时，成为下式(23)这样。[0131][数学式25][0132][0133]通过使式(23)等于零，得到期望的结果。该更新式不包含逆矩阵运算。另外，只要注意ykn＝whkxn，更新所需要的量仅为下式(24)、(25)。需要说明的是，是依赖于音源模型而决定的非线性函数。[0134][数学式26][0135][0136][数学式27][0137][0138]在式(24)、(25)中，当不省略f时，成为下式(26)、(27)。[0139][数学式28][0140][0141][数学式29][0142][0143]在本实施方式中，能够不求出vm的全部元素而如式(24)、(25)的右边那样高效地计算。而且，由于右边的计算所需要的是yn，在本实施方式中，进行下式(28)的更新即可。[0144][数学式30][0145][0146]在式(28)中，当不省略f时成为下式(29)。[0147][数学式31][0148][0149]这些量对于m是必要的，由于各自需要n个运算，每次更新的总复杂度是o(mn)。需要说明的是，对每k个的更新，需要所有vk，且需要变更所有的解调滤波器。对此，在本实施方式中，每迭代时仅更新1次rkn即可。[0150]此处，对使用了辅助函数的辅助系数法的概要进行说明。[0151]在此，以函数j(θ)的最小化问题(j(θ)→min)为例进行说明。目标函数与辅助函数满足j(θ)＝minηq(θ，η)的关系。通过该关系，存在辅助变量η，其相对于任意的辅助变量η满足辅助函数q(θ，η)≥目标函数j(θ)，相对于任意的参数θ满足j(θ)＝q(θ，η)。而且，在辅助函数法中，对于参数θ与辅助变量η，利用下式(30)以及(31)将辅助函数交替进行最小化。需要说明的是，k是表示迭代次数的正整数。[0152][数学式32][0153][0154][数学式33][0155][0156]图3是用于说明使用了辅助函数的辅助系数法的概要的图。在图3中横轴为参数θ。[0157]式(26)是在当前推定值θ＝θ(k)下对成为等于目标函数j(θ)的辅助函数q(θ，η(k+1))进行计算的操作。另外，式(27)是将辅助函数q(θ，η(k+1))最小化的操作。而且，反复进行迭代处理，如图3那样地对参数进行更新并最小化。这样，辅助函数法是将满足j(θ)＝minηq(θ，η)而不是目标函数j(θ)的关系的辅助函数q(θ，η)迭代最小化的算法(参照参考文献1)。[0158]参考文献1：小野顺贵，“基于辅助函数法的最佳化算法及其在音响信号处理中的应用”，日本音响学会，日本音响学会志68卷11号，，2012，pp.566-571[0159](算法的说明)[0160]接下来，对本实施方式的音源分离的iss算法的一例进行说明。[0161]图5是示出本实施方式中音源分离的iss算法的一例的图。以所输入的混合信号为{xfn}，分离信号为{yfn}。[0162]从1至最大值反复进行以下处理(g201)。[0163]对于所有的k、n将√(σ|ykfn|)2代入rkn。[0164]对于k，从1至m反复进行处理(g202)。[0165]对于f，从1至f反复进行以下处理(g203)。[0166]将代入vmk(m＝k以外)，将代入vkk，对于所有n将(yfn-vkykfn)代入yfn。[0167]如图4那样地，在本实施方式中，既没有逆矩阵的计算顺序也没有协方差矩阵。计算量为o(fm2n)/反复。[0168](比较例：ip算法)[0169]此处，对前述的ip算法中的处理例进行说明。[0170]图6是示出比较例的ip算法的图。[0171]从1至最大值反复进行以下的处理(g901)。[0172]对于所有的k、n将√(σ|ykfn|)2代入rkn。[0173]对于k，从1至m反复进行处理(g902)。[0174]对于f，从1至f反复进行处理(g903)。[0175]将代入vkm，将{(wfvkf)-1ek}代入wkf，将{wkf/√(xhfnvkfwkf)}代入wkf，对所有的n将(xhfnwkf)代入yfn。[0176](ip算法与iss算法的计算量的比较)[0177]当比较图5与图6时，ip算法在g903的处理中包含计算分离矩阵wf的逆矩阵的处理。求出这样的逆矩阵的成本为o(m3)。另外，协方差矩阵的运算所需要的成本为o(m2n)。ip算法的总计算量为o(fm3n)/反复。[0178]图7是用于说明本实施方式的更新的高效化的图。[0179]auxiva-ip对分离矩阵w的行进行更新。对此本实施方式的iss算法对混合矩阵的列、即a＝w-1的第k个转向向量进行更新。在更新中，使用例如sherman-morrison的方法求出近似逆矩阵。与式(14)中的向w＝a-1的更新等价。例如下式(32)的那样，处理是使第k个转向向量变化相同的量。需要说明的是，混合矩阵a＝[a1，……，am]遵循音源的转向向量。[0180][数学式34][0181][0182]需要说明的是，向量ak+u是向量{1/(1-vkk)}ak与将向量{1/(1-vkk)}am乘vm倍后的向量{vm/(1-vkk)}am的和。另外，由于sherman-morrison式中w＝a-1，式(32)变为下式(33)这样。[0183][数学式35][0184][0185]已知通过将其与式(14)相同化，变为v＝wu(1+whku)-1。[0186]在式(32)中，通过其他源的转向向量的加权和更新第k个转向向量，然后，进行重新缩放。当m≠k时的系数vmk是将第m个音源推导值ym的噪声投影到yk的部分空间的系数，可表示为下式(34)这样。[0187][数学式36][0188][0189]由的性质可知中，第m个源为活动状态时变小，第m个源不为活动状态时变大。因此，在本实施方式中，对第k个转向向量修正与第m个转向向量成比例的量。需要说明的是，在本实施方式中，为了在迭代处理中维持信号的尺度需要进行缩放。[0190]利用该处理，例如分离为第一信号g311与其他信号g312。[0191]接下来，对ip算法与本实施方式的iss算法的比较结果例进行说明。[0192]ip算法中分离矩阵wf的第k个的行的更新的运算量受协方差矩阵vkf或线形系统的其中一方所支配。如上文所述，ip算法的运算量为o(m3)，iss算法的运算量为o(m2n)。[0193]在ip算法中，由于反复进行第m行的更新与f频带的更新，1次迭代的整体计算量cip为下式(35)，即至少为o(m4)。[0194][数学式37][0195]cip＝o(fm3max(m，n))...(35)[0196]在iss算法中，在m，k＝1，……，m时，每迭代时对式(19)与(21)进行计算。另外，rkn、n的计算在每迭代时具有o(fmn)的计算量。因此，每次迭代的整体计算量ciss为下式(36)。[0197][数学式38][0198]ciss＝o(fm2n)...(36)[0199]其中，iss算法的计算量中反复使用单一的协方差矩阵。另外，在线处理那样的n＝1的情况时的计算量是麦克风的数量的2次函数。[0200](验证结果)[0201]接下来，利用实验说明将比较例的ip算法与本实施方式的iss算法比较后的结果。[0202]首先，对实验环境进行说明。[0203]实验使用python(注册商标)包进行了如下的模拟。[0204]·使用具有6[m]至10[m]之间的墙壁的100个随机的长方形房间，天花板高在2.8[m]至4.5[m]。[0205]·室内声音的能量到达-60[db]之前的时间即混响时间(t60)为从60[ms]至540[ms]的范围。[0206]图8是用于模拟的房间的混响时间的直方图。横轴为混响时间rt60[ms]，纵轴为频率[khz]。[0207]音源与麦克风阵列随机地配置在离墙壁至少50[cm]的位置，配置在高度从1[m]至2[m]之间。麦克风阵列具有10个麦克风，为半径3.2[cm]圆形，麦克风的间隔为2[cm]。[0208]关于音源与麦克风阵列中心之间的距离，至少临界距离为dcrit＝0.057√(v＝t60)[m]。v为容积室。在第一麦克风中，使用将音源信号归一化后的单位功率。[0209]定义snr＝m/σ2n。σ2n是麦克风中的不相关白噪声的方差。snr固定在30[db]。对2、3、4、6、8、10的音源进行了分离。[0210]需要说明的是，音源数在麦克风数以下。采样频率为16[khz]，stft帧尺寸为256[ms]，半重叠。为了解析与合成，使用了基于汉明窗的匹配窗。在实验中，将比较例的auxiva-ip算法与本实施方式的iss算法分别反复10m(m为麦克风的数量)次并进行分离。分离后，将输出的尺度投影到第一麦克风进行重建。[0211]评价指数使用了信号失真比(sdr)与信号干扰比(sir)。对sdr与sir在分离前与分离后进行了测定。图9是示出反复10m[次]后的sdr的图。图10是示出反复10m[次]后的sir的图。在图9、10中，横轴为通道数，纵轴为改善量[db]。在图9、10中，附图标记g401是比较例的auxiva-ip算法的结果，附图标记g402是本实施方式的iss算法的结果。如图9、10的那样，使用本实施方式的iss算法后的结果与使用比较例的auxiva-ip算法后的结果相同。[0212]接下来，对分离的运算所需要的时间进行比较后的结果进行说明。[0213]图11是示出每次反复运算时的图。在图11中，横轴为通道，纵轴为每次反复的处理时间[ms]。在图11中，附图标记g451是比较例的auxiva-ip算法的结果，附图标记g452是本实施方式的iss算法的结果。在实验中，对1～17个音源进行了确认。需要说明的是，在时钟频率为3.3[ghz]且安装10核cpu(中央处理器)的工作站进行模拟。图11的结果示出1次反复的平均执行时间。[0214]如图11所示，与比较例相比本实施方式的iss算法中，音源数越增加运算所耗的时间越短。即比起比较例的auxiva-ip，本实施方式的iss算法能够减少运算成本。[0215]如上所述，在本实施方式中，将用于基于辅助函数法的独立向量分析的迭代源转向导入了音源分离。相对于比较例中auxiva-ip交替地更新解码向量，本实施方式中算法连续进行基于初等行变换的更新。由此，在本实施方式中，得到无逆矩阵的低计算复杂度的更新规则，能够得到稳定性且高速化速度，是重要的实用性的可理想安装的方法。本实施方式的方法为对某音源的转向向量更新与其他音源的残留杂音向音源部分空间的投影成比例的量。[0216]通过模拟结果可以确认本实施方式的方法对于音源分离是高效的，且能够削减计算成本。[0217]需要说明的是，上述的声音识别方法、程序、声音识别装置还能够适用于声音识别系统、远程会议系统、网络会议系统、智能扬声器、家电的语音输入接口、助听器、机器人听觉等。[0218]需要说明的是，也可以是通过将用于实现本发明中的音源分离部12的功能的全部或一部分的程序记录在计算机可读取的记录介质中，使计算机系统读入该记录介质中记录的程序并执行，来进行音源分离部12所进行的处理的全部或一部分。需要说明的是，此处所说的“计算机系统”包含os、外围设备等硬件。另外，“计算机系统”是还包含具备主页提供环境(或者显示环境)的www系统。另外，“计算机可读取记录介质”是指软盘、光磁盘、rom、cd-rom等可移动介质，内置于计算机系统中的硬盘等存储装置。而且“计算机可读取记录介质”是还包含如经由因特网等网络或电话线路等通信线路发送程序时的成为服务器或客户机的计算机系统内部的易失性存储器(ram)那样，将程序保持一定时间。[0219]另外，上述程序可以是由将该程序保存在存储装置等的计算机系统经由传送介质，或者通过传送介质中的传送波传送到其他计算机系统。此处，传送程序的“传送介质”是指因特网等网络(通信网)或电话线路等通信线路(通信线)那样的具有传送信息的功能的介质。另外，上述程序也可以用于实现前述功能的一部分。而且，也可以是以其与已记录在计算机系统的程序的组合能够实现前述功能的所谓的差分文件(差分程序)。[0220]以上，使用实施方式对本发明的具体实施方式进行了说明，但本发明不限于这样的实施方式，在不脱离本发明的主旨的范围内能够加以各种变形以及置换。[0221]附图标记说明[0222]1音源分离装置[0223]11获取部[0224]12音源分离部[0225]13输出部[0226]121stft部[0227]122分离部[0228]123逆stft部当前第1页12当前第1页12

技术特征：

1.一种音源分离程序，其特征在于，使计算机执行：获取音响信号，将获取到的所述音响信号从时域转换到频域，对于转换到所述频域的音响信号，对分离矩阵进行基于初等行变换的更新并将包含分离向量的二次形式和所述分离矩阵的行列式在内的目标函数迭代最小化，从而进行音源分离。2.根据权利要求1所述的音源分离程序，其特征在于，，使所述计算机执行：按照每个频率f且在k＝1，
……
，m之间利用下式的基于所述初等行变换的转换式进行更新，[数学式1]使用所述函数求解未知向量v
kf
＝(v1，
……
，v
m
)
t
，其中t表示转置，k是音源信号的编号即从1至麦克风数m的整数，f是表示频率的指数，w
f
＝(w
1f
，
……
，w
kf
)
h
是分离矩阵，h是共轭转置，k是音源数，m是对所述音响信号进行了收音的麦克风数，k＝m。3.根据权利要求1或2所述的音源分离程序，其特征在于，使所述计算机执行：按照每个频率f，对分离矩阵w
f
乘以第k列确定为使所述函数最小化且第k列以外是单位矩阵的矩阵由此来对分离矩阵w
f
进行更新，通过反复进行所述更新处理来求解所述分离矩阵w
f
。4.根据权利要求1至3中任一项所述的音源分离程序，，其特征在于，所述函数是下式，[数学式2]所述分离矩阵w
f
是(w
1f
……
w
kf
)
h
，f是频率的总数，，h是共轭转置，v
kf
是加权协方差矩阵。5.一种音源分离方法，其特征在于，包括：具备多个麦克风的收音部获取音响信号，音源分离部将获取到的所述音响信号从时域转换到频域，所述音源分离部对于转换到所述频域的音响信号，对分离矩阵进行基于初等行变换的更新并将包含分离向量的二次形式和所述分离矩阵的行列式在内的目标函数迭代最小化，从而进行音源分离。6.一种音源分离装置，其特征在于，包括：
收音部，具备获取音响信号的多个麦克风；以及音源分离部，将获取到的所述音响信号从时域转换到频域，对于转换到所述频域的音响信号，对分离矩阵进行基于初等行变换的更新并将包含分离向量的二次形式和所述分离矩阵的行列式在内的目标函数迭代最小化，从而进行音源分离。

技术总结

音源分离程序使计算机执行：获取音响信号，将获取到的音响信号从时域转换到频域，对于转换到频域的音响信号而言，进行对分离矩阵基于初等行变换的更新并将包含分离向量的二次形式和分离矩阵的行列式在内的目标函数迭代最小化，从而进行音源分离。从而进行音源分离。从而进行音源分离。

技术研发人员：

小野顺贵罗宾

受保护的技术使用者：

东京都公立大学法人

技术研发日：

2021.02.26

技术公布日：

2022/11/1

本文发布于:2024-09-22 20:22:33，感谢您对本站的认可！

本文链接：https://www.17tex.com/tex/3/18907.html

上一篇：音频处理方法、装置、存储介质及电子设备与流程

下一篇：语音识别方法、装置、系统、电子设备和存储介质与流程

标签：音源矩阵信号向量

留言与评论（共有 0 条评论）