现代语音信号处理之线性预测分析

现代语⾳信号处理之线性预测分析
线性预测分析
线性预测(Linear Prediction COding, LPC)可及精确地估计语⾳参数,其基本思想是⼀个语⾳的取样可⽤过去若⼲语⾳取样的线性组合来逼近。通过使得实际语⾳取样与LPC取样间差值的平⽅和最⼩,即进⾏LMS逼近,可决定唯⼀的⼀组预测系数。⽽他们就是线性组合中的加权系数。LPC⽤于语⾳信号处理,不仅有预测功能,⽽且提供了⼀个⾮常好的声道模型。利⽤其参数可以做很多如降低传输码率、解混响等。线性分析预测参数包括LPC、PARCOR以及LSP参数等多种。
线性预测分析的基本原理
LPC分析的基本原理是将被分析的信号⽤⼀个模型表⽰,即将信号看做⼀个模型的输出,这样就可以⽤模型参数描述信号。通常模型中只包含有限个极点⽽没有零点,此时系统函数为:
这种模型称为全极模型或AR模型。式中,各系数αi和增益G为模型参数,⽽αi是实数,称为LPC系数。这样信号可⽤有限数⽬参数构成的信号模型表⽰。LPC分析就是根据已知的信号s(n)对参数αi和G的估计。
线性预测的基本问题是由语⾳信号直接决定⼀组预测器系数,在使预测误差在某个准则下最⼩,若采⽤LSME准则,就得到著名的LPC算法。
对于⿐⾳和摩擦⾳,声学理论表明,声道传输函数既有极点⼜有零点。如模型阶数O⾜够⼤,可⽤全极点模型⾦斯表⽰极零点模型。因为⼀个零点可以⽤多个极点近似,即:
如分母多项式收敛⾜够快,只要取前⼏项就可以,所以全极点模型为实际应⽤提供了合理近似。
根据上述模型化思想,可对语⾳信号建⽴模型,如下图所⽰,其中将声门激励、声道及辐射的全部谱效应简化为⼀个时变数字滤波器来等效,其系统函数为H(z):
语音系统对于语⾳信号,确定了LPC系数后,根据H(z)可得到其频率特性的估值,即LPC谱:
LPC谱的特点为:对浊⾳信号谐波成分处匹配效果要远好于谐波之间,这有LMSE准则决定,因⽽其反应的是谱包络。LPC谱可以很好的表⽰共振峰结构,⽽不出现⼆外的峰值和起伏。但当不满⾜全极模
型假设是,如信号收到噪声污染,那LPC谱的质量也将下降。对LPC参数数字化时,应采取抗混叠措施。
在建⽴线性预测⽅程组时需要采⽤逆滤波法将原模型的⾮线性⽅程转化为线性的,根据LMS准则,线性预测过程就是到⼀组预测系数,使得σ2e最⼩。LPC标准⽅程为:
其中
即由P个⽅程组成的有P个未知数的⽅程组,求解⽅程可得α^i。Φ(j,i)由输⼊语⾳决定。
短时预测均⽅误差En为:
因⽽最⼩均⽅误差由⼀个固定分量以及⼀个依赖于预测系数的分量组成。对应线性预测增益为G=√En。
为求解最佳预测器系数,需先计算Φ(i,j),再按LPC标准⽅程求出α^i。因⽽从原理上LPC分析⾮常直接了当,但计算Φ(i,j)及⽅程组的求解都⼗分复杂。常⽤的线性预测分析揭发有⾃相关和协⽅差法、格型法等。
线性预测分析的应⽤
LPC谱估计
LPC系数可认为是⼀个全极点滤波器系统函数分母多项式的系数,⽽该系统是声道响应、声门脉冲形状及抠⿐辐射的综合模拟。给定⼀组预测期系数喉,可得到全极点线性滤波器的频率特性。其频率特性曲线会在共振峰频率去出现峰值,因此LPC可以看做⼀种短时谱估计法。可以证明,若信号的s(n)为P阶AR模型,则:
式中,H(ejw)是模型H(z)的频率特性,简称为LPC谱。S为信号谱, |S(ejw)|2为其功率谱。因为语⾳信
号并⾮AR模型,因此H只能是S的⼀个估计,但⼜因为⼀个零点可⽤⽆穷多个极点逼近,即极零模型可以⽤⽆穷⾼阶全极点模型逼近。因此,尽管语⾳信号作为ARMA(⾃动滑动平均)模型即零点模型,但只要阶数P⾜够⼤,总能⽤全极点模型谱以⼈⼀笑的误差逼近语⾳信号谱。基于以上讨论,参数P可有效控制所得谱的平滑度。下图给出不同阶数P的LPC谱。显然,P增加时更多的谱细节被保存。因为⽬的是只得到声门脉冲、声道辐射组合效应谱,因⽽P的选择应使得共振峰谐振点及⼀般普形状得以保持。P的选取原则是:保证有⾜够的极点模拟声道谐振结构。通常其在10以上时,短时谱的显著峰值部分基本可反映出来。
LPC复倒谱
LPC系数是线性预测分析的基本参数,可以将这些系数转换为其他参数,以得到语⾳的其他代替表⽰⽅法。LPC系数可表⽰为LPC模型系统冲激响应的复倒谱。
设由LPC得到的声道模型系统函数为:
设其单位冲击响应为h(n),则:
⽽后就可以按照求复倒谱的公式,求h(n)的复倒谱h^(n),该复倒谱称为LPC复倒谱。LPC复倒谱分析的最⼤优点是运算量⼩,仅为FFT⽤最⼩相位信号法求复倒谱的⼀半。LPC复倒谱系数也成为LPCC,是语⾳识别中常⽤的特征⽮量。
总结⼀下,为估计语⾳信号的短时包络谱,已有三种⽅法:
由LPC系数估计。
由LPCC估计。
先⽤最⼩相位信号法求复倒谱,再⽤低复倒谱窗取出短时包络信息。该⽅法⽤波形直接计算得到倒谱。为了与LPCC相区别,也成为FFT倒谱。
线谱对(LSP)分析
线谱对分析是⼀种频域参数分析⽅法,这种LPC⽅法求解的模型参数为线谱对(LSP, Line Spectrum Pair)。LSP在数学上等价于其他LPC 参数,如αi。如将声道视为由P+1段声管级联⽽成,则LSP表⽰声门完全开启或完全闭合下声管的谐振频率。它也可以⽤于估计语⾳的基本特性。因为其为频域参数,因⽽与语⾳信号的谱包络的峰联系更为密切。同事LSP有良好的量化和差值特性,因⽽在LPC声码器中得到应⽤。⽬前,表⽰LPC参数最有效的⽅式为LSP,它的⼀些特性⽐其他系数更有吸引⼒。
LPC分析与格型法分析类似,也是以全极点模型为基础。线谱对分析的基本出发点是通过两个z变换P(z)和Q(z),将A(z)(误差传递函数)的P 个零点映射到单位圆上,以使这些零点直接⽤频率w反应,⽽P(z)和Q(z)各提供P/2个零点频率。LSP参数的求解有代数⽅程式求根和DFT ⽅法等。
Ref
现代语⾳信号处理[胡航 电⼦⼯业出版社] 第六章 线性预测分析

本文发布于:2024-09-24 14:34:06,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/1/355545.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:模型   预测   信号   线性   系数
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议