首页 > 学术百科

语音的质量评价方法

1.信噪比(Signal-to-Noise Ratio，SNR)

SNR一直是衡量针对宽带噪声失真的语音增强算的常规方法。但要计算信噪比必需知道纯净语音信号，但在实际应用中这是不可能的。因此，SNR主要用于纯净语音信号和噪声信号都是己知的算法的仿真中。

信噪比计算整个时间轴上的语音信号与噪声信号的平均功率之比。

2.分段信噪比(Segment Signal-to-Noise Ratio，SegSNR)

由于语音信号是一种缓慢变化的短时平稳信号，因而在不同时间段上的信噪比也应不一样。为了改善上面的问题，可以采用分段信噪比。

3.PESQ(Perceptual Evaluation of Speech Quality)

2001年2月，ITU-T推出了P.862 标准《窄带电话网络端到端语音质量和话音编解码器质量的客观评价方法》,推荐使用语音质量感知评价PESQ算法，该建议是基于输入-输出方式的典型

算法，效果良好。

PESQ算法需要带噪的衰减信号和一个原始的参考信号。开始时将两个待比较的语音信号经过电平调整、输入滤波器滤波、时间对准和补偿、听觉变换之后, 分别提取两路信号的参数, 综合其时频特性, 得到PESQ分数, 最终将这个分数映射到主观平均意见分(MOS)。PESQ得分范围在-0.5--4.5之间。得分越高表示语音质量越好。

4.对数似然比测度（Log Likelihood Ratio Measure,LLR）

坂仓距离测度是通过语音信号的线性预测分析来实现的。ISD基于两组线性预测参数(分别从原纯净语音和处理过的语音的同步帧得到)之间的差异。LLR可以看成一种坂仓距离（Itakura Distance,IS），但IS距离需要考虑模型增益。而LLR不考虑模型增益引起的幅度位移，更重视整体谱包络的相似度。

5.端粒的功能风险把控对数谱距离（log spectral distance，LSD）

对数谱距离的定义

波西米亚

6.可短时客观可懂(Short-Time Objective Intelligibility,STOI)中华粉末冶金网

0-1范围，值越大，可懂度越高

7.加权谱倾斜测度(Weighted Spectral Slope,WSS)

WSS值越小说明扭曲越少，越小越好，范围

田野又是青纱帐

俄语论文网

本文发布于:2024-09-21 12:46:54，感谢您对本站的认可！

本文链接：https://www.17tex.com/xueshu/479969.html

上一篇：一种译码处理的方法及译码处理装置[发明专利]

下一篇：信道编解码（1）BCC编码_Viterbi译码

标签：语音信号质量距离评价

留言与评论（共有 0 条评论）