语音的质量评价方法

1.信噪比(Signal-to-Noise Ratio,SNR)
SNR一直是衡量针对宽带噪声失真的语音增强算的常规方法。但要计算信噪比必需知道纯净语音信号,但在实际应用中这是不可能的。因此,SNR主要用于纯净语音信号和噪声信号都是己知的算法的仿真中。 
信噪比计算整个时间轴上的语音信号与噪声信号的平均功率之比。
2.分段信噪比(Segment Signal-to-Noise Ratio,SegSNR)
由于语音信号是一种缓慢变化的短时平稳信号,因而在不同时间段上的信噪比也应不一样。为了改善上面的问题,可以采用分段信噪比。
3.PESQ(Perceptual Evaluation of Speech Quality) 
2001年2月,ITU-T推出了P.862 标准《窄带电话网络端到端语音质量和话音编解码器质量的客观评价方法》,推荐使用语音质量感知评价PESQ算法,该建议是基于输入-输出方式的典型
算法,效果良好。 
PESQ算法需要带噪的衰减信号和一个原始的参考信号。开始时将两个待比较的语音信号经过电平调整、输入滤波器滤波、时间对准和补偿、听觉变换之后, 分别提取两路信号的参数, 综合其时频特性, 得到PESQ分数, 最终将这个分数映射到主观平均意见分(MOS)。PESQ得分范围在-0.5--4.5之间。得分越高表示语音质量越好。
4.对数似然比测度(Log Likelihood Ratio Measure,LLR) 
坂仓距离测度是通过语音信号的线性预测分析来实现的。ISD基于两组线性预测参数(分别从原纯净语音和处理过的语音的同步帧得到)之间的差异。LLR可以看成一种坂仓距离(Itakura Distance,IS),但IS距离需要考虑模型增益。而LLR不考虑模型增益引起的幅度位移,更重视整体谱包络的相似度。
5.端粒的功能风险把控对数谱距离(log spectral distance,LSD)
    对数谱距离的定义
波西米亚
6.可短时客观可懂(Short-Time Objective Intelligibility,STOI)中华粉末冶金网
0-1范围,值越大,可懂度越高
7.加权谱倾斜测度(Weighted Spectral Slope,WSS)
WSS值越小说明扭曲越少,越小越好,范围
田野又是青纱帐
俄语论文网

本文发布于:2024-09-21 12:46:54,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/479969.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:语音   信号   质量   距离   评价
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议