一、语音识别技术工作过程:
1.取词:语音识别的第一步是读入语音信号,然后分析出语音中的词语,即取词。所谓取词,是指从语音信号中检测出声音特征边界处的词组,把该词语获得和存储,以便接下来的处理。 2.特征提取:语音识别系统需要对获得的语音信号进行处理,以提取出语音特征值,这一步称为特征提取。语音特征提取的过程主要是利用声学模型对语音信号进行分析,从而把语音信号转变成一系列可计算的数值特征,即语音特征值。
3.模型匹配:模型匹配是指根据语音识别系统构建的参考模型,将从输入的语音信号中提取出的语音特征与参考模型的特征进行比较,以确定输入的语音参数与参考模型相似程度的过程。语音系统
4.输出识别结果:通过上述步骤,识别系统选出了参考模型中与输入的语音参数最接近的模型,将参考模型的参数值作为输出的识别结果。
二、语音识别技术原理:
语音识别技术的原理基于信号处理技术,用于识别发音的语音,其原理是将输入的语音进行分析,并把它转换成具有特征的数字序列,然后与参考模型进行比较,从而判断出输入的语音到底是什么。
在语音识别过程中,将输入的语言转换成特征值,有以下几步:预处理、声学建模、语义分析、数字化以及矩阵操作等。
(1)预处理:语音信号通常由直流信号和抖动信号构成,一般需要去除直流信号,根据抖动信号的振幅和频率特性,通过波形分析、频谱分析、统计特性等方法,对语音进行特征分析。
(2)声学建模:声学建模是语音识别研究的核心,它是使用具有特定的声学参数构建参考模型的过程,在语音的特征提取过程中,需要使用描述语音的参数模型,它的作用是把输入的语音信号转换成数字参数,并将其存储到参考模型中。
(3)语义分析:语义分析主要是根据输入的语音信号及参考模型,通过统计技术与语言
学分析,对输入的语音信号进行分析,以确定输入语音的语义,从而为输入的语音语句到正确的含义。
(4)数字化:数字化是把输入的语音信号转换成表示语音各个特征的矢量的过程,此类矢量可以用来表示语音特征,而且便于计算机的运算处理。
(5)矩阵操作:矩阵操作是将输入的语音特征与参考模型的特征进行比较,确定输入的语音参数与参考模型相似程度的过程。