基于国产语音专用芯片的新型识别模组设计及空调应用

Articles
论文
基于国产语音专用芯片的新型识别模组设计
及空调应用
Design and application of a new recognition module based on domestic
蝶形螺丝voice chip
毛跃辉文皓
MAOYuehui WEN Hao
洙海格力电器股份有限公司广东涞海519070
Zhuhai Gree 日ectric Appliance Co., Ltd. Zhuhai 519070
摘要:设计了一款基于国产物联网操作系统,且搭载国产专用语音芯片及轻量级Wi-Fi芯片的新型语音模
组。通过合理的选用电子元器件和语音模组的外围电路设计,使语音模组的硬件资源得到充分利用,在降低成本的同时,最大程度上保障语音系统的高效识别性能。根据语音模组自身硬件特征定制语音识别算法,确保满足产品语音识别性能所需。因语音模组的低成本、低功耗、高性能等特点,使其在家用电器领域易于广泛应用。
关键词:国产语音芯片:物联网操作系统:前端降噪:语音性能:空调应用
Abstract: Designs a new voice module based on the domestic Internet of things operating system and equipped with domestic dedicated voice chip and lightweight Wi-Fi chip. Through the reasonable selection of electronic components and the peripheral circuit design of voice module, the hardware resources of voice module can be fully utilized, and the efficient recognition performance of voice system can be guaranteed as much a s possible while reducing the cost. The speech recognition algorithm is customized according to the hardware characteristics of the speech module to ensure that it can meet the needs of the product speech recognition performance. Because of its low cost, low power consumption and high performance, voice module is easy to be widely used in the field of household appliances.
Keywords: Domestic voice chip; Internet of things operating; Front end noise reduction; Voice performance; Air conditioning application
中图分类号:TN912; TM925.12 DOI: 10.19784/jki.issn 1672-0172.2021.03.007
i引言
随着人工智能技术的逐渐成熟,“语音识别”将会是人与机器最 自然的交互方式,语音控制的空调产品化将有助于提升空调产品的 竞争力,形成技术制高点,领先市场竞品。通过调研目前市场上己经 在售的语音智能单品,发现目前行业普遍采用的语音识别方案是基 于通用主控芯片并搭载Linux系统、Wi-H模块,解决方案硬件成本高 并且自主可控性差,制约着未来千亿量级物联网终端的规模化应用。为了实现语音方案低成本、低功耗、数据可靠、高性能的目标,本文提 出一种基于国产物联网操作系统的专用国产芯片和国产Wi-fi芯片的 轻量级语音异构AI计算平台。完全国产化的产品,将来能够支持语音 模组在物联网设备中的大规模应用,此次在语音空调中成功应用,具有重大意义。
本文设计一款基于国产专用语音芯片搭载国产物联网系统的语 音模组,包括模组硬件设计和软件设计n l。硬件设计上实现语音信号 采集、语音信号处理、语音识别结果控制的功能。软件设计上优化回 声消除和自然语言处理过程,使得语音识别性能能够满足工程应用 需求。
2硬件选型设计
本模组主要由国产专用语音芯片、国产Wi-Fi轻量级芯片、采样 电路、FLASH、接口电路等组成,使语音模组兼具配网、IoT控制、通 讯、语音处理等功能,最远可支持5米的高精度识别,实现智能控制
作者简介:毛跃辉,研宂方向:智能控制技术研宂与产品创新应用。E-mail: *******************。
基金项目:面向半导体、芯片、关键零部件等领域的产业技术基础公共服务平台建设(项目编号:2019-00896-2-2)。
50家电科技www.jdkjjournal Vol.3 2021 Issue 410
Articles
论文
全套语音化操控。根据整体系统功能特性,考虑性能、功耗、稳定性 等方面的平衡,最大程度上做到语音系统低成本、低功耗、高性能。模组硬件框图如图1所示3吾音系统整体启动时间在4 S左右,工作电 压12 V左右。详细参数如表1所示。
图1模组硬件框图
表1系统参数
项目单位MIN TYP MAX
工作电压V11.51212.5静态时有效电流(@12V)mA6080120麦克风电压V  1.8  2.4  3.0
喇叭选型W  1.558
启动时间S346峰值最大电流(@12V)mA800
2.1语音芯片选型设计
语音专用芯片基于Cortex-A5处理器,频率最高1GHz;其中封装 32 M RAM、丨个DSP模块和1个10通道的DMA控制器;芯片内置音频 ADC和DAC,最多支持6路音频输入,2路音频输出。整个芯片能够支 持低功耗和自适应动态电源管理架构,能够满足国产物联网操作系 统|2]的运行要求和语音前端降噪及离线识别的运行要求。语音专用芯 片架构框图如图2所示。
图;!语音专用芯片架构框图2.2 Wi-F i芯片选型设计
Wi-Fi芯片选型主要关注点:支持工作模式、PA(功率放大器)和
LNA(低噪声放大器)是否内置、数据接口、天线端口个数、射频校准
和产测方案、射频性能、方案稳定性等等。在充分考虑整体语音系统
框架、功能、功耗、成本等要求,决定采用国产Wi-Fi SoC方案。本方
案是轻量级0S系统,具有启动快、功耗低的特点,且Wi-H芯片最终
经过相应测试,性能能够满足项目需求。芯片具体规格如表2所示。
表2 Wi-Fi芯片选型规格参数
项目名称参数
Wi-Fi模式IEEE802.11 b/g/n
数据接口类型SDIO
天线端口数1个
支持的形态支持STA和AP形态
产测AT指令融合调度指挥通信系统
支持的电源电压支持1.8 V和3.3 V
Wi-Fi芯片电源电压输入范围  2.3 V〜3.6 V
其它内置PA和LNA、射频自校准
设计时需注意要点:
(1) PCB板厚需要大于等于1mm;
(2) 为减小信号干扰,信号走线,信号线和电源线走TOP层;
(3) 为减小信号反射,信号线尽量短,信号线不要穿越电源和地 分割区域,保持完整的电源地参考平面;
(4) 合理设计结构,保证产品内部与外界有热交换途径。单板 上大功率且易产生热量器件要均匀分布,避免局部过热,影响器件可
靠性和散热效率。
2.3麦克风采样电路设计
采样电路采用差分输入电路和外围保护元器件,起到抑制共模信
号、抑制尖峰电流、通交隔直的作用。采用麦克风偏置电压源,对麦克
风输入提供一个电压参考。其中一路麦克风采样原理图如图3所示。
图3 *克风采样电路
家电科技www.jdkjjoumal Vol.3 2021 Issue 4105
1
Articles
论文
3语音降噪和系统设计
语音识别主要作用就是把一段语音信号转换成相对应的文本信 息,然后通过各控制模块间的通讯把识别到的信息进行落实。该系统 主要采用国产物联网操作系统双SoC 的方式,主要由前端降噪、语音 识别、语义理解、控制处理、语音合成、Wi -Fi 联网通讯等部分组成的 远场语音识别系统P 1。用户的语音指令通过麦克风的拾音,经过云端 音频转文本和语义理解的处理,最后用户的意图被转化成空调能够识 别的文字、格式,通过URAT 跟空调主板进行通讯,并实现用户意图的 控制。通过Wi -Fi 连接云端资源服务器,从云端获取在线资源,便于实 现用户的非空调控制意图。语音系统框架主要如图4所示。
图4语音系统流程框架图
3.1前端降噪优化设计
ASR(Automatic  Speech  Recognition )自动语音识另I I 系统主要由
声学特征提取、语言模型、声学模型和解码器等组成。训练识别的过程 是从原始波形语音数据中提取的声学特征,经过训练得到声学模型与 发声词典、语言模型组成网络,对新来的语音提取特征,经过声学模 型表示,通过解码得出识别结果,语音前端识别流程如图5所示。
前端
后蟈
图5前端识别流程图
为了尽可能地提高语音系统的识别率,在语音拾音前端就需要开 始进行优化设计。对麦克风拾音在设计麦克风阵列时,注意保证麦克 风阵列的一致性和密封性,在拾音端优化回声消除。麦克风阵列设计 需满足以下3点:1)实现声音到达麦克风的路径尽可能短、宽;2)声 音路径内不要存在任何空腔;3)麦克风需要有橡胶套和固体表面隔 绝,起到降低壳体震动传声以及密封性的作用。
通过前端降噪阵列的设计,配合融合深度学习的自适应远场语
音降噪技术,解决前端信号因远场环境复杂,夹杂噪音、混响、自噪 声等识别困难问题,实现可靠远场降噪。降噪前后音频录音曲线对比 如图6所示,从图6中可知,在采用自适应远场降噪技术后,人声得到 放大,噪音被抑制,最终获取纯净的识别人声。
a )降噪前
b )降噪后
图(> 降噪前后音频对比图
3.2语音识别优化设计
由于模组内部存储资源有限,在本地音频资源存储上做了优化。 本地音频文件由先前的PCM  (Pulse  Code  Modulation ,脉冲编码调 制)文件格式更改为占内存更小的ADPCM  (Adaptive  Differential射线灯
Pulse  Code  Modulation ,自适应差分脉冲编码调制)音频文件格式^
同时通过修改音频使用逻辑代码,离线播报的回复内容,更多采用多 个ADPCM 文件组合的方式,从而减少文件数量,减少离线播报应用
对于系统资源的占用,达到提高系统资源综合利用的效果。
其次,针对现实复杂场景下的语音识别的困难,想要有效地提高
系统性能,如何获得大量的优质标注数据至关重要。本文设计基于 异构神经网络的主动学习技术来选择训练数据,从海量数据中挖掘 出有效的数据,降低获取高质量数据的成本,有效提高复杂环境下 语音识别性能。
模型结构采用基于MMI 准则141 (最大互信息量准则)的包括
Highway 跨层连接的CNN +LSTM +TDNN 151级联模型,云端采用
基于LF-MMI  (Lattice  Free  Maximum  Mutual  Information )准则的
CNN +LSTM +TDNN 级联模型,利用云端采集、海量数据模拟等方法获
得超过10万小时的数据,增强复杂环境的语音覆盖度,提高建模效果。
设计中提出的主动学习系统|61,采用多种子模型并行解码的策
略,从多个不同角度学习到海量无标注数据的特性,从而使得从无 标注数据中挑选出来的可用数据与
人工标注数据之间存在强互补特
性,且因异构神经网络中子模型与目标CLTDNN 模型不同,减小挑 选出来的数据与原始的标注数据之间的同质性。
另外,研发中采用基于Highway 跨层连接的声学模型训练方法, 可以进一步有效地从声学模型角度提高模型性能,并结合特殊的数 据挑选标准,使得选择出来的数据更加贴合实际的真实场景,以此综 合进行模型训练,有效提高综合语音识别的性能。
视频直播系统 高清由表3可知,主动学习技术选择数据和模型训练,只需要1200小 时的数据,对系统性能的提升好于用4000小时的基线系统,由此可
去混响去N 声
,:
Y iM J £板
_
52家电科技 www.jdkjjournal Vol.3 2021 Issue
410
Articles
论文
表3不同数据选择方法训练模型的性能比较
方法数据大小
词错误率(《/〇)
一般搜索主題兴趣点儿童基线系统4000小时11.714.130.4
主动学习1200小时11.112.427.7
知,本文提出的主动学习技术数据选择方法对训练模型性能非常有
效,极大的改善了声学模型效果。木薯干
4试验验证与结果分析
4.1 Wi-Fi性能验证分析
根据语音系统对Wi-n芯片的选型需求,以下针对RF性能(射频
性能)、无源和吞吐量进行试验验证测试。
(1) RF性能测试,测试数据如表4所示。结论:参考“W i-Fi规格 书传导数据标准”,发射功率和接收灵敏度能满足标准要求。
表4 PCBA单板传导测试数据
测试项信道TXCdBm)RX(dBm)
CHOI16.16-88
Wi-Fi B CH0716.09-87
CH 1315.88-87
CHOI15.74-73
Wi-Fi G CH0715.94-73
CH 1315.66-72
CHOI15.89-68
Wi-Fi N CH0715.99-67
CH 1315.77-67
(2)无源测试,测试数据如表5所示。结论:由于音频常使用
128 kbps、192 kbps、256 kbps、320 kbps共4种固定码率的音乐文
件,速率要求不高,并且整机吞吐测试的TX和RX的平均速率均大
于2 Mbits/sec,目前的测试数据满足实际使用需求。
表5 2400〜2500Hz频率下(整机)测试数据
频点(Hz)效率(%)效率(dB)增益(dB)
240062.4%-2.1  3.7
241064.7%-1.9  3.8
2420'67.3%-1.7  3.9
243069.3%-1.6  3.8
244070.8%-1.5  3.8
245070.7%-1.5  3.7
246070.3%-1.5  3.8
247070.2%-1.5  3.7
248070.1%-1.5  3.7
平均值68.4%-1.65  3.77
(3)吞吐测试,测试数据如表6所示。结论:使用某品牌路由器
测试整机吞吐量,测试数据中TX的平均值为7.54 Mbits/sec,RX的平
均值为9.48 Mbits/sec,满足系统需求。
4.2语音识别性能测试分析
本次语音性能测试标准参照中家院的HCT-JSGF-062-2019家用
表6吞吐置测试21米穿墙(墙厚45cm)测试数据
信道T X(Mbps)R X(Mbps) CH01  5.278.63 CH027.310.3 CH03  6.239.64 CH04  6.779.64 CH057.4510.1 CH068.329.67 CH078.479.75 CH088.6810.6 CH098.759.62 CH107.348.41 CH118.458.71 CH128.448.92 CH137.429.26
平均值7.549.48
房间空气调节器语音控制功能测评规范[7],本规范规定了智能家用房
间空气调节器产品的语音控制功能的测评方法,与GB/T 28219-2018
《智能家用电器的智能化技术通则》181配合使用。
语音空调识别性能需满足如下要求:
(1) 语音空调应支持离线、在线双模语音识别;
(2) 语音控制功能应能够支持5 m范围内的有效唤醒和识别;
(3) 语音空调在不同环境条件下的识别率要求,满足如表7所示 标准。前期己经量产的RK3308主控芯片搭载Linux系统的语音空调
识别测试数据如表8所示,本文中国产专用语音芯片搭载国产物联网
系统的语音空调识别测试数据如表9所示。
表7不同信噪比、距离要求达到的识别率
室内生活噪音(A) (麦克风处测定)/dB
发音声大小(B>
(麦克风处测定)/dB
信噪比
SNR(B-A)/dB
距离
(L)/m
识别率
标准普通话带口音普通话
195%90%
30<A<4050<A^60多10395%90%
590%85%
195%90%
40<A^5060<A彡70多10395%90%
590%85%
190%85%
50<A=^6070<A$80多10390%85%
5i5%80%
经对比测试(测试数据如表8和表9所示),基于国产物联网系统
专用语音芯片的语音空调识别效果和搭载Linux系统前期量产语音
电磁炉热水器空调识别效果在不同的信噪比、不同的测试距离条件下测试结果相
当,均符合第三方识别性能测试标准要求,搭载本语音模组的语音空
调可满足产业化推广应用要求。
5结论
(1)该语音系统不仅启动快、功耗低,而且实现了离线和在线双家电科技www.jdkjjoumal Vol.3 2021 Issue 41053
Articles 论文
表8搭载Linux系统的RK3308芯片语音识别测试数据
室内生活噪音(A)发音声大小(B>信噪比距离
识别率
(麦克风处测定)/dB(麦克风处测定)/dB SNR(B-A)/dB(L)/m
标准普通话带口音普通话
199.80%96.75% 30<A<4050<A<60多10398.67%95.00%
596.00%94.10%
199.36%96.20% 40<A<5060<A^70^10398.60%95.36%
595.00%93.94%
198.28%95.36% 50<A^6070<A=^80多10396.98%93.40%
591.67%88.46%
模式语音控制。
(2) 本地音频文件由PCM格式改为ADPCM格式,占用内存小,减少离线播报音频对于系统资源的过大占用,降低硬件成本。
(3) 设计基于异构神经网络的主动学习方法,用此方法来高效 选择数据,从海量数据中挖掘出有效的数据,降低获取高质量数据
成本,有效提高复杂环境下语音识别的准确性,经第三方机构性能
测试,语音识别性能指标满足语音工程应用要求。
综上所述,新研制的语音识别模组因其低成本、高性能的特性
(噪声环境下,识别率90%,连续运行72 h,误唤醒<3次),在家电领
域具有广泛推广的价值。表9搭载国产物联网系统的国产专用语音芯片识别测试数据
室内生活噪音(A)发音声大小(B)信噪比距离
识别率
(麦克风处测定)/dB(麦克风处测定)/dB SNR(B-A)/dB(L)/m
标准普通话带口音普通话
198.96%96.15%
30<A=^4050<A彡60>10398.00%95.16%
595.24%94.00%
198.20%95.94%
40<A^5060<A^70多10398.60%95.00%
594.00%93.40%
197.76%94.00%
50<A^6070<A^80^10395.18%92.80%
590.00%88.20%
参考文献
[1]陈心灵,钱宁博,胡佳辉,王战中.基于STM32单片机的嵌入式语音识别系统设计[J].
自动化与智能化,2019,48(06): 135-137.
[2】何小庆.国产嵌入式操作系统发展思考[J].单片机与嵌入式系统应用,2019,19(12): 士5+10.
[3] 刘诚然.基于深度学习的远场语音识别技术研宂[D].郑州:战略支援部队信息工程大
学,2019.
[4] 刘聪,胡郁,戴礼荣,王仁华.一种针对区分性训练的受限线性搜索优化方法[J].模式
识别与人工智能,2010,23(04): 450455.
[51王海坤,潘嘉,刘聪.语音识别技术的研宄进展与展望[J].电信科学,2018, 34(02): 1-11.
[6]解传栋.资源稀少情况下的语音识别的主动学习方法研宄[D].合肥:中国科技大学,
2017.
[7JH CT-JSG F-062-2019家用房间空气调节器语音控制功能认证实施规则[S].中家院
(北京)检测认证有限公司,2019.
[8] GB/T28219-2018智能家用电器通用技术要求tS].国家市场监督管理局,2019.
[9] 毛跃辉.基于深度学习的语音识别技术研宄及其在空调上的应用[J].家电科技,
2019(04): 54-58.
(责任编辑:张晏榕)(上接58页)
表|激光法与有限元法对比测试不同厚度阀片基频
阀片厚度(m m)基频-有限元法(Hz)基频-激光测试(Hz)偏相对差(%)
0.152162.8168.9  3.6
0.178265.9269.4  1.3
0.203394.3404.5  2.6
中的准确性与可行性。
4结语
本文主要建立了一套激光位移传感器测试系统,并且应用在 往复式压缩机的变形与振动测试中,通过与千分表和有限元结果 的对比,验证了激光位移传感器测试系统的准确性。对比千分表 等传统测试手段,激光位移测试系统有诸多优势,如非接触式、高 精度(1um)、可测试动态过程(振动)、可使用软件实时记录并 分析数据等。而且,对比其他非接触式测试方法,该系统成本很低。因此,在冰箱压缩机开发与测试中应用本文的激光位移传感
测试系统是可行的。
参考文献
[1] 刘凤.结构试验中位移测试的若干新技术综述[J].科技创新与应用,2014(33): 20.
[2] 段斌华,姚振强,顾伟彬.超重型精密数控轧辊磨床MKA84250/15000-H关键部位应变
和位移测试分析[J].精密制造与自动化,2011(03): 29-31.
[3] 任树梅,蒋圣平,郝晓剑.用位置敏感传感器进行位移测试的技术研宂[J].测试技术学
报,2002, 16(02): 127-131.
m李兵,孙彬,陈慕,魏翔.激光位移传感器在自由曲面测量中的应用m.光学精密工程,2015,23(07): 1939-1947.
[5]毕梦雪,陈新春,薛春阳,贾华东.基于组态软件的激光位移传感器数据采集系统开发
[J].工程机械,2018,49(10): 6-10.
[6】任锦霞,张凤生,宋腾,刘延杰,徐鹏杰.基于激光位移传感器的车轮踏面磨损检测技术 研究[J].机械与电子,2017, 35(12): 59-62.
[7] 朱万彬.激光位移传感器在物体表面形状测量中的应用[J].光机电信息,2010, 27(10):
70-72.
[8] 韦明堂,常见虎,任伟,王海波,程旺,李海科.基于CAE技术的冰箱跌落底梁变形优化
研宄[J]•家电科技,2019(06): 109-111.
(责任编辑:张晏榕)
54家电科技www.jdkjjoumaLcom Vol.3 2021 Issue 410

本文发布于:2024-09-25 12:22:20,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/3/223598.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:语音   识别   数据   系统
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议