基于GX8002的超低功耗语音控制技术

1前言
带电池的手持电子设备因其易于携带、使用方便,越来越受到消费者青睐。语音识别技术的发展使得语音控制成为普遍技术,语音控制的电器得以广泛应用。便携风扇也成为一种流行设备。已有电路设计在便携风扇中增加了语音控制功能[1]。但是由于语音识别技术的功耗很大且手持风扇或挂脖风扇使用
基于GX8002的超低功耗语音控制技术
梁骏,凌云,陈树
杭州国芯科技股份有限公司
摘要:本文基于GX8002设计了一款语音控制的风扇。GX8002集成度高,只需要供电与麦克风即可实
现语音控制功能。在语音待机时电路工作电流小于600uA。本文提出电路也可以用于其它类型的电池供
电的全天待机的语音控制电器。
关键词:GX8002;VAD;语音控制;超低功耗;风扇
Ultra Low Power Voice Control Technology Based on GX8002
LIANG Jun,LING Yun,CHEN Shu
Hangzhou Nationalchip S&T Co.,Ltd.
Abstract:This paper designs a voice controlled fan based on GX8002.GX8002is highly integrated,and only needs power supply and a microphone to realize voice control function.The working current of the circuit is less than600uA when the speech recognition is working.The proposed circuit can also be used in other types of battery powered voice control systems.
Keywords:GX8002;VAD;Voice Control;Ultra Low Power;Fan
电池供电,高功耗的传统语音识别技术在手持设备中使用会造成减少设备工作时间的不良影响。
GX8002是杭州国芯科技股份有限公司研发的第三代超低功耗语音AI芯片,采用MCU+NPU架构,可单芯片实现实时语音唤醒功能。VAD(Voice Activity Detection)待机模式下功耗低至70μW。芯片采
安全带扣用20脚QFN(Quad Flat No-leadPackage)封装形式,封装尺寸小,可应用于耳机等智能穿戴设备。与GX8008相比,GX8002架构更简洁,移除了功耗大的DSP,优化了语音专用NPU,语音识别功耗极大降低[2]。
本文根据GX8002的高度集成特性实现了一种可以语音控制的便携风扇的控制电路。尤其是挂脖风扇在开启后不需要手持手控,语音控制使用更加方便。相关方法也可以用于其它类型的电池供电的全天待机的语音控制电器。
2GX8002芯片介绍
GX8002采用了MCU+NPU的架构,集成国芯第二代自研神经网络处理器gxNPU V200和平头哥CK804处理器。芯片支持骨传导麦克风与模拟麦克风同时接入,集成硬件VAD,支持多级唤醒,可实现超低功耗语音待机和自动人声感应。通过NPU 的硬件算力,实现超低功耗的基于DNN(深度神经网络)的语音唤醒、指令识别、AI降噪、声纹识别等众多功能。
经过测试,GX8002整颗芯片在VAD语音待机时的功耗只有70μW,语音识别功能运行时的功耗为0.6mW。同时GX8002可以根据环境声音自动切换VAD待机和语音识别两种模式。通过VAD的有效过滤,芯片24小时工作的平均功耗低于300μW。
GX8002的超低功耗背后,主要有两大技术突破——
—第二代神经网络处理器gxNPU V200和硬件VAD。gxNPU V200针对语音应用进行低功耗优化,计算能效是普通DSP芯片的10倍,支持DNN/CNN /RNN等各种模型。配套的神经网络编译器自动实现网络量化压缩,可以和Tensorflow等训练平台直接对接。
硬件VAD模块令语音检测功能在MCU关闭的情况下独立工作。内建硬件FFT模块将输入语音分帧后转换到频域。由于人声在频域上有谐波及共振峰等特征,VAD模块在频域判断是否存在人声,准确率比利用时域信息如幅度及过零点等信息决断的要高。当VAD模块识别出人声后,VAD模块发出中断,MCU开启进行语音识别。远程电源管理
可穿戴设备如耳机、手表等的体积通常较小。为了在可穿戴方案中语音唤醒部分占用的硬件体积尽可能小,GX8002将唤醒所需要的部件全部做了集成,包括音频ADC、Flash、电源LDO、晶振等。由于GX8002高度集成,可穿戴设备使用GX8002时,仅需一颗芯片与麦克风就能完成语音唤醒的全过程。同时在封装设计上,GX8002采用的是SIP(System In a Package)立体封装技术,将Flash叠封在内。封装为20脚位的QFN封装,封装后尺寸为3mm×3mm,占据PCB面积极小,最大程度节省空间。
基于GX8002的外置唤醒的方案,可以在客户原有成熟产品的基础上,增加语音按键功能。客户原有的软件和设计都可复用。这让语音识别的
研发周
期变得非常可控,有形成本和无形成本都大大降低。
r22压焓图3语音便携风扇的硬件设计
以语音便携风扇为例介绍基于GX8002的语音
控制技术。
图1GX8002的系统框图
语音便携风扇的硬件系统主要包括电池管理与供电、按键与语音控制和电机控制三大部分。锂电池采用USB 口进行5V 充电。芯片上的串口作为GX8002的代码下载与调试接口。按键与语音控制系统响应开机按键与控制语音。电机控制系统采用升压DCDC 电路为直流电机提供不同转速档位的电压。与其它设计方案不同,由于GX8002集成了晶振电路,上电复位电路LDO 、ADC 、NPU 、MCU 、GPIO 等功能模块,充分利用GX8002集成的片上硬件资源可以设计出极度精减的电路。
图2是电源管理部分的电路图。电池管理部分以一颗电池充电芯片HX4054为主。它的VCC 接USB 的电源,Bat 脚接充电锂电池的正极。在USB 电源与HX4054的CHARG 脚间串接一颗LED 灯。当进行锂电池充电时,LED 灯亮,用以指示充电状态。
GX8002的工作电压3.3V ,低于锂电池的供电电压。由于GX8002在语音待机时的工作电流是70μA ,最大工作电流小于600μA ,整体电流极低,不需要DCDC 为其供电。因此采用一颗LDO 芯片SC662K 为GX8002提供工作电压。
一颗硅麦克风或驻极体麦克风实现语音向电信号的转化。GX8002提供差分麦克风或单端麦克风输入接口。
GX8002的GPIO 还可用于LED 的控制。由于GPIO 的驱动电流小,电路上增加一个三极管进行GPIO 与LED 的隔离。
膜分离装置便携风扇采用直流电机带动扇叶旋转。PWM 波的占空比改变输出平均电压可以实现直流电机的转速控制[3]。电机供电电压高时电机的转速高。为了减轻使用重量,便携风扇只使用一节锂电池进行供电。锂电池的有效工作电压为3.2V 到4.2V 。当采用一节锂电池供电时,由于电池的电压不足,使得直流电机的转速受到限制。为此增加一颗DCDC 电源升压芯片ME2159为直流电机提供不同档位电压。如果采用多节电池时,由于电源电压高,电源升压芯片可以省略。
GX8002的GPIO2脚输出PWM 控制信号调制DCDC 的反馈电压,控制PWM 的占空比即控制电机的供电电压,从而实现对电机的无极调速。
由于升压电路关闭时,电流会通过电感与二极管传导到电机,因此加入一个MOS 管进行升压电路的开关控制。当需要打开电机时,GX8002的GPIO1输出高电平,打开MOS 管。当需要关闭电机时,GX8002的GPIO1输出低电平,关闭MOS 管,从而防止电源通过电感与二极管向电机供电,解决电机无法彻底关闭的问题。
4语音按键的控制流程
便携风扇在使用中定义三种工作模式:休眠模式,
待机模式和
运行模式
在休眠模式下,系统的
CPU 只接收GPIO 中断,电机关闭、麦克风关闭、芯
图2电源管理部分的电路图
图3按键与语音控制部分的电路图
图4电机控制部分的电路图
片内无关模块均关闭。在待机模式下,麦克风开启、芯片内语音识别模块开启、电机关闭。在运行模式下,电机开启。
风扇进入休眠模式后需要通过按键进入待机模式。进入待机模式后即可通过语音指令对风扇进行控制。预训练的语音控制命令为“打开风扇”、“关闭风扇”、“增大风速”、“减少风速”、“打开灯光”、“关闭灯光”、“舒适模式”、“拉风模式”。无需激活词,用户可以用一句语音控制命令实现相应的控制。用户避免使用复杂按键组合来控制系统,提高了用户的舒适度。预训练的模型的结构采用3层CNN+3层LSTM的轻量级低功耗语音识别模型。模型的参数是180kByte。
为了提高用户体验,在语音指令控制命令解码程序中还增加了语音控制命令的有效期。如在风扇已打开的情况下,语音识别程序不识别“打开风扇”的语音命令。这会减少语音指令的误识别。
5测试结果与结论
图5是根据以上电路实现双头挂脖便携风扇样机。样机有一个按键与一个麦克风。使用电流表测量样机的实际功耗。风扇在待机模式下的最大电流低于600μA。1000mAH的电池可以提供接近69天的语音待机时间。在办公室、地铁、马路、咖啡馆等各种场合的实际测试中,GX8002的VAD待机时间的比例平均高达70%以上。这进一步降低了系统的工作功耗,增加了语音待机时间。
语音控制指令可以让用户减少了复杂组合按键的使用,使得人机交互直接方便。语音交互是智能家居、智能家电的发展方向。GX8002是高集成度的低功耗语音识别芯片。单芯片集成音频ADC、Flash、电源LDO、晶振等语音唤醒所需要的模块,采用SIP立体封装技术,实现极小封装尺寸,节约了PCB占板面积,特别适用于耳机等小体积电子产品。基于GX8002外置唤醒方案可以在客户原有成熟产品的基础上增加语音按键功能。超低功耗的设计使得GX8002不对客户原有的设计产生影响,内嵌NPU 让语音AI算法高效运行。本文提出低功耗语音控制技术也可以用于其它类型的电池供电的全天待机的语音控制电器
参考文献
三七的花怎样制成干茶[1]王雪闯,张培森,孙春志.智能便携式风扇设计[J].
物联网技术,2020(1):60-62.
[2]梁骏,凌云.基于多核异构的低功耗语音AIoT芯
片GX8008/GX8010[J].中国集成电路,2020(5-6):
32-35.
模拟社区
[3]王之道,周靖,刘旭.一种基于AT89C2051单片
机的直流电机调速装置[J].机械工程与自动化,2009
(5):151-152,155.
作者简介
梁骏,杭州国芯科技股份有限公司首席技术专家,高
级工程师,博士,从事集成电路设计与算法研究。
凌云,杭州国芯科技股份有限公司副总经理。
陈树,杭州国芯科技股份有限公司系统芯片部经理。图5风扇样机

本文发布于:2024-09-24 14:26:09,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/3/223587.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:语音   控制   风扇   识别
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议