音频标注的检错方法和装置[发明专利]

专利名称:音频标注检错方法和装置专利类型:发明专利
发明人:张晴晴,朱冬,贾艳明,何淑琳申请号:CN202011263694.X
申请日:20201112
公开号:CN112417850A
公开日:
20210226
专利内容由知识产权出版社提供
摘要:本申请公开了一种音频标注的检错方法,包括:获取音频数据,并将音频数据切分为多个音频片段;对音频片段进行标注,得到初始标注文本;采用通用文本检错模型对初始标注文本进行检错处理,以得到第一标注文本;确定通用文本检错模型的混淆词典;采用文本分类模型识别第一标注文本的领域类别;根据领域类别,采用领域类别对应的领域文本检错模型对第一标注文本进行检错处理,以得到第二标注文本;将通用文本检错模型的混淆词典与领域文本检错模型的第二标注文本作为微调模型的数据库;根据第二标注文本的语义,采用微调模型对第二标注文本进行微调处理,以得到最终的第三标注文本。
申请人:北京爱数智慧科技有限公司
地址:100044 北京市海淀区高梁桥斜街59号院1号楼14层1415
国籍:CN
代理机构:北京智沃律师事务所
代理人:梁晨

本文发布于:2024-09-20 16:59:44,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/762301.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:文本   标注   检错   模型
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议