专利名称:音频标注的检错方法和装置专利类型:发明专利 发明人:张晴晴,朱冬,贾艳明,何淑琳申请号:CN202011263694.X
申请日:20201112
公开号:CN112417850A
公开日:
20210226
专利内容由知识产权出版社提供
摘要:本申请公开了一种音频标注的检错方法,包括:获取音频数据,并将音频数据切分为多个音频片段;对音频片段进行标注,得到初始标注文本;采用通用文本检错模型对初始标注文本进行检错处理,以得到第一标注文本;确定通用文本检错模型的混淆词典;采用文本分类模型识别第一标注文本的领域类别;根据领域类别,采用领域类别对应的领域文本检错模型对第一标注文本进行检错处理,以得到第二标注文本;将通用文本检错模型的混淆词典与领域文本检错模型的第二标注文本作为微调模型的数据库;根据第二标注文本的语义,采用微调模型对第二标注文本进行微调处理,以得到最终的第三标注文本。 申请人:北京爱数智慧科技有限公司
地址:100044 北京市海淀区高梁桥斜街59号院1号楼14层1415
国籍:CN
代理机构:北京智沃律师事务所
代理人:梁晨