发明人:彭宇新,房翠华,陈晓鸥,吴於茜
申请号:CN200610007965.9
申请日:20060224
公开号:CN1825936A
公开日:
20060830
专利内容由知识产权出版社提供
摘要:本发明属于计算机语音识别及视频检索技术领域,具体涉及一种基于语音分类识别的新闻视频检索方法。现有技术中,在进行视频检索时,一般是从视频中提取出颜、纹理等底层特征,然后根据这些特征进行视频检索,无法有效实现从文本到新闻视频的检索,应用非常不方便。本发明所述的方法是在新闻视频中自动分割出标准语音的所有语音片断;然后运用语音识别系统,对分割出的标准语音进行识别,由于新闻视频中的标准语音能够反映该视频的主要内容,因此很容易地实现从文本到视频的新闻检索。采用本发明所述的方法,可以实现自动识别新闻视频中的标准语音,有效实现从文本到视频的新闻检索,从而充分发挥音频分析和检索技术在信息检索中的巨大作用。
申请人:北大方正集团有限公司,北京大学,北京北大方正技术研究院有限公司
地址:100871 北京市海淀区成府路298号方正大厦
国籍:CN
代理机构:北京英赛嘉华知识产权代理有限责任公司