音讯:新华社“语音智能+”采编应用矩阵

105传媒技术·传媒业态
导语
新华社作为国家通讯社、世界性现代通讯社,每天24小时同时使用十余种语言滚动发稿,权威、准确、及时播发国内外重要新闻和重大突发事件。近年来,音视频素材与稿件的制作需求与日俱增,这既对音视频智能化分析技术提出了更多的挑战,也给相关技术的更大空间发展创造了无限可能。
从全球范围看,媒体智能化进入快速发展阶段[1]。人工智能技术正深刻改变着人类社会生活,改变着世界,同时也成为突破媒体融合发展的前沿技术和体现国际竞争力的关键技术之一。语音智能技术作为音视频智能化处理领域的代表组成部分,新的科研成果也层出不穷。
为进一步利用人工智能技术提升“采编发供”各阶段生产传播效率,新华社技术局推出“语音智能+”采编应用矩阵(下简称“音讯”)。经过一年多的技术建设,目前已支持9种国内外语种、8种国内方言的语音智能分析功能,包含移动客户端、PC桌面端、网页端以及多款智能硬件等产品形态,全面赋能记者编辑采访整理、会议记录、唱词制作、稿件校对及旁白配音等采编场景。同时,音讯业界领先的智能算法、各具特的智能终端、自主可控的超级算力与安全高效的使用体验,实现了移动化与智能化下音视频素材整理与新闻制作效率的大幅提升。
1.语音智能应用,加速媒体智能化升级
1.1 多场景语音智能,赋能采编业务
1.1.1 AI实时速记,采访边说边识别
时间性越强,新闻的社会效果就越大。音讯将语音实时转写技术有效嵌入至新华社采编客户端中(如图1所示),可将语音信息实时转换成文字,并支持一键建稿至新华社采编系统。在实际采访过程中,记者仅需携带安装有客户端的智能手机,即可实现“AI录音笔”与“AI
速记本”的效果,进一步提高编稿与签发时效。
图1  新华社新采编客户端AI实时速记功能图示
(从左到右依次为实时转写与编辑建稿示例)
围绕PC机音视频信息实时转写文字的采编需求,音讯同步推出桌面版应用,实现了PC机音频信息的实时采录与转写等功能(如图2所示)。该工具不仅能实现浏览器内的各种直播、点播音视频同传字幕,而且能对系统播放软件的音视频进行实时转写,可对重要报道中领导人或记者会的发言与翻译内容进行实时记录与快速整理,有效压缩稿件生产过程中录音整理方面的重复
工作。
图2  新华社音讯桌面客户端功能图示
(左为浏览器视频直播/点播示例,右为实时转写效果示例)
音讯:新华社“语音智能+”采编应用矩阵
李泽魁  孙  霏  刘一闻
(新华通讯社 通信技术局,北京 100803)
摘  要:音视频新闻相比于文字、图片等新闻类型,往往在携带信息量、传播影响力等方面更具优势。近年来,音视频新闻数据量爆发式增长、人工智能理论与技术创新式发展,为新闻生产传播流程与语音智能技术深度融合创造了无限可能。本文从媒体智能化升级探索中,语音智能在多场景应用、多语种识别、多品类终端与强算力支撑等不同角度切入,对新华社“语音智能+”采编应用矩阵“音讯”的相关工作进行了阐述与展望。
关键词:语音智能;人工智能;新闻生产                          中图分类号:TN912.3;G210.7                        文献标识码:A
文章编号:1671-0134(2020)09-105-04                                    DOI:10.19483/jki.11-4653/n.2020.09.031
本文著录格式:李泽魁,孙霏,刘一闻.音讯:新华社“语音智能+”采编应用矩阵[J].中国传媒科技,2020(9):105-107,124.
106
传媒业态·传媒技术
1.1.2 AI 录音转写,素材整理好助手
面对采访过程中收集的大量录音或视频素材,记者从中去粗取精,提炼新闻灵感与线索,往往需要反复回放录音与核查信息。为此,音讯定制研发了音视频语音转录工具,可支持小时级的录音或视频文件在数分钟内的高效转写,准确率可达95%以上,并针对实际业务场景推出采访发音角分离、口语表达智能过滤、视频唱词智能切分及SRT 字幕导出等采编功能(如图3所示),可大幅提升采访素材整理与视频后
期的工作效率。
图3  音讯录音转写工具图示
(左为录音文字模式,右为视频唱词模式)
1.1.3 AI 语音互联,解放双手更省劲
笛卡尔乘积
人机交互的方式正在因语音输入而改变,其便捷、快速与个性化等特点赋予媒体领域更多落地场景。在全国两会前夕,音讯推出了“大屏智能声控”方案。管理员仅需对着遥控拾音设备口述大屏页面跳转指令,大屏即可根据指令内容做出切换(如图4所示),实现更智能、
便捷地大屏操控体验。
图4  新华社大屏智能声控功能图示(左图为遥控拾音设备,右图为大屏示例)
1.1.4 AI 稿件唱校,机器辅助读校审
语音合成技术即将文字信息转化为声音信息,使文字化的新闻更加“声情并茂”。音讯结合新闻稿件检校需求推出了“AI 唱校”功能,稿件校对时可以选择不同的播放语速、男女声进行智能唱校,同时支持各个标点符号、回车换行等字符的朗读,一定程度上缓解了人工校对的工作压力(如图5
所示)。
图5  新华社全媒体采编发系统稿件唱校功能图示
1.1.5 AI 视频配音,一键搞定画外音
音讯“智能配音工具”则主打音视频制作需求(如图6所示)。它具有57位AI 配音员,包括9大语种及6种地方方言。该工具操作简单,用户可一键合成纯正地
道的AI 配音,也可根据实际采编需求修改音、音调、语速,甚至可以指定插入图片与变更多音字的读法,实现了方便快捷的视频多语种配音制作,为视频新闻创作
带来无限可能。
图6  音讯多语种智能配音工具功能图示
1.2 多语种语音智能,坚持内外并重
进入新时代,构建内外并重的体制机制成为新
华社技术建设新目标之一[2]。音讯近年来不断拓宽语音智能技术的支持语种(如表1所示)。目前已支持中、英、西、法、俄、阿、葡、日、韩语在内的9种语种(其中还包括加拿大法语、墨西哥西语等8国语言变种),
广东话、河南话、四川话等8种国内方言的语音智能处理功能,推动对内对外报道新闻素材整理与制作效率进一步提升。
1.3 多品类定制终端,录音提质增效
“音讯盒子”是基于3D 技术打造、具有自主知识产权的智能硬件系列产品,可与电视、固定电话、终端及机顶盒等设备外接(如图7所示),通过对音视频信号的高保真降噪与极速转码,实现音源更精准的实时转写
107
传媒技术·传媒业态效果。适合于新闻采访、新闻发布会等业务场景,可提
高采访报道新闻生产效率。
图7 音讯盒子移动终端版、电话座机版、机顶盒版使用场景
(从左到右)
除此之外,音讯还与市面在售的若干款录音笔硬件实现“智能互联”。图8是一款具有8麦环形高保真拾音、数据多重保障、智能电池控制等特性的专业录音笔,经过新华社技术人员的研发,目前已实现了与新华社新采编客户端的无线信息传输,支持手机远程控制录音笔启停、录音转录及采编一键建稿等功能,满足了更高品质拾音与转写、安全距离采访与整理等场景需求,可进
一步提升采访智能化体验。
图8  音讯智能录音笔使用示例
1.4 强算力极致安全,架构稳若磐石
目前,音讯具有新华社遍布全球各地的庞大采编用户体,基础设施的自主可控、核心数据的存储传输等安全要素也显得尤为重要。为此,音讯围绕实际需求打网络滤波器
金属的介电常数
bootvis造了“超强算力+智能中台+全球加速”的全链路一体化系统架构。
致幻剂与市面商业化产品不同,其核心功能均部署在新华社自主可控的GPU 高性能计算平台之上,处理性能
大幅提升的同时,也完全保证了数据安全;音讯“智能语音中台”目前具有强大定制与高扩展能力,可通过灵活开发,满足新华社不同部门与分社定制化语音智能需求;同时,为保证驻外采编人员的使用体验,音讯针对性实现全球内容分发网络(CDN)链路加速优化,大幅降低了海外访问延迟,使北美等地区的使用体验进一步提升。2.产品效能初显,用户活跃度口碑高涨
当前,音讯产品的用户已达数千人,分布在全球各地。自2019年上线至今,已累计语音转写各语种素材超1.9万小时,共计7.3万余单,平均1小时录音仅需9分钟即可获得转写结果(图9为转写工具用户数目及转写单数月活跃量数据示例);另一方面,累计语音合成超过4700万字的稿件内容,合成时长超过2400小时。音讯通过与新华社采编流程打通并融合,为采编人员节省
了大量宝贵的人力与物力,受到了广泛认可。
图9 音讯转写工具月活跃用户数及转写单数
在2019年一带一路高峰论坛及中国国际进口博览会等重大报道期间,音讯多次辅助新华社前后方采编人员素材整理素材,提升各语种出稿效率;亚洲文明交流大会开幕式的报道前方,音讯盒子对领导人讲话中文原声和英文同声进行实时语音转写,在无英文稿情况下供新华社多个编辑部参考与发稿,加快了发稿时效;2020年全国两会期间,音讯转写工具辅助音视频编辑听打唱词,节省了大量人工拍词工作;抗击疫情期间,音讯“智能远程录音”的采访模式,使记者在采访录音与记录的同时,windows 2003 server
保证了采访安全距离,成为疫情相关报道的重要助力。3.融合潜力巨大,媒体智能化未来可期
近年来,音视频产业爆发式增长,逐渐成为新闻传播的重要媒介载体。媒体融合发展的路上,语音智能未来仍具有很大的应用空间。音讯将围绕采编需求,继续在如下方面进行更深入的研究,持续推进媒体智能化工
表1  音讯多语种语音智能分析技术
语音智能支持语种
AI 实时速记
汉语(普通话/粤语/藏语/维语)、英语、
中英混合、西语(西班牙/墨西哥)、法语(法国/加拿大)、俄语、阿语、葡语(葡萄牙/巴西)、日语、韩语
AI 录音转写AI 视频唱词汉语(普通话/广东话)、英语、西语、法语、俄语、阿语、葡语、日语、韩语AI 语音互联汉语普通话AI 稿件唱校
汉语普通话、英语
AI 视频配音
汉语(普通话/粤语/东北话/湖南话/河南话/四川话/陕西话)、英语(英国/美国)、西语、法语、俄语、阿语、葡语、日语、韩语
(下转第124页)

本文发布于:2024-09-23 06:38:08,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/511811.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:智能   音讯   语音   采编
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议