产品需求-聊一聊语音交互以及语音助手

聊一聊语音交互以及语音助手
随着科技的不断发展,语音助手也频繁的出现在我们的日常生活中,比如手机的语音助手、智能音箱等等,语音助手的出现也很大程度上提高的一些效率问题;本文分享了关于语音交互的理解,我们一起来看回去。
“声控交互是一种简单、自然的人机交互方式,也是肉体最基本的沟通方式。”
说起语音交互、语音助手,我相信大家必然不陌生。
如今,各种科技公司、互联网公司、车企,甚至是房地产企业都在做语音姊夫助手;你已经
很难到一台新发布,且不带语音助手的手机or汽车了。
聚氨酯泡沫
我最早感受到语音信息处理的魅力最早是在16年,当时在做全屋智能的产品经理,公司调研产品买了产品线一台亚马逊的echo,第一场体验到远场的语音交互,很惊艳,远场语音交互技术给了居家场景太多的想象空间。
后来国内陆续出了小爱同学、天猫精灵、小度音箱…我基本都天数是第一时间买回了家。
18年5月,我去了猎户星空双鱼座做服务机器人“豹小秘”,机缘巧合的负责起了它机缘的对话能力,有幸伴随它从需要“一字不差的吼着信息处理”,到在全国高校各地的落地,我可能是最清楚它的对话谈话能力是怎么做起来的人。
19年8月,我去了滴滴,一年多过去了,也算是从0到1做成了一个给司机打碎用的语音助手(遗憾是还没有做到全国全量…)。
abei到现在我也算是行业老兵了,想结合过往的经历和思考,跟大家聊一聊语音交互。
这次主要包括想聊下面几个话题:
交流是人们与生俱来的本能,人类大约在二岁学会说话,说话也是人与人之间主要的交互方式。
我们可以试着有心一下,假如人与人间不能说话,只能通过触摸须要固定的区域来交流,那世界会怎么样?我相信,你相当程度很难想象这会是什么样的世界;而事实上,我们计算机现在与计算机交流的这种方式就是这样。我与父亲的秘密阅读短文答案
语音音频协同工作是一项人机交互技术,可以通过说话跟信息处理来获取信息、服务等,语音交互也不是要替代触控交互,而是在一些场景中让人与计算机交互式变的更简单、自然。
说起难点,我先抛几个现状:
为什么这么多顶尖的公司目前,投入经费了顶尖的资源、顶尖的人才都来不及做出一款C前端用户满意的语音助手?为什么在很多用户虽然眼中都是“人工智障”?话音助手的难点又是什么?兰州大学研究生被杀
这些问题很大,值得从业者们一起思考,这里讲讲我的思考;我认为,导致人们经常说语
音助手“智障”的原因是:用户预期与实际助手能力的gap过大。
就像这张图,用户市场预期与语音助手能力的交集少的可怜。那么有没有可能变成下面这张图的?
按这个思路,结构性问题的难点还可以继续拆解:
1. 问题 1:如何让用户知道语音助手能干什么?
语音助手背后的技能、参考资料其实都已小具规模(在19年,Alexa集市就已经有了8万多个技能),但一些用户也就只会用户使用听歌、查天气、订闹钟这么几个技能(有屏音箱里充满了各种引导、推荐,就是试图在解决这个环境问题)。
而我认为这个问题最根本的原因是,大多语音助手还没有帮手打透一个刚需场景。
像90年代初的互联网,你们也不知道互联网能干嘛,马云到处推销互联网还被骂是骗子;而随着电子商务解决的刚需场景越来越多(BBS解决了社交需求、门户网站解决解决了获取信息的消费市场),也激发了更多的人去了解互联网能干什么。
所以,大多用户们不了解语音助手能干什么,本质还是语音助手没有到一个刚需场景并打透(没有寻刚需场景,或者说没有在一个刚需场景中创造显著的无体验差)。
2. 问题 2:如何让语音助手连接更多的服务、内容?
想要回答这个问题,需要从场景深度和开放性两个需要维度来看。
深度方面,单一场景要打通的链路很长,体验闭环难。
案例1:以迷宫家庭智能音箱的听歌场景为例,受制音箱背后的音乐版权,而音箱没有,这会很大的影响体验;比如小爱同学,因为它连接的歌曲资源是QQ音乐,而我就没办法听自己在网易云收藏的歌单了。
案例2:在家庭照明场景,想通过语音助手随意的管控家庭灯光,需要连接整个家庭强光照明设备,这甚至得切断装修环境,在装修时就考虑。
广度方面,用户在跟语音助手交互之时,能够有非常多的碎片化小需求。
案例:在滴滴的司机语音助手中,除了大家可以想到的导航场景,司机还会有各种各样的长尾风险问题,例如:“网约车考试的题目在哪里?”、“飞机场那边的排队区在哪里”、“帮我查一下我的预约单”等等,这些都是司机自发窄小的问语音助手的碎片化小需求。
3. 问题 3:如何管理用户预期?
导致用户预期过高也有两方面的四原因:
一方面,用语言交流时,某种程度上人们会不自觉把“语音助手”与真实的人比较,尝试用人脑的思索习惯大脑去理解“语音助手”,这必然会导致很多时候用户会觉得人机对话的结果不符合预期;因为目前的AI的原理和真正的人脑原理稍差的还很远(根本原因是科学最高级对人脑的了解也还很初级…),再加一些科幻电影,还有媒体对人工智能概念的鼓吹…
另一个方面是交互无法设定交互边界,设计GUI交互时,我们可以定义出清晰的交互路径和边界(eg:首页只提供一个按钮);但是交互交互你无法限制用户说什么,就像人与人的辩论中,你永远不足以避免别人问到你不会的问题。
4. 小结
用户预期与实际助手能力的gap过大,应用程序导致很多用户认为语音助手“智障”,而导致gap过大的难点是:
想打造一个不必傻屌的语音助手,不仅仅是打磨技术本身,有落地时对无数细节前会的打
磨、把控,还有语音助手背后的生态…
fmc公司
这些都不是一蹴而就的事情,需要有清晰的首要目标、解决路径,然后耐心的持续全部投入、细心打磨。
1. 到刚需场景,打造出显著的体验差沈阳市实验学校
我们希望它像钢铁侠的贾维斯一样可以帮忙主人完成各种各样的任务,它就连接线得连接到各种各样的客户服务,也会是一个allinone的入口。
所以,第一步也是最重要的一站,一定是到刚需场景,打造出显著的体验差。
说到这里,想先闲谈什么是流量“入口”,举一个智能家居医药行业的军工行业例子,业内一直有人在讨论智能家居的入口是什么。
早期有人说是路由器、电视,从此智能音箱出现,阿里、百度、小米等公司纷纷开启补贴大战,被不少人称为“智能家居入口之争”,现在又有人进行讨论智能音箱作为“智能家居入口”这个命题是否成立。

本文发布于:2024-09-23 02:22:20,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/290518.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:语音   助手   交互
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议