概述智能助理的完整交互过程

4p理论
概述智能助理的完整交互过程
本文从智能助理的基本逻辑出发,详细分析了国内外主要智能助理亚马逊ALEXA、Google Assistant、苹果Siri、微软Cortana的发展历史和主要功能,并给出自己对其体验和分析预测。
随着人工智能行业的发展,智能个人助理作为人工智能系统应用相对成熟的领域也慢慢被大众熟知。
智能助理可以理解为利用AI技术通过统一的对话交互界面来一站式给用户提供需要的信息和服务。
一、智能助理基本逻辑
智能助理也可以看作是任务导向的chatbot,实现逻辑与chatbot相似,但是多了业务处理的流程,智能助理会根据对话管理返回的结果进行相关业务的处理。
通常智能助理一个完整的交互流程是这样的:
首先:音频被记录在设备上,经过压缩传输到云端。通常会采用降噪算法来记录音频,以便云端“大脑”更容易理解用户的命令。然后使用“语音到文本”平台将音频转换成文本命令。通过指定的频率对模拟信号进行采样,将模拟声波转换为数字数据,分析数字数据以确定音素的出现位置。一旦识别出音素,就使用算法来确定对应的文本。
然后:使用自然语言理解技术来处理文本,首先使用词性标注来确定哪些词是形容词、动词和名词等,然后将这种标记与统计机器学习模型相结合起来,推断句子的含义。
最后:进入对话管理模块,确认用户提供的信息是否完整,否则进行多轮对话直至得到所需全部信息。根据得到的信息进行相应的业务处理,执行命令。同时将结果生成自然语言文本,并由语音合成模块将生成文本转换为语音。在这些模块中,对话管理(DM)模块的首要任务是要负责管理整个对话的流程。
二、亚马逊ALEXA
亚马逊于2014年推出智能音箱Echo,主要功能集中在语音购物和对智能家居的控制上。随着Echo成为家庭的交互入口,其搭载的“大脑”Alexa智能语音助手也开始遍地开花。
通过亚马逊Alexa与智能家居设备的连接,用户可以轻松控制智能家居设备,如开关灯、开关窗帘、开关电视等。Alexa还可以通过多个信息源播放流媒体音乐和阅读新闻,提供天气、交通等信息,以及通过语音在Amazon Prime会员服务上购物,甚至还可以预订比萨。
三、Google Assistant
2016年5月,谷歌重磅发布了全新语音智能助手Google Assistant。
背靠Google十余年的努力,GoogleAssistant利用了大数据、机器学习、自然语义分析等一系列技术,能够在不断对话之中为用户解决问题,而不像之前那样只能用简单的提问和回答。
在技术强化之外,GoogleAssistant的产品逻辑也在不断进化。通过让视觉、语音、文字等多个人机交互方式的无缝组合,实现更积极地对话,以及更个性化的推荐。
Google Assistant从某种角度可以说是Google Now的进化版,比Google Now增加了双向对话,且对一些功能进行了优化。
作为Google在AI方面的核心之一,目前Google已经几乎把所有资源和能力都倾向Google Assistant,力图用Google Assistant来把整个市场格局铺开。
今年5月份举办的谷歌I/O大会谷歌CEO Sundar Pichai宣布谷歌助手已经登陆5亿台设备,将于今年底支持30种语言,80多个国家可用。
功率因数测量电路此外,Google Assistant还在积极向外部合作进行拓展,还与70多家智能家居厂商达成了合作,呈现出更加包容的开放性。Google Assistant今年在人机交互的智能性上做出了非常大的突破。
四、苹果Siri
2011年,在iPhone 4s面世的当天,苹果Siri也以智能语音助手的身份初次正式亮相,并成为当时发布会上最大的亮点。
它是苹果在iPhone、iPad等产品中使用的一项智能语音控制系统,目前已经可以支持Apple TV和Apple Watch。
订阅蜂
通过Siri,用户可以轻松地实现设置闹钟、推荐本地商户、进行路线规划、播放音乐、读发短信、安排日程、定时提醒、获取资讯、搜索资料、实时翻译等功能,Siri还通过用户的行为习惯,前瞻性地向用户推荐需要执行的行为等。
Siri其实是语音助手领域里起步比较早的应用,是大众认知里熟悉度最高的个人智能助理,也使大众第一次对智能助手的概念有了认知,“调戏”Siri也曾是风靡一时的娱乐项目。
知网首页
五、微软Cortana
2014年2月,微软公司推出了自己的语音助手小娜(Cortana),并嵌入安装Windows操作系统的计算机和手机中。
它是一款基于语音和文本的虚拟助手,目前已经可以支持Windows、iOS、以及Android系统。借助微软自身深厚的技术功底,Cortana实现了对语音的较高识别率和与系统功能的深度集成,给用户带来了不少便利。
Cortana可以处理事务提醒和日常预约,设置闹钟,同时它还能启动Bing(必应)搜索引擎获取体育,天气和其他信息。
六、小结
会议纪要与会议记录的区别因为所面对的用户体不同,用户使用习惯也有很大差别,中外AI头部企业在智能助理这一领域发力方向也都不尽相同。
phh

本文发布于:2024-09-24 02:28:20,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/290385.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:智能   语音   用户   助理   进行
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议