显示设备、控制方法和存储介质与流程



1.本公开涉及显示技术领域,尤其涉及一种显示设备、控制方法和存储介质。


背景技术:



2.目前的显示设备,能够支持用户语音交互,用户可通过语音去控制显示设备,如语音控制显示设备的音量大小、语音搜索显示设备中的相关信息等。
3.显示设备在接收到用户发出的语音控制信息时,需要将语音控制信息发送至服务器进行语义分析,并基于服务器返回的语义分析结果才能够对用户的语音信息进行响应,然而,用户与显示设备的每一次交互都需要服务器进行语义分析,会增大服务器压力,导致服务器资源损耗较大。


技术实现要素:



4.为了解决上述技术问题或者至少部分地解决上述技术问题,本公开提供了一种显示设备、控制方法和存储介质,可以在接收到用户的目标控制请求时,在设备端基于预设文本库对其进行语义匹配,避免每次用户交互时都需要上传服务器消耗服务端资源的问题,能够有效节省服务端压力,提升交互控制效率。
5.第一方面,本公开提供了一种显示设备,该显示设备包括:
6.控制器,被配置为:接收用户对所述显示设备的目标控制请求;
7.响应于所述目标控制请求,获取目标控制文本,基于预设文本库对所述目标控制文本进行语义匹配,得到语义匹配结果,所述预设文本库中包括:预设用语信息以及预设资源信息;
8.基于所述语义匹配结果,执行所述目标控制请求对应的控制指令;
9.显示器,被配置为:显示执行所述控制指令对应的响应界面。
10.第二方面,本公开提供了一种控制方法,包括:
11.接收用户对所述显示设备的目标控制请求;
12.响应于所述目标控制请求,获取目标控制文本,基于预设文本库对所述目标控制文本进行语义匹配,得到语义匹配结果,所述预设文本库中包括:预设用语信息以及预设资源信息;
13.基于所述语义匹配结果,执行所述目标控制请求对应的控制指令;
14.显示执行所述控制指令对应的响应界面。
15.第三方面,本公开提供了一种计算机可读存储介质,包括:计算机可读存储介质上存储计算机程序,计算机程序被处理器执行时实现如第二方面所示的控制方法。
16.第四方面,本公开提供了一种计算机程序产品,其特征在于,包括:当计算机程序产品在计算机上运行时,使得计算机实现如第二方面所示的控制方法。
17.本公开实施例提供的技术方案与现有技术相比具有如下优点:显示设备在接收到用户发送的对显示设备的目标控制请求之后,对目标控制请求进行文本转换,得到目标控
制文本,基于预设文本库对目标控制文本进行语义匹配,确定语义匹配结果,能够在设备端实现与用户交互时的语义理解,并基于语义匹配结果,执行目标控制请求对应的控制指令,显示执行控制指令对应的响应界面,通过上述方法能够在设备端基于预设文本库对其进行语义匹配,避免每次用户交互时都需要上传服务器消耗服务端资源的问题,能够有效节省服务端压力,提升交互控制效率。
附图说明
18.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
19.为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
20.图1为根据本公开一个或多个实施例的显示设备与控制装置之间操作场景的示意图;
21.图2为根据本公开一个或多个实施例的控制设备100的硬件配置框图;
22.图3为根据本公开一个或多个实施例的显示设备200的硬件配置框图;
23.图4为根据本公开一个或多个实施例的显示设备200中软件配置示意图;
24.图5为根据本公开一个或多个实施例的显示设备200中应用程序的图标控件界面显示示意图;
25.图6a为根据本公开一个或多个实施例进行控制的系统框架图;
26.图6b为根据本公开一个或多个实施例进行控制的架构图;
27.图7a为本公开实施例提供的一种控制方法的流程示意图;
28.图7b为本公开实施例提供的一种显示设备的界面示意图;
29.图7c为本公开实施例提供的另一种显示设备的界面示意图;
30.图7d为本公开实施例提供的又一种显示设备的界面示意图;
31.图7e为本公开实施例提供的又一种显示设备的界面示意图;
32.图7f为本公开实施例提供的又一种显示设备的界面示意图;
33.图7g为本公开实施例提供的又一种显示设备的界面示意图;
34.图8a为本公开实施例提供的一种目标控制文本与候选用语匹配的结构示意图;
35.图8b为本公开实施例提供的另一种目标控制文本与候选用语匹配的结构示意图;
36.图8c为本公开实施例提供的又一种目标控制文本与候选用语匹配的结构示意图;
37.图8d为本公开实施例提供的又一种目标控制文本与候选用语匹配的结构示意图;
38.图8e为本公开实施例提供的又一种目标控制文本与候选用语匹配的结构示意图;
39.图8f为本公开实施例提供的一种显示设备与服务器通信的结构示意图。
具体实施方式
40.为了能够更清楚地理解本公开的上述目的、特征和优点,下面将对本公开的方案进行进一步描述。需要说明的是,在不冲突的情况下,本公开的实施例及实施例中的特征可以相互组合。
41.在下面的描述中阐述了很多具体细节以便于充分理解本公开,但本公开还可以采用其他不同于在此描述的方式来实施;显然,说明书中的实施例只是本公开的一部分实施例,而不是全部的实施例。
42.显示设备能够通过与用户交互,在显示界面中响应用户的控制指令,其中,用户可向显示设备发送语音控制信息,来对显示设备进行相应语音控制,显示设备在接收到用户发送的语音控制信息之后,会将语音控制信息发送给服务器,便于进行语义分析,从而,能够基于服务器返回的语义分析结果,执行相应的控制。
43.然而,对于同一个用户,可能会有很多固定的语言习惯,比如控制显示设备的音量大小时,有的用户喜欢说“升高音量”,有的用户则喜欢说“声音大一点”,对于固定用户来说,每一个用户对于控制需求的说法基本不会发生太大变化,显示设备每次在接收到用户的语音控制信息时,都需要在服务端进行语音分析,会浪费服务端的资源。
44.为了解决上述问题,本公开实施例中显示设备在接收到用户发送的对显示设备的目标控制请求之后,对目标控制请求进行文本转换,得到目标控制文本,基于预设文本库对目标控制文本进行语义匹配,确定语义匹配结果,能够在设备端实现与用户交互时的语义理解,并基于语义匹配结果,执行目标控制请求对应的控制指令,显示执行控制指令对应的响应界面,通过上述方法能够在设备端基于预设文本库对其进行语义匹配,避免每次用户交互时都需要上传服务器消耗服务端资源的问题,能够有效节省服务端压力,提升交互控制效率。
45.图1为本公开一个或多个实施例的显示设备与控制装置之间操作场景的示意图。如图1所示,用户可向显示设备200说出语音控制信息,或者,用户可向显示设备200的控制装置100(或者与显示设备200关联的智能设备300)发出语音控制信息,实现对显示设备的语义控制,使得显示设备200在设备端本地进行语义匹配,对用户发出的语音控制信息进行有效识别,并执行相关控制指令,显示执行控制指令对应的响应界面,便于用户体验。
46.在一些实施例中,用户可用过遥控器或手机打开显示设备,并通向显示设备发送语音控制信息,显示设备能够对这些语音控制信息进行语义匹配,识别用户需求。
47.示例性的,用户可在显示设备的观看位置向显示设备发送语音数据,由显示设备的麦克风阵列收集用户说出的语音数据并进行语义匹配,其中,显示设备上可设置多个预设位置,用来装载麦克风阵列,便于对外界语音数据进行有效获取,如,可在显示设备的显示底部设置多个预设位置,如第一位置、第二位置以及第三位置,第一位置中可装载一个麦克风阵列,第二位置中可装载一个麦克风阵列,第三位置中可装载一个麦克风阵列,或者,可在显示设备的显示上部设置多个预设位置,如第四位置、第五位置以及第六位置,第四位置中可装载一个麦克风阵列,第五位置中可装载一个麦克风阵列,第六位置中可装载一个麦克风阵列,或者,可在显示设备的显示左侧设置多个预设位置,如第七位置、第八位置以及第九位置,第七位置中可装载一个麦克风阵列,第八位置中可装载一个麦克风阵列,第九位置中可装载一个麦克风阵列,或者,可在显示设备的显示右侧设置多个预设位置,如第十位置、第十一位置以及第十二位置,第十位置中可装载一个麦克风阵列,第十一位置中可装载一个麦克风阵列,第十二位置中可装载一个麦克风阵列,则在显示设备接收到用户的语音数据时,能够有效快速的进行语义匹配,以响应用户,从而,解决了现有技术中的问题,能够在设备端基于预设文本库对其进行语义匹配,避免每次用户交互时都需要上传服务器消
耗服务端资源的问题,能够有效节省服务端压力,提升交互控制效率。
48.需要说明的是,显示设备中麦克风阵列的装载位置可同时安装在显示的不同区域,第一区域、第二区域、......、第十二区域,可同时存在,从而,能够更有效准确的获取语音数据,本公开对此不做具体限定。
49.在一些实施例中,控制装置100可以是遥控器,遥控器和显示设备的通信包括红外协议通信、蓝牙协议通信、无线或其他有线方式来控制显示设备200。用户可以通过遥控器上按键、语音输入以及控制面板输入等输入用户指令,来控制显示设备200。在一些实施例中,也可以使用移动终端、平板电脑、计算机、笔记本电脑和其他智能设备来控制显示设备200。
50.在一些实施例中,显示设备200可以不使用上述的智能设备或控制设备接收指令,而是通过触摸或者手势或者语音输入等方式接收用户的控制。
51.在一些实施例中,显示设备200还可以采用除了控制装置100和智能设备300之外的方式进行控制,例如,可以通过显示设备200设备内部配置的获取语音指令的模块直接接收用户的语音指令控制,也可以通过显示设备200设备外部设置的语音控制设备来接收用户的语音指令控制。
52.在一些实施例中,智能设备300可与显示设备200中安装的软件应用,通过网络通信协议实现连接通信,实现一对一控制操作的和数据通信的目的。也可以将智能设备300上显示的音视频内容传输到显示设备200上,实现同步显示功能。显示设备200还与服务器400通过多种通信方式进行数据通信,可允许显示设备200通过局域网(lan)、无线局域网(wlan)和其他网络进行通信连接。服务器400可以是一个集,也可以是多个集,可以包括一类或多类服务器。服务器400可以向显示设备200提供各种内容和互动。显示设备200,可以为液晶显示器、oled显示器或者投影显示设备等。显示设备200除了提供广播接收电视功能之外,还可以附加提供计算机支持功能的智能网络电视功能。
53.图2示例性示出了根据示例性实施例中控制装置100的配置框图。如图2所示,控制装置100包括控制器110、通信接口130、用户输入/输出接口140、存储器、供电电源。控制装置100可接收用户的输入操作指令,且将操作指令转换为显示设备200可识别和响应的指令,起用用户与显示设备200之间交互中介作用。通信接口130用于和外部通信,包含wifi芯片,蓝牙模块,nfc或可替代模块中的至少一种。用户输入/输出接口140包含麦克风,触摸板,传感器,按键或可替代模块中的至少一种。
54.图3示出了根据示例性实施例中显示设备200的硬件配置框图。如图3所示显示设备200包括调谐解调器210、通信器220、检测器230、外部装置接口240、控制器250、显示器260、音频输出接口270、存储器、供电电源、用户接口(即用户输入接口)280中的至少一种。控制器250包括中央处理器,视频处理器,音频处理器,图形处理器,ram,rom,用于输入/输出的第一接口至第n接口。显示器260可为液晶显示器、oled显示器、触控显示器以及投影显示器中的至少一种,还可以为一种投影装置和投影屏幕。调谐解调器210通过有线或无线接收方式接收广播电视信号,以及从多个无线或有线广播电视信号中解调出音视频信号,如以及epg数据信号。通信器220是用于根据各种通信协议类型与外部设备或服务器进行通信的组件。例如:通信器可以包括wifi模块,蓝牙模块,有线以太网模块等其他网络通信协议芯片或近场通信协议芯片,以及红外接收器中的至少一种。显示设备200可以通过通信器
220与外部控制设备100或服务器400建立控制信号和数据信号的发送和接收。检测器230用于采集外部环境或与外部交互的信号。控制器250和调谐解调器210可以位于不同的分体设备中,即调谐解调器210也可在控制器250所在的主体设备的外置设备中,如外置机顶盒等。用户接口280可用于接收控制装置100(如:红外遥控器等)的控制信号。
55.在一些实施例中,控制器250,通过存储在存储器上中各种软件控制程序,来控制显示设备的工作和响应用户的操作。控制器250控制显示设备200的整体操作。用户可在显示器260上显示的图形用户界面(gui)输入用户命令,则用户输入接口通过图形用户界面(gui)接收用户输入命令。或者,用户可通过输入特定的声音或手势进行输入用户命令,则用户输入接口通过传感器识别出声音或手势,来接收用户输入命令。
56.在一些实施例中,“用户界面”,是应用程序或操作系统与用户之间进行交互和信息交换的介质接口,它实现信息的内部形式与用户可以接受形式之间的转换。用户界面常用的表现形式是图形用户界面(graphic user interface,简称gui),是指采用图形方式显示的与计算机操作相关的用户界面。它可以是在电子设备的显示屏中显示的一个图标、窗口和控件等界面元素,其中控件可以包括图标、按钮、菜单、选项卡、文本框、对话框、状态栏、导航栏、widget等可视的界面元素中的至少一种。
57.图4为根据本公开一个或多个实施例的显示设备200中软件配置示意图,如图4所示,将系统分为四层,从上至下分别为应用程序(applications)层(简称“应用层”),应用程序框架(application framework)层(简称“框架层”),安卓运行时(android runtime)和系统库层(简称“系统运行库层”),以及内核层。
58.在一些实施例中,应用程序层中运行有至少一个应用程序,这些应用程序可以是操作系统自带的窗口(window)程序、系统设置程序或时钟程序等;也可以是第三方开发者所开发的应用程序。在具体实施时,应用程序层中的应用程序包括但不限于以上举例。
59.在一些实施例中,系统运行库层为上层即框架层提供支撑,当框架层被使用时,安卓操作系统会运行系统运行库层中包含的c/c++库以实现框架层要实现的功能。
60.在一些实施例中,内核层是硬件和软件之间的层,至少包含以下驱动中的至少一种:音频驱动、显示驱动、蓝牙驱动、摄像头驱动、wifi驱动、usb驱动、hdmi驱动、传感器驱动(如指纹传感器,温度传感器,压力传感器等)、以及电源驱动等。
61.图5为根据本公开一个或多个实施例的显示设备200中应用程序的图标控件界面显示示意图,如图5中所示,应用程序层包含至少一个应用程序可以在显示器中显示对应的图标控件,如:直播电视应用程序图标控件、视频点播应用程序图标控件、媒体中心应用程序图标控件、应用程序中心图标控件、游戏应用图标控件等。直播电视应用程序,可以通过不同的信号源提供直播电视。视频点播应用程序,可以提供来自不同存储源的视频。不同于直播电视应用程序,视频点播提供来自某些存储源的视频显示。媒体中心应用程序,可以提供各种多媒体内容播放的应用程序。应用程序中心,可以提供储存各种应用程序。
62.在一些实施例中,上述显示设是具有显示功能的终端设备,例如电视机或者平板电视等。该显示设备中:
63.在一些实施例中,控制器250,通过存储在存储器上中各种软件控制程序,来控制显示设备的工作和响应用户的操作。控制器250控制显示设备200的整体操作。用户可在显示器260上显示的图形用户界面(gui)输入用户命令,则用户输入接口通过图形用户界面
(gui)接收用户输入命令。或者,用户可通过输入特定的声音或手势进行输入用户命令,则用户输入接口通过传感器识别出声音或手势,来接收用户输入命令。
64.输出接口(显示器260,和/或,音频输出接口270),被配置为输出用户交互信息;
65.通信器220,用于与服务器400进行通信;
66.控制器250,被配置为:接收用户对所述显示设备的目标控制请求;
67.响应于所述目标控制请求,获取目标控制文本,基于预设文本库对所述目标控制文本进行语义匹配,得到语义匹配结果,所述预设文本库中包括:预设用语信息以及预设资源信息;
68.基于所述语义匹配结果,执行所述目标控制请求对应的控制指令;
69.显示器260,被配置为:显示执行所述控制指令对应的响应界面。
70.在一些实施例中,所述控制器250,具体被配置为:
71.基于预设用语信息对所述目标控制文本进行语义匹配;
72.检测到所述目标控制文本与所述预设用语信息中包括的全部用语均不匹配,基于预设资源信息对所述目标控制文本进行语义匹配,得到语义匹配结果。
73.在一些实施例中,所述控制器250,具体被配置为:
74.检测到所述目标控制文本与所述预设用语信息中包括的候选用语匹配,确定所述目标控制请求对应的控制指令为所述候选用语对应的第一控制指令;
75.执行所述候选用语对应的第一控制指令。
76.在一些实施例中,所述控制器250,具体被配置为:
77.检测到所述目标控制文本与所述预设资源信息中包括的候选资源匹配,确定所述目标控制请求对应的控制指令为所述候选资源对应的第二控制指令;
78.执行所述候选资源对应的第二控制指令。
79.在一些实施例中,所述控制器250,还被配置为:
80.响应于第一信息发送请求,接收服务器发送的预设用语信息,其中,所述预设用语信息是所述服务器基于所述用户的历史控制请求确定出的;
81.将所述预设用语信息添加至预设文本库中。
82.在一些实施例中,所述控制器250,还被配置为:
83.响应于第二信息发送请求,接收服务器发送的预设资源信息,其中,所述预设资源信息是所述服务器基于所述用户的历史控制请求以及所述用户的历史访问量确定出的,所述预设资源信息包括至少两个领域内的热门资源;
84.将所述预设资源信息添加至预设文本库中。
85.在一些实施例中,所述控制器250,具体被配置为:
86.检测到所述目标控制文本与所述预设资源信息中包括的全部资源均不匹配,向服务器发送所述目标控制文本,以使所述服务器对所述目标控制文本进行语义分析,确定与所述目标控制文本对应的第三控制指令;
87.响应于所述服务器发送的所述目标控制文本对应的第三控制指令,执行所述第三控制指令。
88.综上所述,本公开实施例中显示设备在接收到用户发送的对显示设备的目标控制请求之后,对目标控制请求进行文本转换,得到目标控制文本,基于预设文本库对目标控制
文本进行语义匹配,确定语义匹配结果,能够在设备端实现与用户交互时的语义理解,并基于语义匹配结果,执行目标控制请求对应的控制指令,显示执行控制指令对应的响应界面,通过上述方法能够在设备端基于预设文本库对其进行语义匹配,避免每次用户交互时都需要上传服务器消耗服务端资源的问题,能够有效节省服务端压力,提升交互控制效率。
89.图6a为根据本公开一个或多个实施例进行控制的系统框架图,如图6a所示,该系统中可以包括控制请求接收模块601、语义匹配模块602、控制指令执行模块603以及响应界面显示模块604。该系统通过控制请求接收模块601接收用户对所述显示设备的目标控制请求,由语义匹配模块602响应于所述目标控制请求,获取目标控制文本,基于预设文本库对所述目标控制文本进行语义匹配,得到语义匹配结果,所述预设文本库中包括:预设用语信息以及预设资源信息,由控制指令执行模块603基于所述语义匹配结果,执行所述目标控制请求对应的控制指令,并通过响应界面显示模块604显示执行所述控制指令对应的响应界面,从而,能够在设备端基于预设文本库对其进行语义匹配,避免每次用户交互时都需要上传服务器消耗服务端资源的问题,能够有效节省服务端压力,提升交互控制效率。
90.图6b为根据本公开一个或多个实施例进行控制的架构图,基于上述系统框架,本公开在安卓系统中的实现如图6b所示,安卓系统中主要包括应用层、框架层、系统运行库层以及内核层,实现逻辑主要在应用层体现,其中,包括控制请求接收模块、语义匹配模块、控制指令执行模块以及响应界面显示模块。
91.本公开实施例中提供的控制方法,通过实时检测用户的语音行为,接收用户发出的语音数据,收集用户在一次说话时段内的语音数据作为用户对显示设备的目标控制请求,并从目标控制请求进行文本分析,得到目标控制文本,其中,显示设备中可预先存储预设文本库,预设文本库中可用于描述用户习惯性用语的预设用语信息以及用于描述当前热门资源的预设资源信息,通过预设用语信息以及预设资源信息对目标控制文本进行相似度匹配,确定语义匹配结果,使得根据语义匹配结果,在显示设备上执行相应的控制指令来控制显示设备,并显示执行控制指令对应的用户界面,便于用户获知控制结果,从而,能够在设备端进行语义匹配,无需每次交互都需要服务器的参与,减少对服务器的访问次数,避免服务端无效访问较多导致资源损耗的问题,降低服务端压力,提升交互效率。
92.为了更加详细的说明本方案,以下将以示例性的方式结合图7a进行说明,可以理解的是,图7a中所涉及的步骤在实际实现时可以包括更多的步骤,或者更少的步骤,并且这些步骤之间的顺序也可以不同,以能够实现本公开实施例中提供的控制方法为准,本公开实施例不做限定。
93.如图7a所示,图7a为本公开实施例提供的一种控制方法的流程示意图,控制方法具体包括如下步骤:
94.s710、接收用户对显示设备的目标控制请求。
95.其中,显示设备可包括一些能够进行语音交互的智能设备,如,显示设备可包括:智能电视、智能空调、智能冰箱、智能音响等,当然,显示设备还可以包括其他支持语音交互的智能设备,本公开对此不做具体限定。
96.其中,显示设备能够实时收录用户发出的交互语音,来向用户反馈交互语音响应的交互信息。
97.举例而言,在显示设备为智能电视时,用户与智能电视的交互语音可为“声音调
小”,则对应的,用户对智能电视的目标控制请求为“声音调小”,表示出用户有降低音量的需求,智能电视可通过实时采集用户的语音数据,来有效确定出用户对智能电视的目标控制请求。
98.其中,智能电视可实时采集其对应的预设区域内用户的语音数据,若预设时段内未检测到语音数据,或者,检测到语音数据不清楚,则可扩大预设区域进行持续语音收录,从而,有效精准的采集用户的语音数据。
99.需要说明的是,预设区域可为预先设定的智能电视的声场范围对应的区域,或者,预先设定的智能电视周围的其他区域,本公开对此不做具体限定。
100.在显示设备为智能空调时,用户与智能空调的交互语音可为“温度降低”,则对应的,用户对智能空调的目标控制请求为“温度降低”,表示出用户有降低温度的需求,智能空调可通过实时采集用户的语音数据,来有效确定出用户对智能空调的目标控制请求。
101.其中,智能空调可实时采集其对应的预设区域内用户的语音数据,若预设时段内未检测到语音数据,或者,检测到语音数据不清楚,则可扩大预设区域进行持续语音收录,从而,有效精准的采集用户的语音数据。
102.需要说明的是,预设区域可为预先设定的智能空调周围的其他区域,如智能空调的前方指定区域,本公开对此不做具体限定。
103.在显示设备为智能冰箱时,用户与智能冰箱的交互语音可为“打开/开启”,则对应的,用户对智能冰箱的目标控制请求为“打开/开启”,表示出用户有打开冰箱的需求,智能冰箱可通过实时采集用户的语音数据,来有效确定出用户对智能空调的目标控制请求。
104.其中,智能冰箱可实时采集其对应的预设区域内用户的语音数据,若预设时段内未检测到语音数据,或者,检测到语音数据不清楚,则可扩大预设区域进行持续语音收录,从而,有效精准的采集用户的语音数据。
105.需要说明的是,预设区域可为预先设定的智能冰箱周围的其他区域,如智能冰箱的前方指定区域,本公开对此不做具体限定。
106.在显示设备为智能音响时,用户与智能音响的交互语音可为“调大播放音量”,则对应的,用户对智能音响的目标控制请求为“调大播放音量”,表示出用户有增加播放音量的需求,智能音响可通过实时采集用户的语音数据,来有效确定出用户对智能音响的目标控制请求。
107.其中,智能音响可实时采集其对应的预设区域内用户的语音数据,若预设时段内未检测到语音数据,或者,检测到语音数据不清楚,则可扩大预设区域进行持续语音收录,从而,有效精准的采集用户的语音数据。
108.需要说明的是,预设区域可为预先设定的智能音响的声场范围对应的区域,或者,预先设定的智能音响周围的其他区域,本公开对此不做具体限定。
109.其中,对于智能音响,预设区域可与智能音响的当前摆放位置相关,如智能音响由第一位置移动至第二位置时,预设区域可由第一位置对应的第一预设区域变更为第二位置对应的第二位置区域。
110.s720、响应于目标控制请求,获取目标控制文本,基于预设文本库对目标控制文本进行语义匹配,得到语义匹配结果。
111.其中,显示设备可对接收到的目标控制请求进行文本转换操作,由语音数据转换
为文本数据,便于显示设备进行文本匹配。
112.需要说明的是,文本转换操作为将语音数据转换为文本数据的操作,具体的,可通过语音识别算法/语音识别软件实现文本转换操作,本公开对此不做具体限定。
113.其中,显示设备可在设备端基于预设文本库对目标控制文本进行语义匹配,从而,避免与服务端的多次访问,占用服务器资源。
114.其中,预设文本库中可包括:预设用语信息以及预设资源信息,预设用户信息为用户通常情况下的习惯用语,预设资源信息为当前时段内网络上/线上的热门话语。
115.举例而言,预设用语信息可为用户习惯性与显示设备进行语音交互时的话语,在用户与智能电视进行语音交互时,预设用户信息可包括但不限于是:打开电视、开启电视、降低音量、增大音量、关闭电视等,预设资源信息可为:歌曲名称a、电视剧b、视频c等。
116.在用户与智能空调进行语音交互时,预设用户信息可包括但不限于是:打开空调、开启空调、降低温度、增大温度、关闭空调等,预设资源信息可为:26
°
、16
°
等。
117.在用户与智能冰箱进行语音交互时,预设用户信息可包括但不限于是:打开冰箱、开启冰箱、降低温度、增大温度、关闭冰箱等,预设资源信息可为:静音模式、除异味模式等。
118.在用户与智能音响进行语音交互时,预设用户信息可包括但不限于是:打开音响、开启音响、音量调大、音量调小、关闭音响等,预设资源信息可为:歌曲名称d、流行音乐e等。
119.另外,预设文本库可与用户相对应,也就是,不同用户对应的预设用语信息以及预设资源信息不同,可以用户的语音特性为不同用户进行标识,设置与用户唯一对应的预设文本库,便于采集到用户的语音数据时,能够基于与其对应的预设文本库进行相应匹配。
120.举例而言,在确定与显示设备交互的为第一用户时,可基于与第一用户对应的第一预设文本库对目标控制文本进行语义匹配,获得语义匹配结果,或者,在确定与显示设备交互的为第二用户时,可基于与第二用户对应的第二预设文本库对目标控制文本进行语义匹配,获得语义匹配结果。
121.其中,显示设备中可存储多个用户对应的预设文本库,具体的,显示设备中能够存储的预设文本库的数量与显示设备的存储量相关,如对于存储量较大的显示设备可存储较多预设文本库,对于存储量较小的显示设备可存储较少预设文本库,本公开对此不做具体限定。
122.需要说明的是,显示设备可根据存储时间或者用户访问量对其存储的预设文本库进行更新处理。
123.举例而言,显示设备可预先设置一个更新时间(如一周),可选择每周一对存储的预设文本库进行定期清理,如删除一些较长时间未匹配的预设文本库,便于其他新的预设文本库的加入。
124.其中,显示设备在定期更新的同时,也可基于其存储量进行自适应更新,如显示设备中存储了十个用户对应的预设文本库,在检测到有第十一个预设文本库的加入时,可按照预设文本库的使用次数/使用时间删除一个预设文本库,便于新的预设文本库的加入,从而,提升显示设备存储的预设文本库的实用性。
125.再举例而言,显示设备中可记录每个用户的访问量,如第一用户的访问量为2,第二用户的访问量为10,第三用户的访问量为15,则可确定出第一用户不属于常用用户,则在更新时间到达时,可删除第一用户对应的预设文本库,从而,便于对预设文本库进行实时更
新,保证其实用性。
126.s730、基于语义匹配结果,执行目标控制请求对应的控制指令。
127.其中,语义匹配结果能够有效反映出与用户发出的目标控制指令对应的执行内容,从而,有效确定出执行内容对应的控制指令,并执行控制指令。
128.结合上述举例,在显示设备为智能电视时,基于语义匹配结果确定出与用户发出的目标控制指令对应的执行内容为增大音量时,则执行目标控制请求对应的控制指令为将智能电视的当前播放音量增大。
129.在显示设备为智能空调时,基于语义匹配结果确定出与用户发出的目标控制指令对应的执行内容为降低温度时,则执行目标控制请求对应的控制指令为将智能空调的温度降低。
130.在显示设备为智能冰箱时,基于语义匹配结果确定出与用户发出的目标控制指令对应的执行内容为开启冰箱门时,则执行目标控制请求对应的控制指令为将智能冰箱的门打开。
131.在显示设备为智能音响时,基于语义匹配结果确定出与用户发出的目标控制指令对应的执行内容为增大音量时,则执行目标控制请求对应的控制指令为将智能音响的播放音量增大。
132.s740、显示执行控制指令对应的响应界面。
133.其中,响应界面可为在原始界面上新增显示内容,也可为对原始界面进行更改后的显示界面,显示执行控制指令对应的响应界面可分为以下多种实现方式。
134.在一些实施例中,对于执行目标控制请求对应的控制指令不会更改显示设备的当前显示界面时,显示执行控制指令对应的响应界面可为在显示设备的当前显示界面上添加新的显示内容对应的显示界面。
135.结合上述举例,在显示设备为智能电视时,智能电视的当前显示界面播放显示内容1,如图7b示例性所示,目标控制请求对应的控制指令为调大音量,则执行目标控制请求对应的控制指令时,智能设备的当前显示界面不会发生更改,对应的显示执行控制指令对应的响应界面可为在当前显示界面的预设区域中显示调大音量的显示指示,响应界面如图7c示例性所示。
136.在显示设备为智能冰箱时,智能冰箱的当前显示界面显示冰箱冷藏室温度为5℃,如图7d示例性所示,目标控制请求对应的控制指令为冷藏室温度调整至1℃,则执行目标控制请求对应的控制指令时,智能设备的当前显示界面不会发生更改,对应的显示执行控制指令对应的响应界面可为在当前显示界面的温度显示区域调整显示温度为1℃,并可显示已调整消息,响应界面如图7e示例性所示。
137.在另一些实施例中,对于执行目标控制请求对应的控制指令会更改显示设备的当前显示界面时,显示执行控制指令对应的响应界面可为对显示设备的当前显示界面进行更改后的另一个显示界面。
138.结合上述举例,在显示设备为智能电视时,智能电视的当前显示界面显示电视剧1的第一集,播放内容为显示内容2,如图7f示例性所示,目标控制请求对应的控制指令为播放下一集,,则执行目标控制请求对应的控制指令时,智能电视的当前显示界面会变化为另一个显示界面,对应的显示执行控制指令对应的响应界面可为当前显示界面变化后的下一
集对应的显示界面,显示电视剧1的第二集,播放内容为显示内容3,响应界面如图7g示例性所示。
139.基于上述实施例的描述,在确定语义匹配结果时,可依次根据预设文本库中的预设用语信息以及预设资源信息对目标控制文本进行语义匹配,如先将预设用语信息中包括的全部候选用语与目标控制文本进行语义匹配,若预设用语信息中包括的全部候选用语中没有一个能够与目标控制文本匹配成功,则可选用预设资源信息中包括的全部候选资源对目标控制文本进行一一匹配,从而,确定出语义匹配结果。
140.其中,可设置一个匹配阈值,从来衡量目标控制文本与预设用语信息中包括的每个候选用语的匹配度,如匹配阈值可设置为85%,若目标控制文本与预设用语信息中包括的候选用语的匹配度大于85%,则确定匹配成功,若目标控制文本与预设用语信息中包括的候选用语的匹配度小于或等于85%,则确定匹配失败。
141.如图8a示例性所示,目标控制文本与预设用语信息中包括的五个候选用语进行匹配,其中,目标控制文本与候选用语1的匹配度为25%,目标控制文本与候选用语2的匹配度为28%,目标控制文本与候选用语3的匹配度为40%,目标控制文本与候选用语4的匹配度为50%,目标控制文本与候选用语5的匹配度为10%。
142.其中,在确定出目标控制文本与预设用语信息中的一个候选用语匹配(匹配度高于85%),则可确定出目标控制请求对应的控制指令与这个候选用语对应的第一控制指令相同,可执行第一控制指令,用于对目标控制请求进行响应。
143.如图8b示例性所示,目标控制文本与预设用语信息中包括的五个候选用语进行匹配,其中,目标控制文本与候选用语1的匹配度为25%,目标控制文本与候选用语2的匹配度为90%,目标控制文本与候选用语3的匹配度为40%,目标控制文本与候选用语4的匹配度为50%,目标控制文本与候选用语5的匹配度为10%,则可确定出与目标控制文本匹配的候选用语为候选用语2。
144.需要说明的是,若确定出有至少两个候选用语与目标控制文本的匹配度高于85%,则可选择匹配度最高的候选用语作为与目标控制文本匹配成功的候选用语。
145.如图8c示例性所示,目标控制文本与预设用语信息中包括的五个候选用语进行匹配,其中,目标控制文本与候选用语1的匹配度为25%,目标控制文本与候选用语2的匹配度为90%,目标控制文本与候选用语3的匹配度为92%,目标控制文本与候选用语4的匹配度为50%,目标控制文本与候选用语5的匹配度为10%,则可确定出与目标控制文本匹配的候选用语为候选用语3。
146.其中,在基于预设资源信息与目标控制文本进行匹配时,可将预设资源信息中的全部候选资源与目标控制文本进行匹配,若预设资源信息中包括的全部候选资源中存在能够与目标控制文本匹配成功的候选资源,则可确定出目标控制请求对应的控制指令与这个候选资源对应的第二控制指令相同,可执行第二控制指令,用于对目标控制请求进行响应。
147.其中,可设置一个匹配阈值,从来衡量目标控制文本与预设资源信息中包括的每个候选资源的匹配度,如匹配阈值可设置为85%,若目标控制文本与预设资源信息中包括的候选资源的匹配度大于85%,则确定匹配成功,若目标控制文本与预设资源信息中包括的候选资源的匹配度小于或等于85%,则确定匹配失败。
148.如图8d示例性所示,目标控制文本与预设资源信息中包括的三个候选资源进行匹
配,其中,目标控制文本与候选资源1的匹配度为40%,目标控制文本与候选资源2的匹配度为93%,目标控制文本与候选资源3的匹配度为20%,则可确定出与目标控制文本匹配的候选资源为候选用语2。
149.需要说明的是,若确定出有至少两个候选资源与目标控制文本的匹配度高于85%,则可选择匹配度最高的候选资源作为与目标控制文本匹配成功的候选资源。
150.如图8e示例性所示,目标控制文本与预设资源信息中包括的三个候选资源进行匹配,其中,目标控制文本与候选资源1的匹配度为90%,目标控制文本与候选资源2的匹配度为86%,目标控制文本与候选资源3的匹配度为20%,则可确定出与目标控制文本匹配的候选资源为候选用语1。
151.其中,服务器可基于用户的历史访问数据预先确定出预设文本库,并向显示设备发送预设文本库进行存储。
152.服务器可基于预设用语信息的更新频率向显示设备发送一个第一信息发送请求,使得显示设备接收服务器发送的预设用语信息,来构建/更新预设文本库。
153.从而,使得显示设备在与用户进行交互时,能够在设备端基于预设用语信息理解用户意图,快速向用户反馈。
154.其中,服务器在确定预设用语信息时,可根据用户语音访问历史数据统计出用户习惯性用语,用户访问历史数据的展示形式如下表1所示。
155.表1用户访问历史数据
156.标识用户输入分类返回结果887歌手1的歌曲a音乐结果a
157.其中,结果a为:{"msg":"","slots":[{"name":"singer","value":"歌手1"},{"name":"song","value":"歌曲a"}],"code":0,"session_complete":true,"domain":"music","skill_id":"990835315751129088","intent":"play"}。
[0158]
其中,可通过分组查询获取用户高频次的说法,为了提升准确度,分组条件可为用户总访问次数》=1000,某个说法次数》=30,每个用户的习惯性用语获取前20条。
[0159]
获取这个用户id的哈希值,然后对7(假设在凌晨1-6点之间推送数据)取模,获取分类值(slot),将数据保存在对应表2中,如下表2所示。
[0160]
表2用户访问历史数据分类值
[0161]
标识用户输入分类返回结果slot887歌手1的歌曲a音乐结果a4
[0162]
服务器可基于预设资源信息的更新频率向显示设备发送一个第二信息发送请求,使得显示设备接收服务器发送的预设资源信息,来构建/更新预设文本库。
[0163]
从而,使得显示设备在与用户进行交互时,能够基于预设资源在设备端理解用户意图,快速向用户反馈。
[0164]
其中,服务器在确定预设资源信息时,可根据根据用户画像获取对应领域下的热点媒资信息,用户画像为通过收集用户社会属性、消费习惯、偏好特征等各个维度数据,进而对用户或者产品特征属性的刻画,并对这些特征分析统计挖掘潜在价值信息,从而抽象出一个用户的全貌。具体如下所示。
[0165]
创建各个领域的热门资源:根据所有用户的搜索结果以及当前热搜榜单等信息获
得各个领域的热门资源,如下表3所示。
[0166]
表3热门资源
[0167]
类型用户输入分类返回结果音乐歌手1的歌曲a音乐结果a电影歌手1的电影电影结果b
[0168]
其中,结果b为:{"msg":"","slots":[{"name":"singer","value":"歌手1"},{"name":"song","value":"电影"}],"code":0,"session_complete":true,"domain":"music","skill_id":""990836308639354880"","intent":"play"}。
[0169]
根据用户语音历史访问数据创建用户画像:根据访问量的多少并对同一个用户的画像标签进行排名如下表4。
[0170]
表4画像标签排名
[0171]
标识用户名称标签标签类型排序887用户1音乐music1887用户2电影movie2
[0172]
获取热门资源:根据标签类型获取对应领域热点媒资结果,获取用户标识的哈希值,然后对7(假设在凌晨1-6点之间推送数据)取模,获取slot值,数据保存在对应表5中。
[0173]
表5数据存储
[0174]
标识用户输入标签类型返回结果slot887歌手1的音乐music结果a4887歌手1的电影movie结果b4
[0175]
服务器在确定出与用户关联的预设用语信息和预设资源信息之后,可定期将预设用语信息和预设资源信息发送至显示设备,便于显示设备存储/更新。
[0176]
其中,用户习惯性用语(预设用语信息)变化范围较小,更新频次低,可设置每月更新一次,网络热词媒资信息(预设资源信息)更新频率较高,可设置每天更新一次,如服务器可设置在每月1号凌晨1点到6点之间根据表2中的slot值在每个整点之间进行推送,例如:1点到2点之间推送slot值为1的数据,依次类推,同理对于表5,每天凌晨1点到6点根据slot值进行推送。
[0177]
另外,如图8f示例性所示,显示设备和服务器之间的交互可采用轻量级的消息队列遥测传输(message queuing telemetry transport,mqtt)发布/订阅消息传输协议,每个显示设备和服务器之间建立对应主题,采用qos1(数据发送方与数据接收方之间的一种协议)服务质量,并设置过期时间为120秒,服务器端根据上述规程分别向对应主题发送网络热词媒资信息和用户习惯用语信息,若对应消息消费成功,在数据库对应数据标志位置为1。
[0178]
其中,对于特殊场景,如用户长时间未开机,开机之后服务器只推送当月的用户习惯用语和当天的网络热词媒资信息;如用户读取消息失败,服务器会再次发送消息,至少一次到达显示设备。
[0179]
其中,mqtt是机器对机器/物联网连接协议,它被设计为一个极其轻量级的发布/订阅消息传输协议,对于需要较小代码占用空间和/或网络带宽非常宝贵的远程连接非常
有用,是专为受限设备和低带宽、高延迟或不可靠的网络而设计,这些原则也使该协议成为新兴的“机器到机器”或物联网世界的连接设备,以及带宽和电池功率非常高的移动应用的理想选择,具有它体积小、功耗低、数据包最小的优势,并且可以有效地将信息分配给一个或多个接收器。
[0180]
需要说明的是,由于mqtt采用的qos1传输协议,显示设备会接收到重复消息,对于重复接收到的消息,显示设备可采用覆盖消息的策略进行消息存储。
[0181]
综上所述,本公开通过在显示设备上执行上述控制方法,显示设备在接收到用户发送的对显示设备的目标控制请求之后,对目标控制请求进行文本转换,得到目标控制文本,基于预设文本库对目标控制文本进行语义匹配,确定语义匹配结果,能够在设备端实现与用户交互时的语义理解,并基于语义匹配结果,执行目标控制请求对应的控制指令,显示执行控制指令对应的响应界面,通过上述方法能够在设备端基于预设文本库对其进行语义匹配,避免每次用户交互时都需要上传服务器消耗服务端资源的问题,能够有效节省服务端压力,提升交互控制效率。
[0182]
本公开实施例提供一种计算机可读存储介质,该计算机可读存储介质上存储计算机程序,该计算机程序被处理器执行时实现上述控制方法执行的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
[0183]
其中,该计算机可读存储介质可以为只读存储器(read-only memory,rom)、随机存取存储器(random access memory,ram)、磁碟或者光盘等。
[0184]
本公开提供一种计算机程序产品,其特征在于,包括:当所述计算机程序产品在计算机上运行时,使得所述计算机实现上述的控制方法。
[0185]
为了方便解释,已经结合具体的实施方式进行了上述说明。但是,上述在一些实施例中讨论不是意图穷尽或者将实施方式限定到上述公开的具体形式。根据上述的教导,可以得到多种修改和变形。上述实施方式的选择和描述是为了更好的解释原理以及实际的应用,从而使得本领域技术人员更好的使用实施方式以及适于具体使用考虑的各种不同的变形的实施方式。

技术特征:


1.一种显示设备,其特征在于,包括:控制器,被配置为:接收用户对所述显示设备的目标控制请求;响应于所述目标控制请求,获取目标控制文本,基于预设文本库对所述目标控制文本进行语义匹配,得到语义匹配结果,所述预设文本库中包括:预设用语信息以及预设资源信息;基于所述语义匹配结果,执行所述目标控制请求对应的控制指令;显示器,被配置为:显示执行所述控制指令对应的响应界面。2.根据权利要求1所述的显示设备,其特征在于,所述控制器,具体被配置为:基于预设用语信息对所述目标控制文本进行语义匹配;检测到所述目标控制文本与所述预设用语信息中包括的全部用语均不匹配,基于预设资源信息对所述目标控制文本进行语义匹配,得到语义匹配结果。3.根据权利要求2所述的显示设备,其特征在于,所述控制器,具体被配置为:检测到所述目标控制文本与所述预设用语信息中包括的候选用语匹配,确定所述目标控制请求对应的控制指令为所述候选用语对应的第一控制指令;执行所述候选用语对应的第一控制指令。4.根据权利要求2所述的显示设备,其特征在于,所述控制器,具体被配置为:检测到所述目标控制文本与所述预设资源信息中包括的候选资源匹配,确定所述目标控制请求对应的控制指令为所述候选资源对应的第二控制指令;执行所述候选资源对应的第二控制指令。5.根据权利要求1所述的显示设备,其特征在于,所述控制器,还被配置为:响应于第一信息发送请求,接收服务器发送的预设用语信息,其中,所述预设用语信息是所述服务器基于所述用户的历史控制请求确定出的;将所述预设用语信息添加至预设文本库中。6.根据权利要求1所述的显示设备,其特征在于,所述控制器,还被配置为:响应于第二信息发送请求,接收服务器发送的预设资源信息,其中,所述预设资源信息是所述服务器基于所述用户的历史控制请求以及所述用户的历史访问量确定出的,所述预设资源信息包括至少两个领域内的热门资源;将所述预设资源信息添加至预设文本库中。7.根据权利要求2所述的显示设备,其特征在于,所述控制器,具体被配置为:检测到所述目标控制文本与所述预设资源信息中包括的全部资源均不匹配,向服务器发送所述目标控制文本,以使所述服务器对所述目标控制文本进行语义分析,确定与所述目标控制文本对应的第三控制指令;响应于所述服务器发送的所述目标控制文本对应的第三控制指令,执行所述第三控制指令。8.一种控制方法,其特征在于,包括:接收用户对显示设备的目标控制请求;响应于所述目标控制请求,获取目标控制文本,基于预设文本库对所述目标控制文本进行语义匹配,得到语义匹配结果,所述预设文本库中包括:预设用语信息以及预设资源信息;
基于所述语义匹配结果,执行所述目标控制请求对应的控制指令;显示执行所述控制指令对应的响应界面。9.一种计算机可读存储介质,其特征在于,包括:所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如权利要求8所述的控制方法。

技术总结


本公开涉及一种显示设备、控制方法和存储介质,应用于显示技术领域,解决现有的显示设备需要将用户发出的语音控制信息发送至服务器进行语义分析,从而造成服务器资源损耗的问题。该显示设备包括:控制器,被配置为:接收用户对显示设备的目标控制请求;响应于目标控制请求,获取目标控制文本,基于预设文本库对目标控制文本进行语义匹配,得到语义匹配结果,预设文本库中包括:预设用语信息以及预设资源信息;基于语义匹配结果,执行目标控制请求对应的控制指令;显示器,被配置为:显示执行控制指令对应的响应界面。指令对应的响应界面。指令对应的响应界面。


技术研发人员:

王建君 李霞 张立泽

受保护的技术使用者:

海信视像科技股份有限公司

技术研发日:

2022.06.22

技术公布日:

2022/10/25

本文发布于:2024-09-23 03:09:57,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/1/21212.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:文本   目标   所述   用户
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议