媒体输出控制方法、装置、设备及可读介质与流程

1.本技术实施例涉及智能控制技术领域，具体涉及一种媒体输出控制方法、装置、设备及可读介质。

背景技术：

2.智能监管设备在家庭以及企业单位的应用日益广泛。
3.为了实现特定的提醒目的，用户需要通过触按智能监管设备上的特定按钮来触发智能监管设备输出媒体信号，以通过媒体信号提醒家庭或者企业单元内的人员。
4.然而，触发智能监管设备输出提醒的方式较为单一，如果用户不熟悉智能监管设备，则无法很快到相应的按钮，也就无法通过触按按钮来触发智能监管设备输出提醒，从而无需及时和有效地向家庭或者企业单元的人员发出提醒。

技术实现要素：

5.本技术实施例提出了一种媒体输出控制方法、装置、设备及可读介质。
6.第一方面，本技术实施例提供了一种媒体输出控制方法，包括：获得第一传感器感应到的第一特征信息；获得第二传感器感应到的第二特征信息，所述第一特征信息与所述第二特征信息为用于表征存在目标动作的可能性特征，且所述第一特征信息与第二特征信息属于不同维度的特征信息，所述目标动作为触发输出媒体信号的动作；如果所述第一特征信息和第二特征信息满足设定条件，确定与所述第一特征信息和第二特征信息匹配的媒体输出特征，所述设定条件为表征存在所述目标动作的条件；输出具有所述媒体输出特征的媒体信号。
7.在一些实施例中，所述获得第一传感器感应到的第一特征信息，包括：获得第一传感器感应到的声音特征信息；所述获得第二传感器感应到的第二特征信息，包括：获得第二传感器感应到的振动特征信息。
8.在一些实施例中，所述声音特征信息包括：声音信号的音量大小以及声音信号的发声频率；所述振动特征信息包括：振动信号的振动大小以及振动信号的振动频率；所述如果所述第一特征信息和第二特征信息满足设定条件，确定与所述第一特征信息和第二特征信息匹配的媒体输出特征，包括：如果所述声音信号的音量大小和所述振动信号的振动大小满足设定条件，确定与所述声音信号的音量大小和发声频率以及所述振动信号的振动大小和振动频率匹配的媒体输出特征。
9.在一些实施例中，所述确定与所述第一特征信息和第二特征信息匹配的媒体输出特征，包括：
确定与所述第一特征信息和第二特征信息匹配的媒体输出参数；所述输出具有所述媒体输出特征的媒体信号，包括：依据所述媒体输出参数输出媒体信号。
10.在一些实施例中，所述确定与所述第一特征信息和第二特征信息匹配的媒体输出特征，包括：确定与所述第一特征信息和第二特征信息匹配的音频类型；所述输出具有所述媒体输出特征的媒体信号，包括：输出符合所述音频类型的音频信号。
11.在一些实施例中，还包括：检测到触按指定按钮的触按事件，输出所述触按事件对应的媒体信号，所述指定按钮为用于触发输出媒体信号的触发按钮；在所述输出具有所述媒体输出特征的媒体信号，或者输出所述触发事件对应的媒体信号之后，还包括：如果在设定时长阈值内未检测到针对所述媒体信号的回应事件，输出访客留言提醒，所述访客留言提醒用于提醒来访者输入留言；获得来访者针对所述访客留言提醒的反馈信息；如果所述反馈信息表征所述来访者同意输入留言，采集所述来访者的多媒体留言信息并存储。
12.在一些实施例中，所述获得来访者针对所述访客留言提醒的反馈信息，包括：获得来访者针对所述访客留言提醒输入的语音信息；所述如果所述反馈信息表征所述来访者同意输入留言，采集所述来访者的多媒体留言信息并存储，包括：如果识别出所述语音信息表征所述来访者同意输入留言，采集所述来访者的多媒体留言信息并存储。
13.在一些实施例中，所述获得来访者针对所述访客留言提醒的反馈信息，包括：获得来访者针对所述访客留言提醒输入的身体姿态图像，所述身体姿态图像为：包括所述来访者的至少一部分肢体的肢体动作的图像；所述如果所述反馈信息表征所述来访者同意输入留言，采集所述来访者的多媒体留言信息并存储，包括：如果从所述身体姿态图像中识别出设定肢体动作，采集所述来访者的多媒体留言信息并存储，所述设定肢体动作为表征同意输入留言的肢体动作。
14.在一些实施例中，所述访客留言提醒还指示有同意输入留言所需执行的输入操作；所述如果所述反馈信息表征所述来访者同意输入留言，采集所述来访者的多媒体留言信息并存储，包括：如果所述反馈信息为与所述访客留言提醒提示的输入操作对应的反馈信息，采集所述来访者的多媒体留言信息并存储。
15.在一些实施例中，在所述采集所述来访者的多媒体留言信息之前，还包括：输出站位调整指示，所述站位调整指示用于提示来访者适合输入留言信息的站立
位置；所述采集所述来访者的多媒体留言信息并存储，包括：在确定来访者处于适合输入留言信息的站立位置或者来访者确认启动留言采集，采集所述来访者的多媒体留言信息并存储。
16.在一些实施例中，在所述采集所述来访者的多媒体留言信息并存储之后，还包括：通过云服务器向设定的终端设备发送留言事件提醒，所述留言事件提醒用于提示存在来访者的留言信息。
17.第二方面，本技术实施例提供了一种媒体输出控制装置，包括：第一特征获得单元，用于获得第一传感器感应到的第一特征信息；第二特征获得单元，用于获得第二传感器感应到的第二特征信息，所述第一特征信息与所述第二特征信息为用于表征存在目标动作的可能性特征，且所述第一特征信息与第二特征信息属于不同维度的特征信息，所述目标动作为触发输出媒体信号的动作；媒体特征确定单元，用于如果所述第一特征信息和第二特征信息满足设定条件，确定与所述第一特征信息和第二特征信息匹配的媒体输出特征，所述设定条件为表征存在所述目标动作的条件；媒体输出单元，用于输出具有所述媒体输出特征的媒体信号。
18.第三方面，一种计算机可读介质，所述计算机可读介质上存储有计算机程序，其中，所述程序被处理器执行时实现如上任一项所述的媒体输出控制方法。
19.第四方面，一种处理器，所述处理器用于运行程序，其中，所述程序运行时实现如上任一项所述的媒体输出控制方法。
20.第五方面，一种智能监管设备，包括：一个或多个处理器；与所述处理器相连的第一传感器、第二传感器和存储装置；所述第一传感器，用于感应第一特征信息；所述第二传感器，用于感应第二特征信息；所述存储装置，其上存储有一个或多个程序；当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器实现如上任一项所述媒体输出控制方法。
21.本技术实施例提供的媒体输出控制方法和装置，通过两个传感器从不同维度来获得表征存在目标动作的可能性的特征信息，并在这两个特征信息满足表征存在目标动作的设定条件的情况下，就会输出媒体信号，即使用户使得不熟悉智能监管设备，也可以通过目标动作触发智能监管设备输出媒体信号，提高了触发提醒的灵活性，从而可以更为及时和有效地发出提醒。而且，本技术在获得的两个不同维度的特征信息满足设定条件的情况下，会结合这两个维度的特征信息，确定输出的媒体信息具有的媒体输出特征，并输出具有该媒体输出特征的媒体信号，使得输出的媒体信号能够表达用于触发输出媒体信号的目标动作的特征状态，也提高了媒体信号输出的灵活性。
附图说明
22.为了更清楚地说明本技术实施例或现有技术中的技术方案，下面将对实施例或现
有技术描述中所需要使用的附图作简单地介绍。显而易见地，下面描述中的附图仅仅是本技术的一些示例或实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图，而且还可以根据提供的附图将本技术应用于其它类似情景。除非从语言环境中显而易见或另做说明，图中相同标号代表相同结构或操作。
23.图1是本技术的媒体输出控制方法的一个实施例的流程示意图；图2是本技术的一些实施例可以应用于其中的示例性系统架构图；图3是本技术的媒体输出控制方法的又一个实施例的流程示意图图；图4是本技术的媒体输出控制方法的又一个实施例的流程示意图；图5是本技术的媒体输出控制方法的又一个实施例的流程示意图；图6是本技术的媒体输出控制方法的又一个实施例的流程示意图；图7是本技术的媒体输出控制方法中采集与处理多媒体留言信息的一种流程交互示意图；图8是本技术的媒体输出控制装置的一个实施例的组成结构示意图；图9是适于用来实现本技术一些实施例的智能监管设备的结构示意图。
具体实施方式
24.下面结合附图和实施例对本技术作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释相关发明，而非对该发明的限定。所描述的实施例仅仅是本技术一部分实施例，而不是全部的实施例。基于本技术中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本技术保护的范围。
25.需要说明的是，为了便于描述，附图中仅示出了与有关发明相关的部分。在不冲突的情况下，本技术中的实施例及实施例中的特征可以相互组合。
26.应当理解，本技术中使用的“系统”、“装置”、“单元”和/或“模块”是用于区分不同级别的不同组件、元件、部件、部分或装配的一种方法。然而，如果其他词语可实现相同的目的，则可通过其他表达来替换该词语。
27.如本技术和权利要求书中所示，除非上下文明确提示例外情形，“一”、“一个”、“一种”和/或“该”等词并非特指单数，也可包括复数。一般说来，术语“包括”与“包含”仅提示包括已明确标识的步骤和元素，而这些步骤和元素不构成一个排它性的罗列，方法或者设备也可能包含其它的步骤或元素。由语句“包括一个
……”
限定的要素，并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
28.其中，在本技术实施例的描述中，除非另有说明，“/”表示或的意思，例如，a/b可以表示a或b；本文中的“和/或”仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，a和/或b，可以表示：单独存在a，同时存在a和b，单独存在b这三种情况。另外，在本技术实施例的描述中，“多个”是指两个或多于两个。
29.以下，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。
30.本技术中使用了流程图用来说明根据本技术的实施例的系统所执行的操作。应当理解的是，前面或后面操作不一定按照顺序来精确地执行。相反，可以按照倒序或同时处理
各个步骤。同时，也可以将其他操作添加到这些过程中，或从这些过程移除某一步或数步操作。
31.如图1所示，其示出了本技术提供的媒体输出控制方法的一种流程示意图，本实施例的方法可以应用于智能监管设备，该智能监管设备可以是包括控制器、传感器以及用于输出媒体信号的输出装置在内的设备。如，该智能监管设备可以为家庭或者企业单位等设置的安防控制设备，或者是用于实现安防与监控功能在内的综合监管设备等。
32.本实施例的方法可以包括：s101，获得第一传感器感应到的第一特征信息。
33.s102，获得第二传感器感应到的第二特征信息。
34.其中，该第一特征信息与第二特征信息为用于表征存在目标动作的可能性特征，且该第一特征信息与第二特征信息属于不同维度的特征信息。
35.其中，目标动作为触发输出媒体信号的动作。也就是说，目标动作是需要通过输出媒体信号向智能监管设备的使用者发出提醒的动作。
36.基于不同的场所的不同监管需求，目标动作也可能会所有不同。如，以家庭住所的监管主要以安防与监控为主，在该种场景下，目标动作可以是表征存在来访者的动作，例如，目标动作可以是敲击门等动作。
37.第一传感器和第二传感器为两个不同类型的传感器，因此，这两个传感器采集到的特征信息也是从不同维度上来表征感应到目标动作的可能性。
38.可以理解的是，与常规仅仅通过单一的传感器来感应特定的目标动作不同，本技术通过两个传感器从不同维度上来感应存在目标动作的可能性，可以提高检测目标动作的准确性，减少误判。
39.s103，如果该第一特征信息和第二特征信息满足设定条件，确定与该第一特征信息和第二特征信息匹配的媒体输出特征。
40.其中，该设定条件为表征存在该目标动作的条件。相应的，如果第一特征信息和的第二特征信息满足设定条件，可以确定当前存在目标动作。
41.媒体输出特征是指输出的媒体信号所需满足的特征。
42.如，媒体输出特征可以是输出媒体信号所需依据的媒体输出参数。通过媒体输出参数可以表征出媒体信号的内容以及输出方式等特征，例如，媒体输出参数可以包括输出媒体信号的媒体信号的名称以及时长等相关信息。
43.媒体输出特征还可以是媒体信号具有的特征信息。例如，媒体输出特征可以包括媒体信号的媒体类型、内容类别、时长以及特效类别等等，对此不加限制。
44.s104，输出具有该媒体输出特征的媒体信号。
45.如，媒体输出特征为媒体输出参数，那么可以依据该媒体输出参数输出媒体信号。
46.又如，媒体输出特征为表征媒体信号所呈现出的特征的信息，可以选取具有该媒体输出特征的媒体信号并输出。
47.在一种可能的情况中，假设媒体输出特征是音频信号的音频类型，即，确定出与第一特征信息和第二特征信息匹配的音频类型，相应的，可以输出符合该种音频类型的音频信号。其中，音频类型可以包括舒缓、急促、气愤等等类型，对此不加限制。
48.由以上内容可知，通过两个传感器从不同维度来获得表征存在目标动作的可能性
的特征信息，并在这两个特征信息满足表征存在目标动作的设定条件的情况下，就会输出媒体信号，即使用户使得不熟悉智能监管设备，也可以通过目标动作触发智能监管设备输出媒体信号，提高了触发提醒的灵活性，从而可以更为及时和有效地发出提醒。
49.而且，本技术在获得的两个不同维度的特征信息满足设定条件的情况下，会结合这两个维度的特征信息，确定输出的媒体信息具有的媒体输出特征，并输出具有该媒体输出特征的媒体信号，使得输出的媒体信号能够表达用于触发输出媒体信号的目标动作的特征状态，也提高了媒体信号输出的灵活性另外，本技术可以通过两个传感器从不同维度来获得表征存在目标动作的可能性的特征信息，从而可以有效减少由于误判存在目标动作而输出媒体信号提醒的情况。
50.可以理解的是，智能监管设备的一种较为常见的应用为：监控是否存在来访行为，如正常来访者需要进入家庭或者企业内部或者存在一些恶意来访者等。而在这些来访者不清楚智能监管设备的用于触发提醒的按钮，或者来访者行为比较粗鲁等情况下，普遍会通过制造一些声音来向智能监管设备的使用者发出提醒。例如，目标动作可以为敲击或者拍打门或者门禁设备等。
51.在该种情况下，为了能够准确检测是否存在来访者，本技术中第一传感器可以用于感应声音特征信息，而第二传感器可以用于感应振动特征信息。如，第一传感器可以为声音传感器，而第二传感器可以为振动传感器。
52.在一种可能的实现方式中，本技术中第一传感器获得的声音特征信息可以包括：声音信号的音量大小和发声频率。而第二传感器获得的振动特征信息可以包括：振动信号的振动大小和振动频率。
53.相应的，如果声音信号的音量大小和振动信号的振动大小满足设定条件，确定与声音信号的音量大小和发声频率以及振动信号的振动大小和振动频率匹配的媒体输出特征。
54.可以理解的是，如果目标动作属于敲击动作，那么敲击会产生声音信号，但是仅仅基于声音信号的大小来判断是否存在敲击动作，有可能会导致误判，例如，可能会将周围其他的声音信号误判为存在敲击动作。基于此，考虑到敲击动作产生声音信号的同时，必然会导致被敲击对象产生振动，因此，结合声音信号的音量大小和振动信号的振动大小综合判断是否满足存在目标动作的设定条件，可以更为准确地检测目标动作。
55.下面结合本技术的智能监管设备的一些应用示例，对本技术的方案进行介绍。
56.以智能监管设备为智能猫眼设备为例。图2示出了可以应用本技术的方案所适用的一些实施例的示例性系统架构。
57.如图2所示，该系统架构可以包括智能猫眼设备201、路由网关设备202、云服务器203和终端设备204。
58.智能猫眼设备、路由网关设备、云服务器以及终端设备之间可以通过网络205通信，网络可以包括各种连接类型，例如有线、无线通信链路或者无线保真（wifi）等等。
59.在本技术中，该智能猫眼设备可以经路由网关设备向云服务器发送门铃响铃事件以及访客留言提醒等事件消息，并由云服务器向智能猫眼设备绑定的终端设备推送相应的事件消息。
60.同时，智能猫眼设备可以通过网络与终端设备建立通信连接，使得智能猫眼设备
能够通过网络向终端设备传输来访者的音频以及视频等多媒体信息。
61.在本技术中，智能猫眼设备201至少可以包括：处理器2011、与处理器相连的声音传感器2012、振动传感器2013和媒体输出器，如图2所示，以媒体输出器可以为门铃扬声器2014为例说明。
62.其中，处理器可以作为特定应用集成电路、中央处理器或者集成控制芯片等形式，对此不加限制。
63.声音传感器和振动传感器设置于智能猫眼设备所在的门板（或者称为门体）上。
64.在一种可能的实现方式中，为了能够更准确地采集敲门声和敲门引起的振动，该声音传感器和振动传感器可以设置于门板的门外面板上，门外面板为门板中朝向室外的一侧面板。
65.该门铃扬声器（或者是，其他用于输出提醒用的媒体信号的媒体输出器）设置于室内，以通过门铃扬声器输出的门铃铃声，提醒门内的用户存在来访者。如，门铃扬声器可以设置于门内面板上，门内面板为智能猫眼设备所在门板中朝向室内的一侧面板。
66.可以理解的是，智能猫眼设备还可以包括与处理器相连的至少一个多媒体采集器（图2中未示出），多媒体采集器可以采集用户的音频和视频等多媒体，如，多媒体采集器可以包括语音采集器和视频采集器等。
67.其中，为了采集智能猫眼设备所在门板外的来访者的多媒体信息，可以在门外面板上设置多媒体采集器。
68.类似的，在门内面板上也可以设置另一多媒体采集器，以至少采集门内用户的声音信号等多媒体信息。
69.为了使得门内的用户能够实时听到来访者的音频以及看到来访者的视频图像，在门内面板上还设置有与处理器相连的音视频播放器。如，音视频播放器可以包括扬声器和显示屏等。
70.相应的，为了使得门外的来访者可以听到门内用户的声音，门外面板上也可以设置有音频播放器。进一步的，为了在一些情况下能够向来访者显示一些提醒信息或者播放一些视频等，在门外面板上也可以设置有视频播放器，如视频播放器可以为门外面板上的门外显示屏，例如，门外显示屏可以为设置在门外面板上的回显屏。
71.可以理解的是，该智能猫眼设备还可以包括与处理器相连的通信模块2015，通过通信模块可以与路由网关设备、云服务器以及终端设备进行通信。
72.可以理解的是，智能猫眼设备可以设置在智能门或者其他类型的门板上，在智能门或者其他类型的门板上还安装有锁体、门内把手以及门外把手等，智能猫眼设备还可以控制锁体的打开与锁定，还能够感应门内把手和门外把手上存在的动作等等，对此不再赘述。
73.在一种可能的实现方式中，该系统架构还可以包括：无线网关设备以及室内智能终端，如，室内智能终端可以为智能音箱、智能播放器等。智能猫眼设备可以通过无线网关设备与室内智能终端进行通信，并向室内智能终端传输来访者的音视频数据或者发送一些事件消息等等。
74.在图2所示示例下，本技术实施例所提供的媒体输出控制方法一般由智能猫眼设备201执行，相应地，媒体输出控制装置一般设置于智能猫眼设备201中。
75.应该理解，图2中的终端设备、网络和云服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络和云服务器。
76.继续参考图3，其示出了根据本技术的媒体输出控制方法的又一个实施例的流程。该媒体输出控制方法可以应用于如上提到的智能猫眼设备，该方法包括以下步骤：s301，获得智能猫眼设备的声音传感器感应到的声音特征信息。
77.在本技术中，媒体输出控制方法的执行主体（如图2中的智能猫眼设备）连接有声音传感器，该声音传感器可以设置于智能猫眼设备所在门体的门外面板上。通过声音传感器可以感应到的声音信号的声音特征信息。
78.如，在智能猫眼设备所在门体的门外存在来访者的敲门时，智能猫眼设备可以获得声音传感器感应到的敲门声的声音特征信息。
79.其中，该声音特征信息可以为声音传感器感应到的声音信号所具有的特征信息。如，声音特征信息至少可以包括：声音信号的音量大小，还可以包括声音信号的发声频率以及音调等特征中的一种或者几种。
80.以敲门声为例，声音信号的大小就是敲门声的声音音量大小。而敲门声的发声频率可以表征设定时长内（如设定的单位时长）敲击门体产生声音的次数等。
81.可以理解的是，在存在敲门事件的情况下，通过声音传感器感应到的声音特征信息可以准确和有效反映出来访者的敲门动作的特征，而敲门动作的特征反映的是来访者敲门的紧急程度或者情绪状态等。
82.如，在来访者有比较重要的事情、着急智能猫眼设备所在门体的门内用户，或者来访者当前情绪较为急躁的情况下，可能会连续且用较大力量敲击门体，则声音传感器感应到的敲门声音会较大且较为急促。而来访者没有特别重要的事情的情况下，敲门动作可能会比较温和，敲门的力量会相对较小，且短时间内的敲击次数会比较少。
83.s302，获得智能猫眼设备的振动传感器感应到的振动特征信息。
84.其中，该振动传感器可以设置于智能猫眼设备所在门体的门外面板上。
85.在本技术中，作为执行主体的智能猫眼设备连接有振动传感器，通过振动传感器可以获得智能猫眼设备所在门体上存在的振动的振动特征信息。在此基础上，如果存在对门体的敲门动作，那么门体上必然会存在振动，在此基础上，振动传感器便可以感应到振动信号及其振动特征信息。
86.其中，振动特征信息用于反映振动信号所具有的特征。如，该振动特征信息至少可以包括：振动信号的大小；还可以包括振动信号的频率等，对此不加限制。
87.可以理解的是，在门体上存在敲门动作的情况下，敲门动作产生敲门声的同时，也会引发门体的振动。门体的振动大小、幅度以及频率等振动特征信息同样可以反映出敲门动作的特征，也就可以反映出来访者敲门的紧急程度以及情绪状态。
88.s303，如果声音特征信息和振动特征信息满足设定条件，确定与声音特征信息和振动特征信息匹配的门铃输出特征。
89.其中，设定条件为表征存在敲门动作的条件，具体可以根据需要设定，本技术对此不加限制。
90.在本实施例中以媒体信号为门铃的音频信号为例，相应的，媒体输出特征为门铃输出特征。
91.其中，门铃输出特征用于表征输出的门铃铃声所具有的特征。如，门铃输出特征可以是门铃铃声的类别以及输出门铃铃声的门铃输出参数等特征信息中的一种或者几种，对此不加限制。
92.可以理解的是，在存在对智能猫眼设备所在门体的敲击动作的情况下，基于声音特征信息和振动特征信息，有利于确定出能够准确表达敲门动作的特征的门铃输出特征。其中，声音特征信息和振动特征信息不同，确定出的门铃输出特征也会有所不同。
93.在一种可能的情况中，如果声音特征信息包括声音信号的音量大小，且振动特征信息包括振动信号的振动大小，那么门铃输出特征可以表征门铃铃声的声音大小。如，门铃输出特征可以包括门铃铃声的音量大小或者音量范围。
94.在又一种可能的情况中，如果声音特征信息包括声音的发声频率，且振动特征信息包括振动信号的振动频率，那么门铃输出特征至少可以表征以门铃铃声的响铃频率。
95.在又一种可能的情况中，如果声音特征信息包括：声音信号的音量大小以及声音信号的发声频率，且，振动特征信息包括振动信号的振动大小以及振动频率，那么结合这几个特征信息确定出的门铃输出特征可以表征门铃铃声的音量大小（或者音量范围）以及响铃频率等。
96.可以理解的是，以上是以几种可能情况为例，在实际应用中，声音特征信息和振动特征信息均可能会包括多个维度的特征信息，在该种情况下，可以结合声音特征信息和振动特征信息包含的多个维度的特征信息，综合确定门铃铃声的大小以及响铃频率等门铃输出特征。
97.例如，如果声音特征信息表征敲门的声音较大、发声频率较高，且振动特征信息表征敲门引发的振动较强烈，则门铃输出特征可以为表征门铃铃声具有铃声大且铃声急促等特征。
98.又例如，如果基于声音特征信息和振动特征信息，确定出敲门动作较为平和，敲门的声音和振动偏小，那么铃声输出特征可以包括铃声舒缓以及音量偏小等特征。
99.s304，输出符合该门铃输出特征的门铃铃声。
100.如，智能猫眼设备可以控制处于室内的门铃扬声器等输出门铃铃声，以提示门内的用户存在来访者。
101.本实施例中，通过综合声音传感器感应到的声音特征信息和振动传感器感应到的振动特征信息确定是否存在敲门动作，可以更为准确识别对智能猫眼设备所在门体的敲门，减少敲门识别的误判。
102.而且，在基于声音特征信息和振动特征信息确定出存在敲门动作的情况下，会确定与该声音特征信息和振动特征信息匹配的门铃输出特征，并输出符合该门铃输出特征的门铃铃声，从而使得智能猫眼设备输出的门铃声音随着敲门动作的敲门声和振动的不同而有所变化，使得门内的用户能够根据门铃声音可以更为直观和准确了解到来访者的敲门特征，提高了门铃提醒的有效性和灵活性。
103.另外，即使来访者不熟悉该智能猫眼设备，无法到智能猫眼设备的门铃，也可以通过敲击门体而触发智能猫眼设备向门内用户播放门铃铃声，从而可以减少由于智能猫眼设备的门体的隔音性能较好而无法及时听到敲门声的情况，也提高了门铃提醒的灵活性。
104.可以理解的是，在本技术实施例中，用于判断存在敲门动作的设定条件可以根据
需要设定。
105.如前面所述，在一种可能的实现方式中，声音特征信息包括声音信号的音量大小，且振动特征信息包括振动信号的振动大小。相应的，可以判断声音信号的音量大小和振动信号的振动大小是否满足设定条件。
106.如，如果声音信号的音量超过设定音量值，且振动信号的振动大小超过设定振动值，则确定存在对门体的敲门动作，即确定满足设定条件。
107.可以理解的是，结合声音信号的音量大小以及振动信号的振动大小确定是否存在敲门动作，既可以较为便捷的识别出敲门动作。而且，相对仅依据声音来判断是否存在敲门事件，本技术结合敲门声以及敲门产生的振动来综合确定存在敲门事件，有利于减少对敲门事件的误判。
108.为了便于理解本技术中确定媒体输出特征的具体实现方式，仍结合图2的场景，以媒体输出特征为门铃输出特征为例进行说明，下面结合几种可能情况进行说明。
109.进一步参考图4，其示出了本技术提供的媒体输出控制方法的又一个实施例的流程。本实施例的方法可以应用于智能猫眼设备，本实施例的方法可以包括：s401，获得智能猫眼设备的声音传感器感应到的声音特征信息。
110.如，声音特征信息可以包括：声音信号的音量大小以及声音信号的发声频率。当然，还可以包括声音信号的其他特征。
111.s402，获得智能猫眼设备的振动传感器感应到的振动特征信息。
112.如，振动特征信息可以包括：振动信号的振动大小以及振动信号的振动频率。当然，还可以包括振动信号的其他特征。
113.s403，如声音特征信息和振动特征信息满足设定条件，确定与该声音特征信息和振动特征信息匹配的门铃输出参数。
114.其中，设定条件可以参见前面介绍，例如，如声音特征信息表征声音信号的音量超过设定音量阈值且振动特征信息表征振动信号的振动大小超过设定振动阈值，则确定满足设定条件，对此不加限制。
115.其中，门铃输出参数为控制输出门铃铃声的输出控制参数。
116.如，门铃输出参数可以包括：门铃输出音量、门铃铃声信号的间隔时长以及响铃总持续时长等参数中的一种或者多种，对此不加限制。
117.可以理解的是，门铃输出参数可以发映出敲门声的音量、急促程度以及持续时长等等敲门动作特征。
118.在一个示例中，根据敲门的声音大小和振动大小，确定门铃输出参数中门铃输出音量的大小，其中，敲门声的声音越高且振动较强，则门铃输出音量也会越高。
119.相应的，根据敲门的声音频率和振动频率，可以确定门铃输出参数中门铃铃声信号的间隔时长，通过门铃铃声信号的间隔时长来反映敲门的急促程度。例如，声音频率和振动频率越高，则相邻门铃铃声信号的输出时间之间的间隔越短，以使得输出的门铃铃声较为急促。
120.当然，还可以根据敲门声持续的总时长，确定门铃铃声的响铃总持续时长等等。
121.s404，依据该门铃输出参数输出设定的门铃铃声。
122.在本实施例，设定的门铃铃声可以有一个或者多个，但是每次可以随机或者按照
门铃铃声的先后顺序选择一个门铃铃声作为需要输出的门铃铃声。
123.在门铃铃声固定的情况下，门铃输出参数不同，则会使得输出的门铃铃声的效果存在差异。
124.如，门铃输出参数包括门铃音量，那么则需要按照门铃输出参数中的门铃音量控制输出该设定的门铃铃声的音量。
125.又如，门铃输出参数包括门铃铃声信号的间隔时长，则需要在输出设定的门铃铃声过程中，控制门铃铃声对应的门铃铃声信号的输出间隔。例如，门铃铃声为“嘟”，如果门铃铃声信号的间隔时长越短，那么单位时间内输出的输出“嘟”这一门铃铃声信号的个数越多，相应的，门铃铃声也会显得更为急促；反之，门铃铃声信号的间隔时长越长，那么相邻两次输出的“嘟”的时间间隔也会越长，使得门铃铃声更为缓和。
126.在本实施例中，在确定存在敲门动作后，结合声音传感器感应到的声音特征信息和振动传感器感应到的振动特征信息，可以确定相匹配的门铃输出参数，依据门铃输出参数控制输出设定的门铃铃声，可以使得输出的门铃铃声能够更为贴合敲门动作产生的敲门声和振动的特征，使得门内的用户能够根据门铃铃声了解到来访者的敲门动作特征，进而有针对性的作出相应的回应或者处理。
127.下面结合确定门铃输出特征的又一种可能情况，对本技术的方案进行介绍。
128.进一步参考图5，其示出了本技术提供的媒体输出控制方法的又一个实施例的流程。本实施例的方法可以应用于智能猫眼设备，本实施例的方法可以包括：s501，获得智能猫眼设备上的声音传感器感应到的声音特征信息。
129.如，声音特征信息可以包括：声音信号的音量大小以及声音信号的发声频率。当然，还可以包括声音信号的其他特征。
130.s502，获得智能猫眼设备上的振动传感器感应到的振动特征信息。
131.如，振动特征信息可以包括：振动信号的振动大小以及振动信号的振动频率。当然，还可以包括振动信号的其他特征。
132.s503，如声音特征信息和振动特征信息满足设定条件，确定与声音特征信息和振动特征信息匹配的门铃铃声类型。
133.其中，该设定条件可以参见前面的相关介绍，在此不再赘述。
134.该门铃铃声类型可以看成是媒体信号的音频类型的一种具体实现。
135.如，结合声音信号的声音大小和发声频率以及振动信号的振动大小以及振动频率中的一个或者多个，确定门铃铃声类型。
136.在本技术中，智能猫眼设备中可以设定多种门铃铃声类型，每种门铃铃声类型表征的铃声声音特征不同。如，门铃铃声类型可以包括：急促铃声、舒缓铃声、大音量铃声、低音量铃声、大且急促的铃声，低且舒缓的铃声等等多种类型，对此不加限制。
137.在本技术通过不同的门铃铃声类型可以表征敲门动作的敲门声和敲门振动的不同特征类别。基于此，本技术结合感应到的敲门动作的声音特征信息和振动特征信息，确定出的门铃铃声类型可以反映该敲门动作适合的门铃铃声的类型。
138.如，声音特征信息和振动特征信息表征敲门声的声音和振动较大，且较为急促，则说明来访者敲门较为急切，可能会有较为重要的事情等，在该种情况下，确定出的门铃铃声类型可以为音量大且急促的门铃铃声。
139.又如，声音特征信息和振动特征信息表征敲门声的声音和振动频率的情况下，如果敲门声的声音较小，且振动的频率较低，那么则说明敲门动作比较轻缓。在该种情况下，确定出的门铃铃声类型可以为轻柔舒缓型的门铃铃声，以使得门铃铃声类型与敲门动作类型相似。
140.s504，输出属于该门铃铃声类型的门铃铃声。
141.可以理解的是，智能猫眼设备中可以存储不同门铃铃声类型的门铃铃声，因此，在确定出适合的门铃铃声类型之后，可以选择该门铃铃声类型的门铃铃声并输出，使得门内的用户根据输出的门铃铃声便可以了解到门外的来访者敲门的声音特征和引发振动的振动特征。
142.例如，来访者敲门的声音和振动大且急促，那么则可以输出较为急促且高音的门铃铃声，使得用户听到该门铃铃声便可以知道来访者敲门较为猛烈和急促，从而可以了解到来访者可能有着急的事情。
143.可以理解的是，针对每种门铃铃声类型，智能猫眼设备中可以存储属于该门铃铃声类型的多个门铃铃声。在该种情况下，确定出门铃铃声类型之后，可以从该门铃铃声类型的多个门铃铃声中随机选择一个门铃铃声，或者是按照门铃铃声的排序，确定待输出的门铃铃声，对此不加限制。
144.可以理解的是，在本技术以上实施例中是以来访者通过目标动作，实现向智能监管设备所在门体内的用户发出提醒为例说明。在实际应用中，来访者还可以直接通过触按指定按钮来触发智能监管设备输出媒体信号。相应的，智能监管设备如检测到触按该指定按钮的触按事件，可以输出该触按事件对应的媒体信号。其中，该指定按钮为用于触发输出媒体信号的触发按钮。
145.其中，与触按事件对应的媒体信号可以是设定的默认媒体信号；也可以是，结合触按事件对应触按特征，如触按压力、触按时长以及触按频率等特征，输出符合该触按特征的媒体信号。
146.仍以图2的示例情况说明，如果来访者能够到智能猫眼设备的门铃按钮，也可以直接触按门铃按钮。相应的，智能猫眼设备检测到触按门铃按钮的门铃触按事件，可以基于该门铃触按事件输出门铃铃声。
147.其中，门铃按钮可以设置在智能猫眼设备所在门体的门外面板上或者是设置在与门外面板处于同侧的墙体上等，在此不加限制。
148.在一种可能的情况中，在检测到门铃触按事件时，可以获得门铃触按事件对应的门铃触按特征。相应的，可以按照门铃触按事件对应的门铃触按特征，控制输出门铃铃声，以使得输出的门铃铃声符合门铃触按特征。
149.其中，门铃触按特征可以表征按压门铃按钮的触按压力、触按时长以及触按频率等等特征中的一种或者几种。
150.可以理解的是，在通过目标动作或者触按指定按钮等方式触发智能监管设备输出媒体信号之后，如果使用该智能监管设备的用户不在智能监管设备所处的管控区域内，如，用户未处于智能监管设备所监管的室内，或者是用户距离输出媒体信号的输出装置的位置较远等，都可能会存在通过输出的媒体信号无法有效提醒用户的情况。
151.基于此，在智能监管设备输出媒体信号之后，还可以通过路由网管设备向云服务
发送媒体播报事件提醒，并通过云服务器向智能监管设备绑定的终端设备发送媒体播报事件提醒。该媒体播报事件提醒用于提醒用户存在媒体信号输出事件。
152.仍结合图2的应用场景进行说明，通过敲门或者触按门铃的方式，触发智能猫眼设备输出门铃铃声后，如果门内的用户不在家或者在室内距离门铃扬声器较远的地方，那么通过门铃铃声也无法有效提醒用户存在来访者。
153.基于此，本技术在智能猫眼设备输出门铃铃声的同时或者之后，智能猫眼设备还可以通过路由网关设备向云服务器发送门铃事件提醒，并通过云服务器向该智能猫眼设备绑定的终端设备发送门铃事件提醒。该门铃事件提醒用于提醒用户存在门铃触发事件，从而使得用户获知当前存在来访者。
154.进一步的，智能猫眼设备在输出门铃铃声的同时或者之后，智能猫眼设备还可以通过门外的多媒体采集装置（如音频采集装置和视频采集装置中的一种或者两种）采集来访者的多媒体信息，并存储到智能猫眼设备的存储设备内。其中，来访者的多媒体信息可以包括：来访者的语音和图像中的一种或者两种。
155.在此基础上，如果智能终端的用户看到门铃事件提醒后，如果用户想了解来访者的情况，那么用户可以通过智能终端与智能猫眼设备建立通信连接，通过智能终端向智能猫眼设备请求来访者的多媒体信息。相应的，智能猫眼设备响应该请求，会向智能终端发送该来访者的多媒体信息，以使得智能终端的用户能够实时或者及时了解到门外来访者的音频或者视频等信息。
156.在一种可能的情况中，在智能监管设备输出媒体信号之后，如果智能监管设备的用户由于未处于智能监管设备的管控区域内或者未听到媒体信号，可能会导致用户无法针对媒体信号作出响应。例如，在智能猫眼设备输出门铃铃声后，如果智能猫眼设备的用户不在家或者其他原因导致用户没有针对门铃铃声作为任何回应或者处理。但是如果来访者有比较重要的事情，那么来访者就可能需要能够尽快的将来访意图通知给智能监管设备的用户。为了实现该目的，本技术中，智能监管设备还可以向来访者提供留言服务。
157.具体的，如果在设定时长阈值内未检测到针对媒体信号的回应事件，输出访客留言提醒，该访客留言提醒用于提醒来访者输入留言。该回应事件表征智能监管设备的用户听到或者了解到输出有媒体信号。
158.在此基础上，智能监管设备可以获得来访者针对访客留言提醒的反馈信息。如果该反馈信息表征来访者同意输入留言，则可以采集来访者的多媒体留言信息并存储。
159.其中，来访者针对访客留言提醒的反馈信息的形式可以有多种，如，该反馈信息可以为语音信息，相应的，可以识别该语音信息是否表征来访者同意输入留言。又如，该反馈信息可以为来访者针对访客留言提醒输入的身体姿态图像，身体姿态图像包括来访者的至少一部分肢体的肢体动作，相应的，如果从该身体姿态图像中识别出设定肢体动作，则可以表征来访者同意输入留言。
160.下面结合图2的示例场景，以智能监管设备为智能猫眼设备为例对本技术的方案进行介绍。如图6所示，其示出了本技术一种媒体输出控制方法的又一个实施例的流程示意图，本实施例的方法应用于智能猫眼设备，本实施例的方法可以包括：s601，智能猫眼设备输出门铃铃声。
161.其中，智能猫眼设备输出门铃铃声可以是来访者通过敲门或者是通过按下门铃按
钮来触发智能猫眼设备启动门铃并输出门铃铃声，具体可以参见前面实施例的相关介绍，在此不再赘述。
162.s602，如果在设定时长阈值内未检测到针对门铃铃声的回应事件，输出访客留言提醒。
163.其中，该设定时长阈值可以根据需要设定，对此不加限制。如，设定时长阈值可以为30秒或者1分钟等。
164.其中，针对该门铃铃声的回应事件为用于表征智能猫眼设备的用户获知存在门铃响铃的事件。
165.如，门铃铃声的回应事件可以为位于智能猫眼设备所在门体的门内的用户打开门，用户通过智能终端或者门内显示屏查看门外的来访者的多媒体信息，或者是，门内的用户关闭门铃铃声等等，对此不加限制。
166.可以理解的是，如果超过设定时长阈值没有检测到针对门铃铃声的回应事件，则说明用户可能没有听到该门铃铃声，在此基础上，为了使得用户了解到来访者意图，也使得来访者能够及时向智能猫眼设备的用户传达来访意图等，该智能猫眼设备会输出访客留言提醒。
167.其中，该访客留言提醒用于提醒来访者输入留言。该访客留言提醒的具体形式可以有多种可能。如，访客留言提醒可以通过语音播放的形式输出，也可以是在设置于门外面板上的门外显示屏中输出门访客留言提醒等，对此不加限制。
168.s603，获得来访者针对访客留言提醒的反馈信息。
169.s604，如果反馈信息表征来访者同意输入留言，采集来访者的多媒体留言信息并存储。
170.其中，针对该访客留言提醒的反馈信息用于表征访客是否同意输入留言。
171.如，来访者可以针对访客留言提醒输入语音信息。相应的，智能猫眼设备在获得来访者针对该访客留言提醒输入的语音信息后，可以对语音信息进行语音识别。如果识别出该语音信息表征来访者同意输入留言，则可以采集来访者的多媒体留言信息。
172.例如，来访者输入“同意留言”以及“采集留言”等指示同意留言的声音后，则智能猫眼设备可以确认来访者同意输入留言。
173.又如，来访者还可以针对该访客留言提醒采用手势或者身体姿势等做出响应。相应的，智能猫眼设备可以获得来访者针对访客留言提醒输入的身体姿态图像。在此基础上，如果智能猫眼设备从该身体姿态图像中识别出设定肢体动作，采集来访者的多媒体留言信息并存储。
174.其中，设定肢体动作为表征同意输入留言的肢体动作。
175.例如，身体姿态图像可以包括：用户的手指姿势图像、面部表情图像以及身体躯干图像中的一种或者几种。
176.举例说明，假设设定肢体动作可以包括：表示“ok”的手势，表示点头的头部姿势等，那么如果采集到的来访者的身体姿态图像中可以表征来访者输入了“ok”的手势或者是存在点头动作，则确定来访者同意输入留言。
177.在又一种可能的情况中，智能猫眼设备输出的访客留言提醒还指示有同意输入留言所需执行的输入操作。相应的，如果智能猫眼设备确认获得的反馈信息为与访客留言提
醒提示的输入操作对应的反馈信息，则可以采集该来访者的多媒体留言信息。
178.如，智能猫眼设备输出的访客留言提醒可以提示来访者通过长按门铃按钮启动留言。在此情况下，如果智能猫眼设备检测到反馈信息为检测到来访者按压门铃按钮的时长超过设定时长，则智能猫眼设备确定来访者同意输入留言，则启动留言采集。
179.又如，访客留言提醒可以提示来访者触按的门外面板上的回显屏中显示出的数字中的数字“1”，来启动留言，那么检测到来访者点击回显屏中的数字“1”，则智能猫眼设备会确认来访者同意输入留言。
180.当然，以上仅仅是以反馈信息的几种情况为例说明，在实际应用中，还可以有其他可能，对此不加限制。
181.当然，本实施例是以智能猫眼设备为例，对于其他智能监管设备的情况以上几种实现方式也同样适用。
182.其中，智能猫眼设备等智能监管设备采集来访者的多媒体留言信息可以是采集来访者的音频，也可以是同时采集来访者的音频留言和视频图像作为多媒体留言信息，对此不加限制。
183.可以理解的是，在采集来访者的多媒体留言信息时，如果来访者距离智能监管设备中采集音频和视频等多媒体的多媒体采集器的距离较远，或者是来访者与多媒体采集器的相对位置不适合采集来访者的多媒体留言信息，那么则可能会导致采集到的多媒体留言信息的质量较差，导致多媒体留言信息中音频不清晰或者无法看到来访者人脸等等情况。
184.基于此，为了提高采集到的多媒体留言信息的质量，在采集来访者的多媒体留言信息之前，该智能监管设备还可以输出站位调整指示。如，以智能猫眼设备为例，智能猫眼设备可以在门外显示屏上输出站位调整指示，该门外显示屏为设置于门外面板上的显示屏。
185.其中，站位调整指示用于提示来访者适合输入留言信息的站立位置。如，站位调整指示可以是文字形式，还可以是站位调整框的形式。例如，站位调整指示可以为请保持面部处于调整框内等提醒信息。
186.在此基础上，来访者可以根据站位调整指示调整站立位置等。
187.当然，如果来访者不想调整站立位置，也可以向智能监管设备输入启动留言采集的指示，以触发智能监管设备启动留言采集。如，来访者点击门外显示屏上显示出的“确认在当前位置启动留言采集”等按键来触发启动留言采集。
188.相应的，智能监管设备在确认来访者处于适合输入留言信息的站立位置或者来访者确认启动留言采集，采集该来访者的多媒体留言信息。
189.其中，智能监管设备在启动留言采集后，如果超过设定时长检测不到来访者的音频输入或者图像，则可以确认留言采集结束。
190.又如，智能监管设备也可以设置留言的最长时长，在采集来访者留言的过程中，如果采集到的多媒体留言信息的时长超过最长时长的情况下，智能监管设备可以输出留言结束提醒，在输出留言提醒之后延迟设定的延迟时长，则可以结束多媒体留言信息的采集。
191.又如，来访者在完成留言之后，还可以向智能监管设备输入留言完成指示，例如，通过输入用于指示留言结束的语音或者在智能猫眼设备等智能监管设备的门外显示屏中点触特定按键来指示完成留言输入。相应的，智能监管设备在获得留言完成指示后，可以结
束多媒体留言信息的采集。
192.当然，还可以有其他确认多媒体留言信息采集完成的方式，对此不加限制。
193.可以理解的是，在智能监管设备中存储了来访者的多媒体留言信息之后，在智能监管设备的用户便可以查看智能监管设备中存储的多媒体留言信息，从而较为快速的了解到存在的来访者及来访者意图。
194.如，智能监管设备在检测到留言读取操作时，在智能监管设备的指定显示屏中显示多媒体留言信息。例如，以智能猫眼设备为例，智能猫眼设备检测到留言读取操作后，可以在门内显示屏（也可称为门内屏幕）中显示多媒体留言信息。比如，用户点击门内显示屏中输出的留言消息提醒，则可以确认检测到留言读取操作，从而显示出存储的多媒体留言信息。
195.进一步的，为了能够使得智能监管设备的用户能够更为及时的了解到存在来访者的多媒体留言信息，在智能监管设备采集来访者的多媒体留言信息并存储后，智能监管设备还可以通过通过云服务器向智能监管设备绑定的终端设备发送留言事件提醒。其中，该留言事件提醒用于提示存在来访者的留言信息。
196.相应的，在智能监管设备的用户通过在智能监管设备上操作，向智能监管设备输入留言读取操作后，便可以读取智能监管设备内存储的来访者的多媒体留言信息。
197.在一种实现方式中，为了使得智能监管设备的用户能够更为及时的查看到多媒体留言信息。智能监管设备的用户还可以通过终端设备向智能监管设备发送对多媒体留言信息的访问请求。相应的，智能监管设备在获得对多媒体留言信息的访问请求后，可以向终端设备发送来访者的多媒体留言信息。
198.为了便于理解，智能监管设备向智能终端发送留言事件提醒以及向智能终端传输多媒体留言信息的过程，下面结合图2的应用示例，并以一种应用场景对本技术媒体输出控制方法中多媒体留言信息的采集与处理过程进行介绍。
199.如图7所示，其示出了本技术的媒体输出控制方法中采集与处理多媒体留言信息的一种流程交互示意图。
200.s701，智能猫眼设备确认存在门铃启动事件，输出门铃铃声。
201.门铃启动事件为检测到来访者敲门所触发的启动门铃的事件，或者是检测到门铃按钮被触按所触发的启动门铃的事件，对此不加限制。
202.s702，智能猫眼设备在设定时长阈值内未检测到针对门铃铃声的回应事件，输出访客留言提醒。
203.s703，如果获得来访者针对访客留言提醒的反馈信息表征来访者同意输入留言，智能猫眼设备采集来访者的多媒体留言信息并存储。
204.以上步骤可以参见前面实施例的相关介绍，在此不再赘述。
205.s704，智能猫眼设备通过与路由网关设备建立的无线连接，向路由网关设备发送留言事件提醒。
206.如，智能猫眼设备可以与路由网关设备建立wifi连接等等，或者其他形式的网络连接，对此不加限制。
207.其中，留言事件提醒用于提示存在来访者的留言信息。
208.s705，路由网关设备将留言事件提醒发送给云服务器。
209.s706，云服务器将留言事件提醒推送给智能猫眼设备绑定的终端设备。
210.其中，该终端设备可以为手机、平板电脑或者笔记本电脑等，对此不加限制。
211.s707，终端设备通过路由网关设备与智能猫眼设备建立通信连接，基于该通信连接向智能猫眼设备发送留言访问请求。
212.如，终端设备可以通过路由网关设备与智能猫眼设备建立直连连接（p2p连接）等。
213.s708，智能猫眼设备响应于该留言访问请求，向终端设备发送智能猫眼设备存储的且尚未被读取的多媒体留言信息。
214.可以理解的是，智能猫眼设备中如果缓存有多条多媒体留言信息，那么可以按照多条多媒体留言信息的生成时间顺序依次发送给终端设备；也可以按照多条多媒体留言信息对应的优先级，向终端设备发送多媒体留言信息等，对此不加限制。
215.进一步参考图8，作为对以上一些图所示方法的实现，本技术提供了媒体输出控制装置的一个实施例，该装置实施例与图1所示的方法实施例相对应，该装置具体可以应用于各种智能监管设备中。
216.如图8所示，本实施例的媒体输出控制装置800包括：第一特征获得单元801、第二特征获得单元802、媒体特征确定单元803和媒体输出单元804。其中，第一特征获得单元801，被配置成获得第一传感器感应到的第一特征信息；第二特征获得单元802，被配置成获得第二传感器感应到的第二特征信息，所述第一特征信息与所述第二特征信息为用于表征存在目标动作的可能性特征，且所述第一特征信息与第二特征信息属于不同维度的特征信息，所述目标动作为触发输出媒体信号的动作；媒体特征确定单元803，被配置成如果所述第一特征信息和第二特征信息满足设定条件，确定与所述第一特征信息和第二特征信息匹配的媒体输出特征，所述设定条件为表征存在所述目标动作的条件；门铃媒体输出单元804，被配置成输出具有所述媒体输出特征的媒体信号。
217.在本实施例中，第一特征获得单元801、第二特征获得单元802、媒体特征确定单元803和媒体输出单元804的具体处理及其带来的技术效果可分别参考图1对应实施例中步骤101、步骤102、步骤103和步骤104的实施例的相关说明，在此不再赘述。
218.在本实施例的一些可选的实现方式中，第一特征获得单元包括：声音特征获得单元，用于获得第一传感器感应到的声音特征信息；第二特征获得单元，包括：振动特征获得单元，用于获得第二传感器感应到的振动特征信息。
219.在本实施例的一些可选的实现方式中，声音特征获得单元获得的声音特征信息包括：声音信号的音量大小以及声音信号的发声频率；振动特征获得单元获得的振动特征信息包括：振动信号的振动大小以及振动信号的振动频率；媒体特征确定单元，包括：媒体特征确定子单元，用于如果所述声音信号的音量大小和所述振动信号的振动大小满足设定条件，确定与所述声音信号的音量大小和发声频率以及所述振动信号的振动大小和振动频率匹配的媒体输出特征。
220.在本实施例的一些可选的实现方式中，媒体特征确定单元，包括：第一媒体确定单元，用于如果所述第一特征信息和第二特征信息满足设定条件，
确定与所述第一特征信息和第二特征信息匹配的媒体输出参数；媒体输出单元，包括：第一媒体输出单元，用于依据所述媒体输出参数输出媒体信号。
221.在本实施例的一些可选的实现方式中，媒体特征确定单元，包括：第二媒体确定单元，用于如果所述第一特征信息和第二特征信息满足设定条件，确定与所述第一特征信息和第二特征信息匹配的音频类型；媒体输出单元，包括：第二媒体输出单元，用于输出符合所述音频类型的音频信号。
222.在本实施例的一些可选的实现方式中，该装置还包括：媒体触发单元，用于检测到触按指定按钮的触按事件，输出所述触按事件对应的媒体信号，所述指定按钮为用于触发输出媒体信号的触发按钮；留言提醒单元，用于在媒体输出单元输出具有所述媒体输出特征的媒体信号，或者媒体触发单元输出所述触发事件对应的媒体信号之后，如果在设定时长阈值内未检测到针对所述媒体信号的回应事件，输出访客留言提醒，所述访客留言提醒用于提醒来访者输入留言；反馈获得单元，用于获得来访者针对所述访客留言提醒的反馈信息；留言采集单元，用于如果所述反馈信息表征所述来访者同意输入留言，采集所述来访者的多媒体留言信息并存储。
223.在本实施例的一些可选的实现方式中，该反馈获得单元包括：第一反馈获得单元，用于获得来访者针对所述访客留言提醒输入的语音信息；留言采集单元包括：第一留言采集单元，用于如果识别出所述语音信息表征所述来访者同意输入留言，采集所述来访者的多媒体留言信息并存储。
224.在本实施例的一些可选的实现方式中，该反馈获得单元包括：第二反馈获得单元，用于获得来访者针对所述访客留言提醒输入的身体姿态图像，所述身体姿态图像为：包括所述来访者的至少一部分肢体的肢体动作的图像；留言采集单元包括：第二留言采集单元，用于如果从所述身体姿态图像中识别出设定肢体动作，采集所述来访者的多媒体留言信息并存储，所述设定肢体动作为表征同意输入留言的肢体动作。
225.在本实施例的一些可选的实现方式中，所述访客留言提醒还指示有同意输入留言所需执行的输入操作；留言采集单元包括：第三留言采集单元，用于如果所述反馈信息为与所述访客留言提醒提示的输入操作对应的反馈信息，采集所述来访者的多媒体留言信息并存储。
226.在本实施例的一些可选的实现方式中，该装置还包括：站位提示单元，用于在留言采集单元采集所述来访者的多媒体留言信息之前，输出站位调整指示，所述站位调整指示用于提示来访者适合输入留言信息的站立位置；该留言采集单元在采集该来访者的多媒体留言信息并存储时，具体为，用于确定来访者处于适合输入留言信息的站立位置或者来访者确认启动留言采集，采集所述来访者的多媒体留言信息并存储。
227.在本实施例的一些可选的实现方式中，该装置还包括：留言事件提醒单元，用于在
留言采集单元采集所述来访者的多媒体留言信息并存储之后，通过云服务器向设定的终端设备发送留言事件提醒，所述留言事件提醒用于提示存在来访者的留言信息。
228.需要说明的是，媒体输出控制装置800可以是芯片，组件或模块，媒体输出控制装置800可包括处理器和存储器，第一特征获得单元801、第二特征获得单元802、媒体特征确定单元803和媒体输出单元804等均作为程序单元存储在存储器中，由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
229.处理器中可以包含内核，由内核去存储器中调取相应的程序单元。内核可以设置一个或多个，通过调整内核参数来使得智能监管设备输出的媒体信号随着目标动作的两个维度的特征信息不同而有所变化，使得智能监管设备的用户能够根据媒体信号可以更为直观和准确了解到来访者的目标动作特征，提高了监管行为提醒的有效性和灵活性。
230.存储器可能包括计算机可读介质中的非永久性存储器，随机存取存储器(ram)和/或非易失性内存等形式，如只读存储器(rom)或闪存(flash ram)，存储器包括至少一个存储芯片。
231.下面参考图9，其示出了适于用来实现本技术一些实施例的智能监管设备900的结构示意图。图9示出的智能监管设备仅仅是一个示例，不应对本技术实施例的功能和使用范围带来任何限制。
232.如图9所示，智能监管设备900可以包括处理器901、存储器902、通信接口903、输入单元904、输出单元905和通信总线906。
233.其中，处理器901和存储器902通过通信总线906彼此相连。通信接口903、输入单元904和输出单元905也连接至通信总线906。
234.其中，通信接口903可以为通信模块的接口，如gsm模块的接口。通信接口903可以用于经路由网关设备和云服务器向终端设备发送留言事件提醒以及媒体输出事件提醒等，还可以用于向终端设备传输多媒体留言信息等。
235.在本技术实施例中，处理器901，可以为中央处理器(central processing unit，cpu)、特定应用集成电路(application-specific integrated circuit，asic)、数字信号处理器(dsp)、专用集成电路(asic)、现成可编程门阵列(fpga)或者其他可编程逻辑器件等。该处理器可以为智能监管设备中的综合控制芯片等。
236.在一种可能的实现方式中，存储器902可包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、以及至少一个程序数据等；存储数据区可存储根据智能监管设备的使用过程中所创建的数据，比如，媒体输出事件的响应事件，媒体信号以及来访者的多媒体留言信息等。
237.此外，存储器902可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件或其他易失性固态存储器件。
238.处理器901可以调用存储器902中存储的程序，具体的，处理器901可以执行以上图1、图3至图7中智能监管设备所执行的操作。
239.存储器902中用于存放一个或者一个以上程序，程序可以包括程序代码，所述程序代码包括计算机操作指令，在本技术实施例中，存储器902中至少存储有用于实现以下功能的程序：获得第一传感器感应到的第一特征信息；
获得第二传感器感应到的第二特征信息，所述第一特征信息与所述第二特征信息为用于表征存在目标动作的可能性特征，且所述第一特征信息与第二特征信息属于不同维度的特征信息，所述目标动作为触发输出媒体信号的动作；如果所述第一特征信息和第二特征信息满足设定条件，确定与所述第一特征信息和第二特征信息匹配的媒体输出特征，所述设定条件为表征存在所述目标动作的条件；输出具有所述媒体输出特征的媒体信号。
240.该输入单元可以包括智能监管设备上的第一传感器、第二传感器、视频采集装置和音频采集装置等，对此不加限制。
241.该输出单元可以包括智能监管设备上的媒体输出装置、显示屏以及语音播放器等等。
242.当然，图9所示的智能监管设备900的结构并不构成对本技术实施例中智能监管设备的限定，在实际应用中智能监管设备可以包括比图9所示的更多或更少的部件，或者组合某些部件。
243.本技术实施例提供了一种计算机可读介质，其上存储有计算机程序，其中，该程序被处理器执行时实现以上各方法实施例描述的媒体输出控制方法。
244.本技术实施例提供了一种处理器，该处理器用于运行程序，其中，该程序运行时实现以上各方法实施例描述的媒体输出控制方法。
245.本技术还提供了一种计算机程序产品，当在数据处理设备上执行时，使得数据处理设备实现以上各方法实施例描述的媒体输出控制方法。
246.其中，本技术的上述实施例提供的智能猫眼设备、处理器、计算机可读介质或计算机程序产品可以均用于执行上文所提供的对应的方法，因此，其所能达到的有益效果可参考上文所提供的对应的方法中的有益效果，此处不再赘述。
247.本技术是参照根据本技术实施例的方法、设备（系统）、和计算机程序产品的流程图和／或方框图来描述的。应理解可由计算机程序指令实现流程图和／或方框图中的每一流程和／或方框、以及流程图和／或方框图中的流程和／或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和／或方框图一个方框或多个方框中指定的功能的装置。
248.这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和／或方框图一个方框或多个方框中指定的功能。
249.这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和／或方框图一个方框或多个方框中指定的功能的步骤。
250.在一个典型的配置中，计算设备包括一个或多个处理器 (cpu)、输入/输出接口、网络接口和内存。
251.存储器可能包括计算机可读介质中的非永久性存储器，随机存取存储器(ram)和/
或非易失性内存等形式，如只读存储器(rom)或闪存(flash ram)。存储器是计算机可读介质的示例。
252.计算机可读介质包括永久性和非永久性、可移动和非可移动媒体，可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存 (pram)、静态随机存取存储器 (sram)、动态随机存取存储器 (dram)、其他类型的随机存取存储器 (ram)、只读存储器 (rom)、电可擦除可编程只读存储器 (eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器 (cd-rom)、数字多功能光盘 (dvd) 或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体 (transitory media)，如调制的数据信号和载波。
253.本领域技术人员应明白，本技术的实施例可提供为方法、系统或计算机程序产品。因此，本技术可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质（包括但不限于磁盘存储器、cd-rom、光学存储器等）上实施的计算机程序产品的形式。
254.以上描述仅为本技术的较佳实施例以及对所运用技术原理的说明而已，并不用于限制本技术。对于本领域技术人员来说，本技术可以有各种更改和变化。本技术中所涉及的发明范围，并不限于上述技术特征的特定组合而成的技术方案，同时也应涵盖在不脱离上述发明构思的情况下，由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本技术中公开的（但不限于）具有类似功能的技术特征进行互相替换而形成的技术方案。

技术特征：

1.一种媒体输出控制方法，其特征在于，包括：获得第一传感器感应到的第一特征信息；获得第二传感器感应到的第二特征信息，所述第一特征信息与所述第二特征信息为用于表征存在目标动作的可能性特征，且所述第一特征信息与第二特征信息属于不同维度的特征信息，所述目标动作为触发输出媒体信号的动作；如果所述第一特征信息和第二特征信息满足设定条件，确定与所述第一特征信息和第二特征信息匹配的媒体输出特征，所述设定条件为表征存在所述目标动作的条件；输出具有所述媒体输出特征的媒体信号。2.根据权利要求1所述的方法，其特征在于，所述获得第一传感器感应到的第一特征信息，包括：获得第一传感器感应到的声音特征信息；所述获得第二传感器感应到的第二特征信息，包括：获得第二传感器感应到的振动特征信息。3.根据权利要求2所述的方法，其特征在于，所述声音特征信息包括：声音信号的音量大小以及声音信号的发声频率；所述振动特征信息包括：振动信号的振动大小以及振动信号的振动频率；所述如果所述第一特征信息和第二特征信息满足设定条件，确定与所述第一特征信息和第二特征信息匹配的媒体输出特征，包括：如果所述声音信号的音量大小和所述振动信号的振动大小满足设定条件，确定与所述声音信号的音量大小和发声频率以及所述振动信号的振动大小和振动频率匹配的媒体输出特征。4.根据权利要求1所述的方法，其特征在于，所述确定与所述第一特征信息和第二特征信息匹配的媒体输出特征，包括：确定与所述第一特征信息和第二特征信息匹配的媒体输出参数；所述输出具有所述媒体输出特征的媒体信号，包括：依据所述媒体输出参数输出媒体信号。5.根据权利要求1所述的方法，其特征在于，所述确定与所述第一特征信息和第二特征信息匹配的媒体输出特征，包括：确定与所述第一特征信息和第二特征信息匹配的音频类型；所述输出具有所述媒体输出特征的媒体信号，包括：输出符合所述音频类型的音频信号。6.根据权利要求1所述的方法，其特征在于，还包括：检测到触按指定按钮的触按事件，输出所述触按事件对应的媒体信号，所述指定按钮为用于触发输出媒体信号的触发按钮；在所述输出具有所述媒体输出特征的媒体信号，或者输出所述触按事件对应的媒体信号之后，还包括：如果在设定时长阈值内未检测到针对所述媒体信号的回应事件，输出访客留言提醒，所述访客留言提醒用于提醒来访者输入留言；获得来访者针对所述访客留言提醒的反馈信息；
如果所述反馈信息表征所述来访者同意输入留言，采集所述来访者的多媒体留言信息并存储。7.根据权利要求6所述的方法，其特征在于，所述获得来访者针对所述访客留言提醒的反馈信息，包括：获得来访者针对所述访客留言提醒输入的语音信息；所述如果所述反馈信息表征所述来访者同意输入留言，采集所述来访者的多媒体留言信息并存储，包括：如果识别出所述语音信息表征所述来访者同意输入留言，采集所述来访者的多媒体留言信息并存储。8.根据权利要求6所述的方法，其特征在于，所述获得来访者针对所述访客留言提醒的反馈信息，包括：获得来访者针对所述访客留言提醒输入的身体姿态图像，所述身体姿态图像为：包括所述来访者的至少一部分肢体的肢体动作的图像；所述如果所述反馈信息表征所述来访者同意输入留言，采集所述来访者的多媒体留言信息并存储，包括：如果从所述身体姿态图像中识别出设定肢体动作，采集所述来访者的多媒体留言信息并存储，所述设定肢体动作为表征同意输入留言的肢体动作。9.根据权利要求6所述的方法，其特征在于，所述访客留言提醒还指示有同意输入留言所需执行的输入操作；所述如果所述反馈信息表征所述来访者同意输入留言，采集所述来访者的多媒体留言信息并存储，包括：如果所述反馈信息为与所述访客留言提醒提示的输入操作对应的反馈信息，采集所述来访者的多媒体留言信息并存储。10.根据权利要求6至8任意一项所述的方法，其特征在于，在所述采集所述来访者的多媒体留言信息之前，还包括：输出站位调整指示，所述站位调整指示用于提示来访者适合输入留言信息的站立位置；所述采集所述来访者的多媒体留言信息并存储，包括：在确定来访者处于适合输入留言信息的站立位置或者来访者确认启动留言采集，采集所述来访者的多媒体留言信息并存储。11.根据权利要求6所述的方法，其特征在于，在所述采集所述来访者的多媒体留言信息并存储之后，还包括：通过云服务器向设定的终端设备发送留言事件提醒，所述留言事件提醒用于提示存在来访者的留言信息。12.一种媒体输出控制装置，其特征在于，包括：第一特征获得单元，用于获得第一传感器感应到的第一特征信息；第二特征获得单元，用于获得第二传感器感应到的第二特征信息，所述第一特征信息与所述第二特征信息为用于表征存在目标动作的可能性特征，且所述第一特征信息与第二特征信息属于不同维度的特征信息，所述目标动作为触发输出媒体信号的动作；
媒体特征确定单元，用于如果所述第一特征信息和第二特征信息满足设定条件，确定与所述第一特征信息和第二特征信息匹配的媒体输出特征，所述设定条件为表征存在所述目标动作的条件；媒体输出单元，用于输出具有所述媒体输出特征的媒体信号。13.一种计算机可读介质，其特征在于，所述计算机可读介质上存储有计算机程序，其中，所述程序被处理器执行时实现如权利要求1-11中任一项所述的媒体输出控制方法。14.一种处理器，其特征在于，所述处理器用于运行程序，其中，所述程序运行时实现如权利要求1-11中任一项所述的媒体输出控制方法。15.一种智能监管设备，其特征在于，包括：一个或多个处理器；与所述处理器相连的第一传感器、第二传感器和存储装置；所述第一传感器，用于感应第一特征信息；所述第二传感器，用于感应第二特征信息；所述存储装置，其上存储有一个或多个程序；当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器实现如权利要求1-11中任一项所述媒体输出控制方法。

技术总结

本申请实施例公开了一种媒体输出控制方法、装置、设备及可读介质。该方法的一具体实施方式包括：获得第一传感器感应到的第一特征信息；获得第二传感器感应到的第二特征信息，第一特征信息与第二特征信息为用于表征存在目标动作的可能性特征，目标动作为触发输出媒体信号的动作；如果第一特征信息和第二特征信息满足设定条件，确定与第一特征信息和第二特征信息匹配的媒体输出特征，设定条件为表征存在目标动作的条件；输出具有该媒体输出特征的媒体信号。该实施方式实现了根据用于表征目标动作的两个不同维度的特征控制输出媒体信号，既可以减少误判存在目标动作的情况，也可以提高媒体信号输出的灵活性。媒体信号输出的灵活性。媒体信号输出的灵活性。