交流管理装置及方法与流程



1.本发明的实施方式涉及使用语音及文本的交流(达成共识、意愿沟通等)支援技术。


背景技术:



2.作为语音交流的一例,有收发器(transceiver)。收发器是兼具无线电波的发送功能和接收功能的无线机,1人的用户能够与多人的用户进行通话(单向或者双向的信息传达)。收发器的应用例能够举出施工现场、集会会场、酒店、旅馆等设施等。另外,也能够举出出租汽车无线作为收发器应用的一例。
3.现有技术文献:
4.专利文献:
5.专利文献1:日本特开2000-155600号公报
6.专利文献2:日本特许第4678773号


技术实现要素:



7.发明所要解决的课题:
8.目的在于,实现在交流组内共享用户发言语音的听取容易程度的评价结果的环境,并对提高多个用户间的信息传达的品质进行支援。
9.用于解决课题的手段:
10.实施方式的交流系统经由多个由各用户分别携带的移动通信终端,将用户的发言语音向其他用户的移动通信终端进行广播分发。本交流系统具备:交流控制部,具有第1控制部和第2控制部,该第1控制部将从移动通信终端接收的发言语音数据向其他多个移动通信终端中的各个移动通信终端进行广播分发,该第2控制部将通过对接收的发言语音数据进行语音识别处理而得到的发言语音识别结果作为用户彼此的交流履历按照时间序列进行积蓄,并且进行文本分发控制以使所述交流履历在所述各移动通信终端中被同步显示;以及发言语音评价部,对接收的发言语音数据进行语音品质评价处理,并输出语音品质评价结果。所述交流控制部进行文本分发控制以使基于发言语音的所述语音识别结果及对应的语音品质评价结果被显示在多个所述各用户终端中。
附图说明
11.图1是第1实施方式的交流系统的网络构成图。
12.图2是第1实施方式的交流管理装置及用户终端各自的构成框图。
13.图3是表示第1实施方式的用户信息及组信息的一例的图。
14.图4是第1实施方式的用户终端上显示的画面例。
15.图5是表示第1实施方式的语音波形的一例以及语音品质评价信息的一例的图。
16.图6是表示第1实施方式的交流系统的处理流程的图。
17.图7是表示第1实施方式的与基于语音品质评价履历的品质提高或者品质降低相应的振动控制的一例的处理流程。
18.图8是表示第1实施方式的交流组内的各用户的语音品质评价结果的统计履历的显示例的图。
19.图9是第2实施方式的交流管理装置及用户终端各自的构成框图。
20.图10是表示第2实施方式的分用户位置评价自定义信息的一例的图。
21.图11是表示第2实施方式的交流系统的处理流程的图。
具体实施方式
22.(第1实施方式)
23.图1至图8是第1实施方式所涉及的交流系统的网络构成图。交流系统以交流管理装置(以下称为管理装置)100为中心,提供使用了语音及文本的信息传达支援功能。以下,以住宿设施等的设施运营管理作为一例,关于适用了交流系统的方式进行说明。
24.管理装置100与多个由各用户分别携带的各用户终端(移动通信终端)500以无线通信连接。管理装置100将从一个用户终端500接收的发言语音数据向其他用户终端500进行广播分发。
25.用户终端500例如是智能电话等多功能便携电话机、pda(个人数码助手(personal digital assistant))、平板电脑型终端等可携带的便携终端(移动终端)。用户终端500具备通信功能、运算功能及输入功能,经由ip(互联网协议(internet protocol))网或者移动通信线路网(mobile communication network)以无线通信与管理装置100连接,并进行数据通信。
26.一个用户的发言语音向其他多个用户终端500广播分发的范围(或者后述的交流履历被同步显示的范围)被设定作为交流组,登记有对象用户(现场用户)的各个用户终端500。
27.本实施方式的交流系统对以多个用户各自能够以免提方式进行对话作为前提的、用于达成共识或意愿沟通的信息传达进行支援。特别是,本交流系统对用户的发言语音的听取容易程度进行评价,并提供在交流组内对评价结果进行共享的共享功能、以及向发言的用户反馈评价结果的反馈功能。由此,促进用户间的信息传达的品质提高。
28.在1对1的发言或1对多的发言中,如果用户的发言语音难以听取,则有时无法顺利传达信息。例如,发生重新询问,或者信息以与发言内容不同的解释被传达。重新询问导致信息传达效率降低,因此发生时间上的消耗,有可能导致用户行动的延迟等的低效率化。另外,如果信息以不同的解释被传达,则会引起作业错误或作业的重做。
29.另一方面,如果用户的发言语音不便听取或者刺耳,则容易给用户带来不愉快感。作为交流环境,如果用户的发言语音对其他用户而言听起来愉快,则易于在多个用户的各个用户之间构筑顺利的信息传达的环境(例如易于进行作业的环境)。
30.但是,在大量用户的交流组中,向各用户指导容易听取的发言、或者进行指导以使其改善令人心烦的发言语音,在劳力、时间、人际关系上都有困难的一面。因此,需要一种环境,使得用户自身自发地认识到自己的发言语音需要改善,而且易于促使用户行动以进行改善。
31.本交流系统作为能够对各用户的发言语音的品质进行评价并促使其自主地进行改善的环境,提供在交流组内共享各用户的发言语音品质的评价结果的功能。另外,通过追加提供向用户自身反馈自己的发言语音的品质的好坏的功能,容易实现易于促使用户行动以提高发言语音的品质的环境。
32.此外,在以下的说明中,以本交流系统具备在交流组内共享各用户的发言语音品质的评价结果的功能、以及向用户自身反馈自己的发言语音的品质的好坏的功能这两个功能的方式作为一例进行说明,但也可以构成为仅具备在交流组内共享各用户的发言语音品质的评价结果的功能的系统。
33.图2是管理装置100及用户终端500各自的构成框图。
34.管理装置100包括控制装置110、存储装置120及通信装置130。通信装置130进行与多个的各用户终端500之间的通信连接管理及数据通信控制,且进行将一个用户的发言语音数据及其发言内容的文本信息(通过对发言语音数据进行语音识别处理而得到的文本信息)向多个的各用户终端500一齐发送的广播分发通信控制。
35.控制装置110构成为包括用户管理部111、交流控制部112、语音识别部113、语音合成部114及发言语音评价部115。存储装置120构成为包括用户信息121、组信息122、交流履历(交流日志)信息123、语音识别词典124、语音合成词典125及语音品质评价信息。
36.语音合成部114及语音合成词典125提供语音合成功能,该语音合成功能为,接收从用户终端500以文本输入的字符信息、或从用户终端500以外的信息输入装置(例如,管理者、运营者、监督者所操作的移动终端或桌面pc)以文本输入的字符信息,并转换为语音数据。但是,本实施方式的交流系统的语音合成功能是任意的功能。也就是说,本实施方式的交流系统也可以构成为不具备该语音合成功能。在具备语音合成功能的情况下,管理装置100的交流控制部112接收从用户终端500输入的文本信息,语音合成部114使用语音合成词典125,合成与接收的文本的字符对应的语音数据,并生成语音合成数据。此时,构成语音合成数据的语音数据的素材是任意的。然后,将合成语音数据及接收的文本信息向其他用户终端500进行广播分发。
37.用户终端500构成为包括通信/通话部510、交流应用控制部520、麦克风530、扬声器540、触摸面板等显示输入部550、以及存储部560。此外,扬声器540在实际上由耳机、头戴耳机(有线或者无线)等构成。另外,振动装置570是用户终端500的振动装置。
38.图3是表示各种信息的一例的图,用户信息121是利用本交流系统的用户登记信息。用户管理部111进行控制以使得能够经由规定的管理画面设定用户id、用户名、属性、组。另外,用户管理部111管理各用户终端500中的向本交流系统的登入履历、以及登入的用户id与该用户终端500的识别信息(用户终端500固有的mac地址、固体识别信息等)之间的对应列表。
39.组信息122是划分交流组的组识别信息。按不同的交流组id控制传达信息的收发及广播分发,并进行控制以使在不同的交流组间信息不混杂。在用户信息121中,能够将组信息122中登记的交流组与各用户建立关联。
40.本实施方式的用户管理部111提供进行多个的各用户的登记控制、并设定作为后述的第1控制(发言语音数据的广播分发)及第2控制(代理发言文本或者/以及用户的发言语音识别结果的文本广播分发)的对象的交流组的功能。
41.此外,关于分组,也能够与导入本实施方式的交流系统的设施等相应地将设施分割到多个部门进行管理。例如,以住宿设施作为一例进行说明,也能够将行李员(行李搬运)、接待员、客房服务(清扫)设定为分别不同的组,构筑将客房管理分别按每个组进行细分的交流环境。作为其他观点,也可以考虑在职能上无需交流的情形。例如,菜品的上菜员与行李员(行李搬运)无需进行直接交流,因此能够分组。另外,也可以考虑在地理上无需交流的情形,例如,在a分店、b分店等地理上远离而且无需频繁进行交流的情况等下,能够分组。
42.管理装置100的交流控制部112作为第1控制部和第2控制部的各控制部发挥功能。第1控制部将从一个用户终端500接收的发言语音数据向其他多个用户终端500中的各个用户终端500进行广播分发控制。第2控制部将通过对接收的发言语音数据进行语音识别处理而得到的发言语音识别结果作为用户彼此的交流履历123按照时间序列进行积蓄,并且进行文本分发控制以使交流履历123在包括发言用户的用户终端500在内的全部用户终端500中被同步显示。
43.作为第1控制部的功能是发言语音数据的广播分发。发言语音数据主要是用户所发声的语音数据。另外,如上所述,在具备语音合成功能的情况下,根据从用户终端500输入的文本信息而人工生成的语音合成数据也成为第1控制部所进行的广播分发的对象。
44.作为第2控制部的功能是用户的发言语音识别结果的文本广播分发。用户终端500中输入的语音及用户终端500中再现的语音全部被文本化并按照时间序列积蓄至交流履历123,且被控制为在各用户终端500中被同步显示。语音识别部113使用语音识别词典124进行语音识别处理,并输出文本数据作为发言语音识别结果。关于语音识别处理,能够适用公知的技术。
45.另外,发言语音评价部115针对接收的用户的发言语音、即向其他用户广播分发的发言语音数据,进行规定的语音品质评价处理,并生成语音品质评价结果。
46.在本实施方式中,各语音品质评价结果与交流履历123中积蓄的用户的发言语音识别结果建立关联地积蓄。然后,第2控制部将用户的发言语音识别结果与其语音品质评价结果作为集合,进行文本广播分发。
47.此时,交流控制部112(例如第2控制部)针对发言的用户、也就是说被进行了语音品质评价处理的语音数据的发言者,进行反馈处理。关于反馈处理后述。
48.交流履历信息123是各用户的发言内容与时间信息一起基于文本按照时间序列被积蓄而成的日志信息。与各文本对应的语音数据能够作为语音文件事先存放在规定的存储区域中,例如,在交流履历123中记录语音文件的存放场所。交流履历信息123按不同的交流组分别生成并积蓄。此外,语音品质评价结果也可以被包含在交流履历信息123中而积蓄,或者与对应的发言内容建立关联地积蓄在独立的存储区域中。
49.图4是表示各用户终端500上显示的交流履历123的一例的图。用户终端500各自能够从管理装置100实时地或者在规定的定时接收交流履历123,在多个用户间取得显示同步。各用户能够按照时间序列参照过去的交流日志。
50.如图4的例子那样,各用户终端500将自己的发言内容及自己以外的其他用户的发言内容按照时间序列显示在显示栏d中,而管理装置100中积蓄的交流履历123作为日志信息被共享。此外,在显示栏d中,能够对于与用户自身的发言语音对应的文本,显示麦克风标
记h,对于发言者以外的其他用户,替代麦克风标记h而在显示栏d中显示扬声器标记m。
51.另外,如图4所示,在显示栏d的发言内容的各文本显示栏中,一并显示有语音品质评价信息(语音品质评价注释)c。
52.在此,说明针对用户的发言语音的语音品质评价处理。图5是表示语音波形的一例以及语音品质评价信息的一例的图。
53.在图5所示的语音波形例中,纵轴为振幅,横轴为时间。作为难以听取的发言的例子,可以举出“声音大的发言”。如果用户的声音大,则超过由麦克风集音的音域的上限(语音输入上限值)而发言整体成为声音不清楚的语音,一般不便听取。也就是说,如果用户的声音大,则如图5的例子那样,成为涂抹后的振幅波形的连续,构成发言的辅音、元音各自的波形的特征难以听到。另外,虽然也与麦克风的性能有关,但超过语音输入上限值的部分被统一截断,因此辅音、元音的振幅波形的特征难以捕捉。此外,除了用户自身的声音大的情形以外,在麦克风与用户的嘴之间的距离近而造成低音被强调的情形中,由于与声音大的情形同样的理由,也不便听取。
54.另一方面,在声音小的情形下,有时也不便听取。在声音小的情况下,与声音大的情况相反,振幅波形小,构成发言的辅音、元音各自的波形的特征也难以听到。进而,由于周围的噪声(noise)的影响,发言内容有时不便听取。
55.在本实施方式中,基于这样的难以听取、不便听取,换言之容易听取、容易听到等观点,预先设定图5所示的语音品质评价信息,作为定量地评价用户的发言语音品质的指标。语音品质评价信息能够任意地设定。例如,使用在意见评价法中进行了主观品质评价的多个样本语音,提取/推断语音的振幅等物理性特征,并制作分等级的客观品质评价。能够将制作的客观品质评价的物理性特征与用户的发言语音数据的物理性特征进行匹配,并评价发言语音数据的语音品质。
56.在图5的例中,语音评价等级被划分为“好”、“普通”、“差”这3个阶段,分等级地规定了1个或者多个评价设定值。作为针对各语音评价等级设置的评价设定值,例如能够将接收的发言语音数据的振幅波形与语音输入上限值之间的关系设定为评价基准。另外,按每个语音评价等级设定了1个或者多个语音品质评价注释。此外,作为一例,也可以构成为:对语音评价等级“差”设定了3个评价设定值,按不同的各评价设定值设定不同的语音品质评价注释。语音评价等级的等级划分、与各等级对应的评价设定值、语音品质评价注释是任意的。
57.语音品质评价注释例如能够针对语音评价等级“好”设定“清晰”,针对语音评价等级“普通”设定“ok(合格)”,针对语音评价等级“差”设定多个“声音过大”、“声音小”、“过于嘈杂”。
58.交流控制部112(第2控制部)对语音品质评价注释(语音品质评价结果)与语音识别结果一起进行文本广播分发,在交流组内的各用户间共享语音品质评价结果。
59.另一方面,对被评价了发言语音的用户提供反馈功能。在图5的例中,对各个语音评价等级设定有1个或者多个振动控制值作为反馈控制信息。振动控制值是用户终端500的振动装置570的控制命令(包括振动模式)。振动控制值向评价对象的用户终端500输出。交流控制部112(第2控制部)向评价对象的用户终端500分发语音识别结果、语音品质评价注释及振动控制值,向评价对象以外的用户终端500分发语音识别结果及语音品质评价注释。
另外,语音品质评价注释作为语音品质评价结果被存放在交流履历123中。
60.用户终端500在伴随着接收的文本信息的显示控制而接收到振动控制值的情况下,使振动装置570动作来使用户终端500振动。由此,能够向以免提作为前提来使用用户终端500的用户反馈并告知语音品质评价结果。
61.此外,振动控制值能够准备多个模式,并根据各评价内容而适宜地设定。例如,将评价为声音大的情况下的振动控制值a-1与评价为声音小的情况下的振动控制值a-2设定为不同的振动模式(振动节奏模式)。
62.进而,也可以构成为在满足规定的条件的情况下向用户终端500提供振动控制值。规定的条件例如是:控制为仅在语音评价等级为“差”时输出振动控制值,而在语音评价等级为“好”时和“普通”时不输出振动控制值,也能够使用户能够把握语音品质并不差的情况。
63.图6是表示本实施方式的交流系统的处理流程的图。
64.各用户在用户终端500中,启动交流应用控制部520,交流应用控制部520进行与管理装置100的连接处理。然后,从规定的登入画面输入自己的用户id及密码并登入管理装置100。登入认证处理由用户管理部111执行。登入后的各用户终端500在任意的定时或者以规定的时间间隔,与管理装置100之间进行信息取得处理。
65.如果用户a发言,则交流应用控制部520收集发言语音,并将发言语音数据向管理装置100发送(s501a)。管理装置100的语音识别部113对接收的发言语音数据进行语音识别处理(s101),并输出发言内容的语音识别结果。另外,发言语音评价部115与语音识别处理并行或者独立地,基于语音品质评价信息,对接收的发言语音数据进行语音品质评价处理,并输出语音品质评价结果(s102)。交流控制部112将语音识别结果及其语音品质评价结果存储至交流履历123,并将发言语音数据存储至存储装置120(s103)。
66.交流控制部112进行基于从发言语音品质评价部115输出的语音品质评价结果判断是否向评价对象的用户终端500发送振动控制值的处理(s104)。在判断为向评价对象的用户终端500发送振动控制值的情况下(s104:是),交流控制部112向作为评价对象的用户a的用户终端500发送用于显示同步的包括语音品质评价结果的语音识别结果、以及振动控制值(s105)。另一方面,向发言的用户a以外的其他用户终端500中的各个用户终端500广播发送用户a的发言语音数据,并且进行用于显示同步的包括语音品质评价结果的语音识别结果的文本分发。
67.首先,用户a的用户终端500的振动装置570基于接收的振动控制值,进行振动动作(s502a)。另外,交流应用控制部520使接收的文本形式的发言内容及语音品质评价结果显示在显示栏d中(s503a)。
68.然后,用户a以外的各用户终端500对接收的发言语音数据进行自动再现处理,并进行发言语音输出(s501b、s501c),并且使以语音输出的发言语音所对应的文本形式的发言内容及语音品质评价结果显示在显示栏d中(s502b、s502c)。
69.在步骤104中判断为不向评价对象的用户终端500发送振动控制值的情况下(s104:否),交流控制部112不向评价对象的用户a发送振动控制值,而将交流履历123中存储的用户a的发言内容(文本)及其语音品质评价结果为了显示同步向包含用户a自身的交流组内的各用户终端500发送(s106)。另外,向发言的用户a以外的其他用户终端500中的各
个用户终端500广播发送用户a的发言语音数据。
70.在该情况下,用户a的用户终端500未接收到振动控制值,因此交流应用控制部520使接收的文本形式的发言内容及语音品质评价结果显示在显示栏d中(s504a)。另外,用户a以外的各用户终端500与上述各步骤同样地,进行发言语音数据的自动再现处理,并进行发言语音输出(s503b、s503c),并且使以语音输出的发言语音所对应的文本形式的发言内容及语音品质评价结果显示在显示栏d中(s504b、s504c)。
71.此外,交流控制部112也可以构成为将发言语音数据的广播分发及文本分发的各分发处理、与向评价对象的用户终端500发送振动控制值的处理作为相互独立的处理来执行。也就是说,能够以向属于交流组的各用户的多播数据转发方式进行分发处理,而能够以向评价对象的单播数据转发方式进行振动控制值的发送处理。通过并行地进行多播数据转发方式的分发处理与单播数据转发方式的发送处理各自的处理,能够与向评价对象的反馈相独立地确保交流组内的信息的顺利传达。
72.图7是表示第1实施方式的交流系统的考虑了过去的语音品质评价履历的振动控制的一例的处理流程。此外,关于与图6的处理同样的处理,附加相同标记并省略说明。
73.发言语音评价部115(或者交流控制部112)伴随着针对接收的发言语音数据进行的语音品质评价处理,而参照语音品质评价结果的对象用户的过去的评价结果(s1031),基于过去的评价结果和当前的评价结果选择不同的振动模式的振动控制值,并向评价对象的用户终端500发送。
74.在这次的语音品质评价结果为“好”而上次的语音品质评价结果为“差”时,判断为语音品质提高(s1032:是),选择振动模式b的振动控制值并向评价对象的用户终端500发送(s1041)。此外,振动模式b是与语音品质评价结果被判断为“差”时的振动模式a不同的振动模式。在这次的语音品质评价结果为“普通”而上次的语音品质评价结果为“差”时的情形、在这次的语音品质评价结果为“好”而上次的语音品质评价结果为“普通”时的情形也是同样的。
75.即,在语音品质评价结果(语音评价等级)比最近(上次)改善时,通过输出振动控制值而向用户终端500提供针对语音品质的提高的反馈,用户能够在感觉上把握发言语音品质已改善的情况。
76.评价对象的用户a的用户终端500基于接收的振动控制值,进行振动装置570的动作控制(s506a)。另外,交流应用控制部520使接收的文本形式的发言内容及语音品质评价结果显示在显示栏d中(s507a)。
77.用户a以外的各用户终端500对接收的发言语音数据进行自动再现处理,并进行发言语音输出(s505b、s505c),并且使以语音输出的发言语音所对应的文本形式的发言内容及语音品质评价结果显示在显示栏d中(s506b、s506c)。
78.另外,在这次的语音品质评价结果为“差”时,或者在上次的语音品质评价结果为“好”且接下来这次的语音品质评价结果为“好”时(或者,在上次的语音品质评价结果为“普通”且接下来这次的语音品质评价结果为“普通”时),向步骤s1033前进。在步骤s1033中,在上次的语音品质评价结果为“好”且接下来这次的语音品质评价结果为“好”时(或者,在上次的语音品质评价结果为“普通”且接下来这次的语音品质评价结果为“普通”时),进行与图6的步骤s106同样的处理。
79.另一方面,在这次的语音品质评价结果为“差”时,判断为语音品质降低(s1033:是),并参照上次的语音品质评价结果。然后,判断品质劣化的连续性或者品质劣化的频率(次数)(s1034)。
80.在步骤s1034中,在上次的语音品质评价结果为“好”的情况下,例如判断为不满足品质劣化的连续性或者品质劣化的频率(次数)(s1034:否),进行与图6的步骤s105同样的处理。在上次的语音品质评价结果也为“差”的情况下,判断为满足品质劣化的连续性或者品质劣化的频率(s1034:是),并向步骤s1042前进。在步骤s1042中,选择与图6的步骤s105中发送的振动控制值不同的、表示品质劣化的连续性或者品质劣化的频率高的振动模式ab的振动控制值,并向用户a的用户终端500发送。
81.评价对象的用户a的用户终端500基于接收的振动控制值(振动模式ab),进行振动装置570的动作控制(s508a)。另外,交流应用控制部520使接收的文本形式的发言内容及语音品质评价结果显示在显示栏d中(s509a)。
82.用户a以外的各用户终端500对接收的发言语音数据进行自动再现处理,并进行发言语音输出(s507b、s507c),并且使以语音输出的发言语音所对应的文本形式的发言内容及语音品质评价结果显示在显示栏d中(s508b、s508c)。
83.像这样,对于语音品质的提高或者语音品质的降低,进行控制以使振动装置570动作来向用户通知。通过向用户终端500提供针对语音品质的反馈,用户能够在感觉上把握自身的发言语音品质的状态,能够使用户自发地提高对于语音品质的意识。
84.关于语音品质的降低,也能够考虑语音品质的劣化的连续性。例如也能够构成为:在当前的语音品质评价结果为“差”时,回溯到规定次数的过去的评价结果,检查语音品质评价结果为“差”的连续性,根据连续性而适用不同的振动模式的振动控制值。
85.作为例示,在上次的语音品质评价结果为“差”时,由于连续2次品质降低,因此向相应的用户终端500提供“嘟
·
嘟”的振动模式的振动控制值。进而,在上上次的语音品质评价结果也为“差”时,由于连续3次品质降低,因此向相应的用户终端500提供与连续2次不同的“嘟
·

·
嘟”的振动模式的振动控制值。
86.此外,除了语音品质评价结果为“差”的连续性以外,如上所述,还能够对规定期间中的语音品质评价结果为“差”的数量进行计数,并与品质劣化的频率(次数)相应地进行控制。例如,也可以根据规定期间中的语音品质评价结果为“差”的数量,适用不同的振动模式的振动控制值来进行控制。
87.另一方面,也可以构成为具备如下功能:在语音品质评价结果连续多次输出“差”、或者在规定期间中语音品质评价结果多次输出“差”时,向交流组的责任人或管理者通知。例如,能够向交流组内的责任人的用户终端500通知语音品质显著恶化的特定的用户,或者发送与该通知对应的振动控制值。能够构成为:特定的用户从责任人接受针对语音品质恶化的指导。
88.此外,关于针对语音品质评价结果为“差”的连续性或次数的控制,在该时间序列的评价履历中语音品质评价结果在中途改善为“普通”或者“好”的情况下,能够在改善的时刻将计数器复位。交流控制部112能够进行控制,以在规定的定时使语音品质评价结果为“差”的连续次数的计数、规定期间中的语音品质评价结果为“差”的计数从0重新计数。
89.图8是表示交流组内的各用户的语音品质评价结果的统计履历的显示例的图。
90.发言语音评价部115能够使用与交流履历123建立关联地积蓄的各用户的语音品质评价结果,生成如图8所示的交流组内的语音品质评价统计信息,并向各用户终端500提供。例如,能够按照时间段的不同、日的不同、月的不同等任意的期间单位,进行各用户的分语音品质等级合计处理,并制作表形式的语音品质评价统计信息。
91.在图8的例中,“通常发言”是语音品质等级“好”或者“普通”的语音品质评价结果。“声音大”是在语音品质等级“差”中被评价为“声音过大”的语音品质评价结果。“声音小”是在语音品质等级“差”中被评价为“声音小”的语音品质评价结果。“噪声”是在语音品质等级“差”中被评价为“过于嘈杂”的语音品质评价结果。
92.像这样,各用户及交流组内的责任人或管理者能够以年/月/日/小时等任意的期间、特定日期或时间段来阅览发言语音品质评价履历,能够回顾自身的发言及其他用户的发言。由此,能够更好地使用户自发地提高对于语音品质的意识。
93.(第2实施方式)
94.图9至图11是第2实施方式所涉及的交流系统的网络构成图。本实施方式的交流系统相对于上述第1实施方式而言,根据用户(用户终端500)的位置,对语音品质评价进行自定义。此外,针对与上述第1实施方式同样的构成,附加相同标记并省略说明。
95.图9是本实施方式的交流管理装置100及用户终端500各自的构成框图。与上述第1实施方式的图2相比,用户终端500具备gps装置(位置信息取得装置)580。gps装置580是已知的位置信息取得手段。
96.在本实施方式中提供如下功能:从发言的用户的用户终端500取得发言语音数据以及发言的用户的位置信息,根据用户位置,从语音品质评价处理的对象中进行排除,或者使语音品质评价宽松或强化。
97.图10是表示分用户位置评价自定义信息的一例的图。如图10所示,设定有包括评价对象用户、位置条件、自定义条件的评价自定义信息。例如,在用户位于厨房(kitchen)附近等设想为噪声总是很大的场所的情况下,在语音品质评价中“声音大”、“声音小”、“噪声大”等评价结果不是用户方面的责任,而更多地由环境方面的要素造成。于是,作为评价排除场所,如图10所示,以用户全员为对象,在判断为用户发言的场所是厨房附近时,能够临时地从语音品质评价对象中排除。
98.另外,也有像住宿设施的前台附近那样,考虑对周围的影响而需要压低声音发言的场所。在该情况下,与评价为“声音小”而语音品质处于降低的倾向的情况相比,以“较大的声音”发言反而是不优选的。于是,如上所述,作为评价排除场所,在用户发言的场所被判断为前台附近时,能够临时地从语音品质评价对象中排除,或者如图10所示,即使在评价为声音小的情况下,也控制为不使该用户的发言语音评价成为“差”。
99.在后者的情况下能够构成为:对于基于发言语音数据的语音品质评价结果,进行基于用户的位置信息使语音品质评价结果宽松的校正处理。例如,能够从语音品质评价结果“差”变更为语音品质评价结果“普通”,并与上述第1实施方式同样地向交流组内的各用户提供并共享变更后的语音品质评价结果。
100.另外,也能够进行自定义以便强化语音品质评价结果。在住宿设施的前台附近,考虑对周围的影响,也能够与平常相比使“声音小”成为高评价而使“声音大”成为低评价。于是,在基于发言语音数据的语音品质评价结果为“普通”的情况下,进行基于用户的位置信
息来强化语音品质评价的校正处理。在前台附近的发言语音的语音品质评价结果为“普通”的情况下,考虑前台附近这样的用户位置,能够进行将语音品质评价结果变更为“差”的校正处理。能够与上述第1实施方式同样地向交流组内的各用户提供并共享变更后的语音品质评价结果。也能够同样地进行反馈处理。
101.像这样,通过根据用户发言的场所,免除语音品质评价自身或者变更语音品质的评价基准,能够根据用户发言的环境提供恰当的语音品质评价环境。因此,能够恰当地对考虑到不同位置的用户的发言语音进行评价。另外,例如设为发言者发言了“当前位于前台附近,因此考虑到周围而降低声调来发言。”这样的与场所相应的发言环境的说明。在该情况下,该发言的语音品质评价不会成为低评价,因此在交流组内,能够共享在前台附近的情况下最好不要以太大的声音发言的意识,能够对提高与发言位置相应的语音品质进行支援。
102.此外,评价对象用户如图10所示,能够根据在位置条件中设定的场所,任意地设定为1人、多个用户或者用户全员。例如,有时如前台员工、客房员工等预先决定了各用户的负责业务。在该情况下,能够预先设想该用户发言的位置,因此在相应的用户在设想的位置发言的情况下,能够控制为进行自定义评价。另外,在用户在位置条件中设定的场所以外发言的情况下,如果处于评价对象用户的范围外,则控制为不进行自定义评价,由此能够进行公平的语音品质评价。
103.图11是表示本实施方式的交流系统的处理流程的图。此外,关于与图6的处理同样的处理,附加相同标记并省略说明。
104.如果用户c发言,则交流应用控制部520采集发言语音并且从gps装置580取得位置信息,并向管理装置100发送发言语音数据及位置信息(s509a)。管理装置100的语音识别部113对接收的发言语音数据进行语音识别处理(s101),并输出发言内容的语音识别结果。另外,发言语音评价部115与语音识别处理并行或者独立地,基于语音品质评价信息对接收的发言语音数据进行语音品质评价处理,并输出语音品质评价结果(s102)。
105.此时,发言语音评价部115使用从用户终端500接收的位置信息,参照分用户位置评价自定义信息,提取作为对象用户而且满足位置条件的自定义条件(s2001)。此外,在位置条件中,例如预先设定有前台附近的位置信息的范围。
106.在提取了自定义条件时,发言语音评价部115依照自定义条件进行语音品质评价的排除处理,或者进行上述的步骤s2001的针对语音品质评价结果的校正处理。在图11的例中,例示了自定义条件是判断是否从语音品质评价中排除的方式,在步骤s2002中,在判断为从语音品质评价中排除的情况下,向步骤s2003前进,交流控制部112将语音识别结果存储至交流履历123,而不存储步骤s102中的语音品质评价结果。
107.然后,交流控制部112向用户c的用户终端500发送语音识别结果,交流应用控制部520使接收的文本形式的发言内容显示在显示栏d中(s510c)。
108.然后,用户c以外的各用户终端500对接收的发言语音数据进行自动再现处理,并进行发言语音输出(s510a、s509b),并且使以语音输出的发言语音所对应的文本形式的发言内容及语音品质评价结果显示在显示栏d中(s511a、s510b)。
109.此外,在本实施方式中将反馈控制信息作为振动控制值进行了说明,但不限于此,也可以是引起用户注意的各种声音(例如像闹钟那样的声音(哔—哔—)或蜂鸣音等)。作为控制值,能够改变音量,或者设为连续音的数量等。也可以设为利用合成音输出品质评价结
果自身(声音大、声音小等)。
110.以上说明了本实施方式,但交流管理装置100及用户终端500的各功能能够通过程序实现,为了实现各功能而预先准备的计算机程序被存放于辅助存储装置,cpu等控制部将辅助存储装置中存放的程序读出至主存储装置,并由控制部执行被读出至主存储装置的该程序,由此能够使各部分的功能进行动作。
111.另外,上述程序也能够在被记录于计算机可读取的记录介质的状态下向计算机提供。作为计算机可读取的记录介质,可以举出cd-rom等光盘、dvd-rom等相变型光盘、mo(磁光(magnet optical))或md(迷你盘(mini disk))等光磁盘、软盘(floppy)(注册商标)或可移动硬盘等磁盘、紧凑式闪存(注册商标)、智能介质、sd存储卡、存储棒等存储卡。另外,作为记录介质也包含为了实现本发明的目的而特别设计并构成的集成电路(ic芯片等)等硬件装置。
112.此外,说明了本发明的实施方式,但该实施方式作为例子来提示,意图不在于限定发明的范围。该新的实施方式能够以其他各种方式实施,在不脱离发明的主旨的范围内能够进行各种省略、置换、变更。这些实施方式及其变形包含在发明的范围或主旨中,并包含在专利权利要求书所记载的发明及其等同的范围中。
113.附图标记说明:
114.100 交流管理装置
115.110 控制装置
116.111 用户管理部
117.112 交流控制部(第1控制部、第2控制部)
118.113 语音识别部
119.114 语音合成部
120.115 发言语音评价部
121.120 存储装置
122.121 用户信息
123.122 组信息
124.123 交流履历信息
125.124 语音识别词典
126.125 语音合成词典
127.126 语音品质评价信息
128.130 通信装置
129.500 用户终端(移动通信终端)
130.510 通信/通话部
131.520 交流应用控制部
132.530 麦克风(集音部)
133.540 扬声器(语音输出部)
134.550 显示/输入部
135.560 存储部
136.570 振动装置
137.580 gps装置
138.d 显示栏

技术特征:


1.一种交流系统,经由多个由各用户分别携带的移动通信终端,将用户的发言语音向其他用户的移动通信终端进行广播分发,其特征在于,具备:交流控制部,具有第1控制部和第2控制部,该第1控制部将从移动通信终端接收的发言语音数据向其他多个移动通信终端中的各个移动通信终端进行广播分发,该第2控制部将通过对接收的发言语音数据进行语音识别处理而得到的发言语音识别结果作为用户彼此的交流履历按照时间序列进行积蓄,并且进行文本分发控制以使所述交流履历在所述各移动通信终端中被同步显示;以及发言语音评价部,对接收的发言语音数据进行语音品质评价处理,并输出语音品质评价结果;所述交流控制部进行文本分发控制,以使基于发言语音的所述语音识别结果及对应的语音品质评价结果被显示在多个所述各用户终端中。2.如权利要求1所述的交流系统,其特征在于,所述交流控制部与所述语音品质评价结果的文本分发控制联动,向被进行了语音品质评价处理的发言用户的所述用户终端,发送与所述语音品质评价结果相应的反馈控制信息。3.如权利要求2所述的交流系统,其特征在于,所述反馈控制信息是振动。4.如权利要求2或者3所述的交流系统,其特征在于,所述语音品质评价结果按不同的各用户而与所述交流履历建立关联地按照时间序列进行积蓄,所述交流控制部判断这次的语音品质评价结果的品质是否比上次的语音品质评价结果提高、或者这次的语音品质评价结果的品质是否比上次的语音品质评价结果降低,在品质提高的情况与品质降低的情况下,选择不同的反馈控制信息,并向发言用户的所述用户终端发送。5.如权利要求2或者3所述的交流系统,其特征在于,所述语音品质评价结果按不同的各用户而与所述交流履历建立关联地按照时间序列进行积蓄,所述交流控制部在这次的语音品质评价结果是过去的语音品质评价结果连续规定次数为相同的评价结果的情况下,根据该连续次数选择不同的反馈控制信息,并向发言用户的所述用户终端发送。6.如权利要求2或者3所述的交流系统,其特征在于,所述语音品质评价结果按不同的各用户而与所述交流履历建立关联地按照时间序列进行积蓄,所述交流控制部从过去一定期间中的语音品质评价结果之中,对与这次的语音品质评价结果相同的评价结果进行计数,根据相同的评价结果的计数数量选择不同的反馈控制信息,并向发言用户的所述用户终端发送。7.如权利要求1至6中任1项所述的交流系统,其特征在于,所述语音品质评价结果按不同的各用户而与所述交流履历建立关联地按照时间序列进行积蓄,
所述发言语音评价部生成向所述各用户终端提供的交流组内的分用户语音品质评价统计信息。8.如权利要求1至7中任1项所述的交流系统,其特征在于,所述交流控制部从发言者的用户终端接收发言语音数据以及由所述用户终端取得的位置信息,所述发言语音评价部判断发言者的发言场所是否对应于预先设定的场所,在判断为对应的情况下,进行针对接收的发言语音数据不进行语音品质评价处理或者不输出语音品质评价结果的排除处理。9.如权利要求1至8中任1项所述的交流系统,其特征在于,所述交流控制部从发言者的用户终端接收发言语音数据以及由所述用户终端取得的位置信息,所述发言语音评价部判断发言者的发言场所是否对应于预先设定的场所,在判断为对应的情况下,进行校正处理,该校正处理为,校正针对接收的发言语音数据的语音品质评价结果。10.一种程序,由管理装置执行,该管理装置经由多个由各用户分别携带的移动通信终端,将用户的发言语音向其他用户的移动通信终端进行广播分发,该程序的特征在于,使所述管理装置实现如下功能:第1功能,将从移动通信终端接收的发言语音数据向其他多个移动通信终端中的各个移动通信终端进行广播分发;第2功能,将对接收的发言语音数据进行语音识别处理而得到的发言语音识别结果作为用户彼此的交流履历按照时间序列进行积蓄,并且进行文本分发控制以使所述交流履历在所述各移动通信终端中被同步显示;以及第3功能,对接收的发言语音数据进行语音品质评价处理,并输出语音品质评价结果,所述第2功能进行文本分发控制,以使基于发言语音的所述语音识别结果及对应的语音品质评价结果被显示在多个所述各用户终端中。

技术总结


【课题】对提高多个用户间的信息传达的品质进行支援。【解决手段】实施方式的交流系统具备:交流控制部,具有第1控制部和第2控制部,第1控制部将从一个移动通信终端接收的发言语音数据向其他多个移动通信终端中分别进行广播分发,该第2控制部将通过对接收的发言语音数据进行语音识别处理而得到的发言语音识别结果作为用户彼此的交流履历按照时间序列进行积蓄,并且进行文本分发控制以使交流履历在各移动通信终端中被同步显示;以及发言语音评价部,对接收的发言语音数据进行语音品质评价处理,并输出语音品质评价结果。交流控制部进行文本分发控制以使基于发言语音的语音识别结果及对应的语音品质评价结果被显示在多个用户终端中。户终端中。户终端中。


技术研发人员:

挂村笃 筒井秀树

受保护的技术使用者:

东芝数字解决方案株式会社

技术研发日:

2021.02.17

技术公布日:

2022/9/2

本文发布于:2024-09-24 22:28:14,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/4/65124.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:语音   评价   用户   品质
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议