首页 > 学术百科

训练人工智能模型的方法、装置、存储介质及机器人[发明专利]

(19)中华人民共和国国家知识产权局

(12)发明专利申请

(10)申请公布号 (43)申请公布日 (21)申请号 201880001053.1

(22)申请日 2018.07.26

(85)PCT国际申请进入国家阶段日

2018.08.17

(86)PCT国际申请的申请数据

PCT/CN2018/097251 2018.07.26

(71)申请人深圳前海达闼云端智能科技有限公

司

地址 518000 广东省深圳市前海深港合作

区前湾一路1号A栋201室（入驻深圳市

前海商务秘书有限公司）

(72)发明人廉士国　刘兆祥　

(74)专利代理机构北京英创嘉友知识产权代理

事务所(普通合伙) 11447

代理人魏嘉熹　南毅宁

(51)Int.Cl.G06K 9/62(2006.01)G06K 9/00(2006.01)G06F 17/30(2006.01) (54)发明名称

训练人工智能模型的方法、装置、存储介质

及机器人

(57)摘要

一种训练人工智能模型的方法、装置、存储

介质及机器人，所述方法包括：响应于用户的服

务请求信息，基于预设人工智能模型输出相应的

服务结果；获取所述用户对所述服务结果的反馈

信息；根据所述反馈信息对所述服务请求信息和

所述服务结果进行标注，生成训练样本对；当生

成的所述训练样本对的数量达到预设阈值时，利

用各所述训练样本对更新所述预设人工智能模

型。采用本公开的技术方案，可以实现对训练样

本对的自动标注，通过标注的训练样本对不断提

升人工智能模型的性能，相比于现有技术中通过

人工参与训练样本标注的方式，可以缩短人工智

能模型的训练周期、降低训练成本、提高训练效

率。权利要求书2页说明书6页附图4页CN 109074502 A 2018.12.21

C N 109074502

1.一种训练人工智能模型的方法，其特征在于，包括：

响应于用户的服务请求信息，基于预设人工智能模型输出相应的服务结果；

获取所述用户对所述服务结果的反馈信息；

根据所述反馈信息对所述服务请求信息和所述服务结果进行标注，生成训练样本对；

当生成的所述训练样本对的数量达到预设阈值时，利用各所述训练样本对更新所述预设人工智能模型。

2.根据权利要求1所述的方法，其特征在于，所述根据所述反馈信息对所述服务请求信息和所述服务结果进行标注，生成训练样本对，包括：

根据所述反馈信息确定所述用户的情感倾向；

当所述情感倾向为负向倾向时，对所述服务结果进行修正，并再次执行所述获取所述用户对所述服务结果的反馈信息至根据所述反馈信息确定所述用户的情感倾向的步骤，直至所述用户的情感倾向为正向倾向；

当所述情感倾向为正向倾向时，根据所述服务请求信息标注输入样本并根据所述服务结果标注输出样本，得到所述训练样本对，所述训练样本对包括所述输入样本和所述输出样本。

3.根据权利要求1所述的方法，其特征在于，所述利用生成的所述训练样本对更新所述预设人工智能模型，包括：

获取用于训练所述预设人工智能模型的原始训练样本对；

将生成的所述训练样本对和所述原始训练样本对合并后训练，得到新的人工智能模型；

使用所述新的人工智能模型替换所述预设人工智能模型。

4.根据权利要求1所述的方法，其特征在于，所述利用生成的所述训练样本对更新所述预设人工智能模型，包括：

利用生成的所述训练样本对，对所述预设人工智能模型进行迁移训练，生成新的人工智能模型；

使用所述新的人工智能模型替换所述预设人工智能模型。

5.根据权利要求1～4中任一项所述的方法，其特征在于，所述反馈信息包括以下信息中的一者或多者：语音、面部表情和肢体动作。

6.一种训练人工智能模型的装置，其特征在于，包括：

服务响应模块，用于响应于用户的服务请求信息，基于预设人工智能模型输出相应的服务结果；

反馈信息获取模块，用于获取所述用户对所述服务结果的反馈信息；

标注模块，用于根据所述反馈信息对所述服务请求信息和所述服务结果进行标注，生成训练样本对；

训练模块，用于当生成的所述训练样本对的数量达到预设阈值时，利用各所述训练样本对更新所述预设人工智能模型。

7.根据权利要求6所述的装置，其特征在于，所述标注模块包括：

情感倾向确定子模块，用于根据所述反馈信息确定所述用户的情感倾向；

修正子模块，用于当所述情感倾向为负向倾向时，对所述服务结果进行修正，并再次执

行所述获取用户对所述服务结果的反馈信息至根据所述反馈信息确定所述用户的情感倾向的步骤，直至所述用户的情感倾向为正向倾向；

标注子模块，用于当所述情感倾向为正向倾向时，根据所述服务请求信息标注输入样本并根据所述服务结果标注输出样本，得到所述训练样本对，所述训练样本对包括所述输入样本和所述输出样本。

8.根据权利要求6所述的装置，其特征在于，所述训练模块包括：

获取子模块，用于获取用于训练所述预设人工智能模型的原始训练样本对；

训练子模块，用于将生成的所述训练样本对与所述原始训练样本对合并后进行训练，得到新的人工智能模型；

第一替换子模块，用于使用所述新的人工智能模型替换所述预设人工智能模型。

9.根据权利要求6所述的装置，其特征在于，所述训练模块包括：

迁移学习子模块，用于利用生成的所述训练样本对，对所述预设人工智能模型进行迁移学习，生成新的人工智能模型；

第二替换子模块，用于使用所述新的人工智能模型替换所述预设人工智能模型。

10.根据权利要求6～9中任一项所述的装置，其特征在于，所述反馈信息包括以下信息中的一者或多者：语音、面部表情和肢体动作。

11.一种计算机可读存储介质，其上存储有计算机程序指令，其特征在于，该程序指令被处理器执行时实现权利要求1～5中任一项所述方法的步骤。

12.一种训练人工智能模型的装置，其特征在于，包括：

权利要求11中所述的计算机可读存储介质；以及

一个或者多个处理器，用于执行所述计算机可读存储介质中的程序。

13.一种机器人，其特征在于，包括权利要求6～10中任一项所述的训练人工智能模型的装置。

训练人工智能模型的方法、装置、存储介质及机器人

技术领域

[0001]本公开涉及人工智能技术领域，尤其涉及一种训练人工智能模型的方法、装置、存储介质及机器人。

背景技术

[0002]随着科技的高速发展，人工智能(Artificial Intelligence，AI)应运而生，其在服务机器人、智能终端、专家系统等各领域得到了广泛应用。为了更好地符合用户的需求，通常需要对人工智能模型进行训练，以不断地提升其性能。

[0003]现有技术中，需要通过人工采集大量数据并对数据做标注，然后将标注好的数据作为训练样本来训练人工智能模型。然而，采用该方式所需的训练周期较长且成本较高。

发明内容

[0004]为了克服现有技术中存在的问题，本公开提供一种训练人工智能模型的方法、装置、存储介质及机器人。

[0005]为了实现上述目的，本公开第一方面提供一种训练人工智能模型的方法，包括：[0006]响应于用户的服务请求信息，基于预设人工智能模型输出相应的服务结果；[0007]获取所述用户对所述服务结果的反馈信息；

[0008]根据所述反馈信息对所述服务请求信息和所述服务结果进行标注，生成训练样本对；

[0009]当生成的所述训练样本对的数量达到预设阈值时，利用各所述训练样本对训练所述预设人工智能模型。

[0010]本公开第二方面提供一种训练人工智能模型的装置，包括：

[0011]服务响应模块，用于响应于用户的服务请求信息，基于预设人工智能模型输出相应的服务结果；

[0012]反馈信息获取模块，用于获取所述用户对所述服务结果的反馈信息；

[0013]标注模块，用于根据所述反馈信息对所述服务请求信息和所述服务结果进行标注，生成训练样本对；

[0014]训练模块，用于当生成的所述训练样本对的数量达到预设阈值时，利用各所述训练样本对训练所述预设人工智能模型。

[0015]本公开第三方面提供一种计算机可读存储介质，其上存储有计算机程序指令，该程序指令被处理器执行时实现本公开第一方面所述方法的步骤。

[0016]本公开第四方面提供一种机器人运动控制装置，包括：本公开第三方面所述的计算机可读存储介质；以及一个或者多个处理器，用于执行所述计算机可读存储介质中的程序。

[0017]本公开第五方面提供一种机器人，包括本公开第二方面所述的训练人工智能模型的装置。

[0018]采用上述技术方案，至少可以达到如下技术效果：

[0019]基于预设人工智能模型输出与服务请求信息对应的服务结果，获取用户对服务结果的反馈信息对服务请求信息和服务结果进行标注，生成训练样本，并在训练样本对的数量达到预设阈值时，利用各训练样本对训练预设人工智能模型，可以实现对训练样本对的自动标注，通过标注的训练样本对不断提升人工智能模型的性能，相比于现有技术中通过人工参与训练样本标注的方式，可以缩短人工智能模型的训练周期、降低训练成本、提高训练效率。

[0020]本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。

附图说明

[0021]为了更清楚地说明本公开实施例或现有技术中的技术方案，下面将对实施例描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

[0022]图1是根据本公开一示例性实施例示出的一种训练人工智能模型的方法的流程图；

[0023]图2是根据本公开另一示例性实施例示出的一种训练人工智能模型的方法的流程图；

[0024]图3是根据本公开一示例性实施例示出的一种训练人工智能模型的装置的框图；[0025]图4是根据本公开另一示例性实施例示出的一种训练人工智能模型的装置的框图；

[0026]图5是根据本公开一示例性实施例示出的一种训练人工智能模型的装置的框图。

具体实施方式

[0027]为使本公开实施例的目的、技术方案和优点更加清楚，下面将结合本公开实施例中的附图，对本公开实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本公开一部分实施例，而不是全部的实施例。基于本公开中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本公开保护的范围。[0028]需要说明的是，本公开的说明书和权利要求书以及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必理解为描述特定的顺序或先后次序。

[0029]图1是根据本公开一示例性实施例示出的一种训练人工智能模型的方法的流程图，如图1所示，该方法包括以下步骤：

[0030]在步骤S101中，响应于用户的服务请求信息，基于预设人工智能模型输出相应的服务结果。

[0031]在一种实施方式中，服务请求信息可以是文本、语音、图片等形式中的至少一种。响应于用户的服务请求信息，可以根据预设人工智能模型输出与服务请求信息对应的服务结果。

[0032]值得说明的是，本公开实施例中的人工智能模型可以是基于视觉的物体识别模型、人脸性别识别模型、个性化推荐模型、文本对话模型等等。

本文发布于:2024-09-20 16:26:32，感谢您对本站的认可！

本文链接：https://www.17tex.com/xueshu/785572.html

上一篇：导电滑环故障测试装置和测试方法[发明专利]

下一篇：深圳市网逍壹号商贸中心(有限合伙)介绍企业发展分析报告