一种基于DTW-GMM的机器人多机械臂多任务协同策略

一种基于DTW-GMM 的机器人多机械臂多任务协同策略
刘成菊 1
林立民 1
刘 明 2
陈启军
1
摘    要  为了控制机器人完成复杂的多臂协作任务, 提出了一种基于动态时间规整−高斯混合模型(Dynamic time warp-ing-Gaussian mixture model, DTW-GMM)的机器人多机械臂多任务协同策略. 首先, 针对机器人示教轨迹时间长短往往存在较大差异的问题, 采用动态时间规整方法来统一时间的变化; 其次, 基于动态时间规整的多机械臂示教轨迹, 采用高斯混合模型对轨迹的特征进行提取, 并以某一机械臂的位置空间矢量作为查询向量, 基于高斯混合回归泛化输出其余机械臂的执行轨迹; 最后, 在Pepper 仿人机器人平台上验证了所提出的多机械臂协同策略, 基于DTW-GMM 算法控制机器人完成了双臂协作搬运任务和汉字轨迹的书写任务. 提出的基于DTW-GMM 算法的多任务协同策略简单有效, 可以利用反馈信息实时协调各机械臂的任务, 在线生成平滑的协同轨迹, 控制机器人完成复杂的协作操作.
关键词  机器人多臂协作, 示教学习, 动态时间规整, 高斯混合模型, 轨迹生成
引用格式  刘成菊, 林立民, 刘明, 陈启军. 一种基于DTW-GMM 的机器人多机械臂多任务协同策略. 自动化学报, 2022,48(9): 2187−2197
DOI    10.16383/j.aas.c190817
A Multi-task Collaborative Strategy for Multi-arm Robot Based on DTW-GMM
LIU Cheng-Ju 1    LIN Li-Min 1    LIU Ming 2    CHEN Qi-Jun 1
Abstract    To control robot to complete complex multi-arm cooperation tasks, a multi-task collaborative strategy based on dynamic time warping-Gaussian mixture model (DTW-GMM) is proposed in this paper. Firstly, in view of the problem that demonstration trajectories are shown to be largely different in the aspects of lasting time, the amic time warping algorithm is adopted to unify the variation of the time. Secondly, after the multi-arm demonstration trajectories are aligned by amic time warping algorithm, the Gaussian mixture model is used to extract the com-mon features. And using the position space vector of a manipulator as the query vector, the Gaussian mixture re-gression algorithm is adopted to generically output the remaining manipulators ' trajectory; Finally, t
he multi-task collaborative strategy proposed was verified on Pepper platform. Tasks for dual-arm to collaboratively move basket and write the Chinese character are completed based on the DTW-GMM algorithm. The multi-task collaborative strategy based on the DTW-GMM method proposed in this paper is effective. The feedback information can be in-troduced to coordinate the robot arms ' task in real time, and the generated coordinated trajectories are smooth,which can control the robot to complete complex cooperative operations.
Key words    Multi-arm collaboration, learning from demonstration, dynamic time warping, Gaussian mixture model,trajectory generation
Citation    Liu Cheng-Ju, Lin Li-Min, Liu Ming, Chen Qi-Jun. A multi-task collaborative strategy for multi-arm ro-bot based on DTW-GMM. Acta Automatica Sinica , 2022, 48(9): 2187−2197
相比单臂机器人, 多臂机器人可以通过协作完
成一些更加复杂的动作, 实现各种灵巧操作任务,如搬运、焊接和装配等. 多臂机器人各个机械臂的工作空间一般存在着相互重叠的区域, 即它们之间的协作工作区域, 在这个区域内各个机械臂可以完成协作任务[1−3]. 然而, 多臂机器人如何在这个工作区域协调好多个任务一直是研究热点和难点.
Lim 等[4]研究了双臂机器人的抓取, 通过对双臂的轨迹进行提前规划, 并由微分变换算出手臂的移动增量, 成功实现了对水平放置的圆柱体的抓取和搬移; Ortenzi 等[5]实现了保持末端相对位置不变的双机械臂轨迹规划策略, 先对主机械臂的轨迹进行规划, 然后通过建立的运动约束方程来生成从机
收稿日期 2019-12-02    录用日期 2020-02-23
Manuscript received December 2, 2019; accepted February 23,2020
国家自然科学基金 (61733013, 62173248, 61673300)和苏州市重点产业技术创新关键核心技术研发项目(SGC2021035)资助
Supported by National Natural Science Foundation of China (61733013, 62173248, 61673300) and Suzhou Key Industry Tech-nological Innovation-core Technology R&D Program (SGC-2021035)
本文责任编委 刘艳军
奶茶杯架Recommended by Associate Editor LIU Yan-Jun
1. 同济大学电子与信息工程学院 上海 201804 中国
2. 香港科技大学电子与计算机工程学系 香港 999077 中国
1. College of Electronics and Information Engineering, Tongji University, Shanghai 201804, China
2. Department of Electron-ics and Computer Engineering, Hong Kong University of Science and Technology, Hong Kong 999077, China
第 48 卷  第 9 期自  动  化  学  报Vol. 48, No. 92022 年 9 月
ACTA AUTOMATICA SINICA
September, 2022
械臂的轨迹; Ramirez-Alpizar等[6]利用Leap Mo-tion运动捕捉器采集人类手臂执行零件装配任务时的运动, 然后提取装配任务时轨迹关键点的手指所处的位置和姿态, 用于控制Baxter机器人生成装配任务的轨迹; Tuan等[7]提出了一种基于姿态估计的滑模控制策略, 设计了一种具有鲁棒性的自适应控制器, 用于双臂机器人的3D协作运动, 但是该算法作者只将其运用到单臂自由度为2的双臂机器人上. 这些多臂协作控制策略提前规划机器人的执行轨迹, 实时性有待提高, 往往也需要建立复杂的机器人动力学模型. 近年来, 研究学者希望通过示教学习的策略, 让机器人学习人类如何执行灵巧操作的任务. 动态运动基元 (Dynamic movement prim-itive, DMP)模型[8−12]和高斯混合模型 (Gaussian mixture model, GMM)[13−19]是典型的示教学习算法.
DMP模型由动作变化系统和标准时间系统构成[8]. 该模型通过对机器人的示教轨迹进行拟合, 提取示教轨迹的形状特征, 并通过设定期望的轨迹终点和时长生成具有泛化性的机器人轨迹. DMP的优点在于可以控制生成轨迹的时长和幅度, 但是这种示教学习模型只能应用于轨迹终点速度为0的场景. Kober等[9]对原始DMP模型进行了改进, 将其应用于终点速度不为0的场景, 但是如果轨迹稍有差异, 都需要重新进行模型的设计, 即基于DMP 的学习算法只能实现单条示教轨迹的学习. 如果示教轨迹存在噪声, 泛化得到的输出轨迹效果非常不理想. GMM示教学习模型利用高斯混和模型来对机器人轨迹进行建模, 用概率的方法来提取轨迹之间的相关关系, 从而对示教轨迹进行表征; 然后利用高斯混合回归可以实现轨迹的泛化输出. 基于GMM的轨迹学习模型能够很好地保持示教轨迹的空间形状特征, 但是一旦示教轨迹存在时长上的差异, GMM模型的轨迹学习效果不佳.
针对DMP和GMM轨迹学习算法各自存在的问题, 本文提出基于动态时间规整−高斯混合模型(Dynamic time warping-Gaussian mixture model, DTW-GMM)的多机械臂协同轨迹生成方法. 论文主要内容分为三部分: 1)针对机器人示教轨迹往往存在时间长短差异较大的问题, 采用DTW算法来规整机器人的示教轨迹. 文献[20]利用DTW方法来规整人类不同语速的发音, 消除语音的发音时间长短不一对语音识别的影响. 本文将DTW核心思想进行迁移, 用其来规整机器人的示教轨迹. 2)基于DTW所规整的示教轨迹, 利用GMM概率模型来学习示教轨迹的共同特征, 并设计多机械臂多任务协同的轨迹生成策略, 利用高斯混合回归(Gaus-sian mixture regression, GMR)泛化输出各机械臂的执行轨迹. 3)设计机器人的运动
控制引擎并利用Pepper机器人平台, 完成手臂协作搬运和汉字轨迹书写实验, 验证本文提出的多机械臂协同控制策略的可行性和有效性.
1    基于DTW-GMM的示教轨迹特征
脉冲信号提取
1.1    动态时间规整算法
X∈R d×n x Y∈R d×n y
动态时间规整(Dynamic time warping, DTW)算法可以用来规整机器人的示教轨迹. 该方法主要的核心思想在于, 将两个长度不一的时间信号和 通过对齐拉伸到相同长度, 且拉伸后使得两条轨迹之间的距离最短. DTW 算法可以由如下目标方程描述[21]:
W x=[a ij](1≤i≤n x,1≤j≤n,a ij∈{0,1}) W y=[a ij](1≤i≤n y,1≤j≤n,a ij∈{0,1})
X Y
式中,
和 表示二值时间规整矩阵, 通过将时间信号和中的相关向量进行拉伸, 最终将两个轨迹矩阵规整到相同长度.
时间规整矩阵必须同时满足以下三个约束条件: X Y
1)和 的初始和终止向量点必须对齐;
2)规整矩阵本质上表示的是时间序列, 因此规整矩阵中取值为1的点所依次连成的路径(即规整路径)必须是单调的;
X
Y
3)由于信号需要保持有序性, 因此矩阵和中对应向量的前后顺序必须保持不变.
l=1.2×max(n x,n y),
求解目标方程(1)中的时间规整矩阵可以使用动态规划(Dynamical programming, DP)算法或广义典型
时间规整(Generalized canonical time warping, GCTW)算法[21−22], 两种求解算法的时间复杂度的对比如表1所示, 其中l用于设置GCTW 算法规整后轨迹信号的长度, 原则上选取
m表示单调增函数基的个数, 一般m 的取值为5左右. GCTW比DP算法具有较低的时间复杂度, 后文采用GCTW算法进行多机械臂示教轨迹的规整策略.
表 1    算法的时间复杂度
Table 1    Time complexity of algorithms
轨迹规划算法时间复杂度
DP n x n y
GCTW2dlm+8m3
2188自      动      化      学      报48 卷
图1表示两个示教轨迹序列在DTW 算法规整下的结果. 图1(b)所示的规整路径将图1(a)原始序列规整成图1(c). 由此可见, DTW 算法可以很好地改善原有示教轨迹存在的时间差异较大的问题,从而统一时间的变化.
1幅度
距离
0.20.40.60.81.080
图 1  动态时间规整算法
Fig. 1    DTW algorithm
1.2    GMM 轨迹特征提取
经DTW 规整后的示教轨迹, 利用GMM 概率
模型[23−25]进行表征, 从而提取示教轨迹的共同特征.对于多机械臂示教数据, 本文将其表示为:
y
i,s ,y i,t 式中,  分别表示示教轨迹的空间信息和时
间信息, T 表示示教轨迹中示教点的个数.
y =(y 1,y 2,···,y T )对于多维示教变量 , 建模GMM 为:
p (y )πk N (y ;µk ,Σk )µk Σk 式中,  表示概率密度函数, K 表示高斯分布的个数,  表示第k 个高斯分布所占的权重,  表示以  为均值,  为协方差矩阵的高斯概率密度函数, D 代表示教轨迹的维度.
y =(y 1
,y 2,···,y T )γt,k y t 相比于高斯分布的参数估计, 混合高斯分布的参数估计更加复杂. 主要原因在于隐变量的存在.对于示教样本集 , 通过隐变量 的引入, 即表示  这个样本由第k 个模型生成,可以将数据展开成完全数据:
y t γt ,1=1,γt,2=0,···,γt,K =(y t ,1,0,···,0).
若  由第1类采样而来, 则有  0, 表示为 故完全数据的似然函数为:
πk ,µk ,Σk 可以利用期望值最大(Expectation maximum,EM)算法进行迭代计算, 求取GMM 模型的参数. 先定义Q 函数如下:
µi ,Σi ,πi 式中,  分别表示第i 次迭代时GMM 模型的各个高斯分布模型的均值, 协方差矩阵和权重集
9 期刘成菊等: 一种基于DTW-GMM 的机器人多机械臂多任务协同策略2189
E (γt,k |y t ,µi ,Σi ,πi )γ合;  表示对  的估计:
对Q 函数进行求导, 并令其导数为0, 可得:
µi +1k 、Σi +1k 、πi +1k 式中,  分别表示第i + 1次迭代,第k 个类的均值, 协方差矩阵和所占的权重.
为了使得EM 算法能够更快地收敛, 本文将经由DTW 规整后的多机械臂示教轨迹利用K 均值(K-means)聚类算法进行聚类, 划分数据的所属类别, 进行期望值最大算法的参数初始化. 同时利用赤池信息准则[26](Akaike information criterion,AIC), 通过最优化AIC 指标函数对K-means 的K 值进行选取:
C (K )ln L (y )式中,  表示GMM 概率模型参数数目;
D 表示
示教数据集的维度;  表示初始参数下示教样本的对数似然函数. 采用DTW-GMM 算法对机器
人的多机械臂示教轨迹进行特征提取的步骤如算法1所示.
算法1. 基于DTW-GMM 算法的多机械臂示教轨迹特征提取
{y i }T
i =1输入. 多机械臂示教数据 ;
µ、Σ、π输出. 轨迹特征, 即GMM 概率模型表征参数 ;1)利用式(1)对原始示教轨迹进行时间规整;
K 、µ0、Σ0、π02)利用式(11)和K-means 算法对GMM 设置初值
;
µ,Σ,πδi <i max 3) while 参数  的更新大于阈值  and 迭代次数,  ;
4) do;
γ5)利用式(7)计算  的估计值;
µi +1、Σi +1、
πi +16)最大化Q 函数, 利用式(8) ~ (10)计算 ;
µ、Σ、π7)更新参数 ;8) end while.
2    基于GMR 的轨迹泛化输出
x =[x I ,x O ]x I x O P (x I ,x O )(x I s 1,x I s 2,x I
s 3,t )(x O s 1,x O
s 2,
x O s 3,···,x O
s
3n )P (x I ,x O )P (x O |x I )E (x O |x I )Cov (x O |x I )第1.2节所述GMM 的多机械臂样本数据可以归纳为 , 其中  是查询向量,  是编码向量, 通过建立概率分布模型  进行GMM 的训练. 对于多机械臂多任务协同的轨迹学习
, 本文设计以某一个机械臂的三维空间向量和经由
DTW 规整后的时间变量t , 即以  作
为查询向量, 以其余机械臂的三维空间向量  作为编码向量, 通过多维示教数据进行模型的训练, 进行多机械臂轨迹的编码学习. 将数据点的概率分布  建模为GMM 后, 利用GMR 计算条件概率  的期望  和协方差  , 将期望值作为泛化的重构轨迹点, 在协方差矩阵的约束下生成平滑的执行轨迹,用于多机械臂协同运动的轨迹输出.
对于T 个D 维数据点组成的数据集, 建模GMM,该模型由K 个高斯分布组成:
N (x ;µk ,Σk )µk Σk 式中,  是以  为期望、以  为方差的高斯分布, 且有:
x I (x O |x I ,k )在给定  和高斯分布k 下,  的条件概率也满足高斯分布, 即:
2190自      动      化      学      报48 卷
µk ′
,Σk ′
式中,  满足:
(x O
|x I
)考虑整个GMM, 则有  的条件概率分布为:
h k 式中,  满足:
(x O |x I )µΣ基于高斯模型具有线性转换特征, 由此可得 的期望  和协方差  为:
图2是基于本文提出的算法生成的二维双臂协同轨迹泛化输出. 图2(a)为双臂协作的示教轨迹,左、右机械臂分别负责 “U”和 “Z”字形的任务执行轨迹. 图2(b)则为基于DTW-GMM 算法的轨迹表征图, 此处经由AIC 准则确定的K 取值为3. 图2(c)对应以左手臂空间矢量作为查询向量下, 右手臂的泛化输出图. 由图2可以看出, 本文算法可以对多机械臂的示教轨迹进行表征, 并在GMR 回归下生成具有一定泛化性的机械臂执行轨迹, 用于完成多臂协作任务.
对机器人进行示教时, 轨迹的噪声时时存在.图3探讨了本文采用的GMR 泛化输出策略对示教噪声的抗
干扰性. 图3(a)为单条示教轨迹时, 汉字轨迹 “打”存在框选处的噪声时, 轨迹的表征输出结果. 而图3(b)对应3条示教轨迹时, GMR 的输出情况. 由图3可以看出, 本文的轨迹泛化策略具有一定的抗干扰性, 即使存在噪声, 算法依旧可以充分提取示教轨迹的共同特征.
3    总体系统架构
为了将本文提出的多机械臂多任务协同策略运用到机器人控制中, 设计了如图4所示的控制系统架构[27]. 其中多机械臂协同轨迹生成器主要负责多机械臂示教轨迹的特征学习与协同轨迹输出. 其通
图 2    双臂协同轨迹泛化输出Fig. 2    Generalized dual-arm collaborative
trajectory output
x 1
012
3
x 1
配置管理系统012
3
x 1
012
出租车计价器传感器
3
2024
2024
2024
2024
x 1
1
毛发收集器2
3
(a) 单条示教轨迹
(a) Demonstration of single
trajectory
x 1
012
3
x 1
1
2壳体加工
3
(b) 多条示教轨迹(b) Demonstration of multiple trajectories
图 3    抗干扰性输出Fig. 3    Anti-disturbance output
9 期刘成菊等: 一种基于DTW-GMM 的机器人多机械臂多任务协同策略
2191

本文发布于:2024-09-22 20:33:56,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/1/268861.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:轨迹   示教   机械   规整   时间   算法
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议