基于DPC优化动态路由的胶囊网络算法

收稿日期：2021-02-22

基金项目：国家自然科学基金（11861003）；宁夏自然科学基金（NZ17015）作者简介：林凯迪（1995-），女，辽宁大连人，硕士研究生。通讯作者：杜洪波（1977-），男，吉林榆树人，副教授，硕士生导师，主要从事数据挖掘技术与应用方面的研究。

基于DPC 优化动态路由的胶囊网络算法

林凯迪1，杜洪波1，朱立军2

（1.沈阳工业大学理学院，辽宁沈阳110870；2.北方民族大学信息与计算科学学院，

宁夏银川214215）

摘

要：作为一种深度神经网络结构，与卷积神经网络（CNN ）相比，胶囊网络可以建立不同特快门式3d

征之间的空间关系，具有更好地拟合特征的能力。但是，动态路由中原有的聚类算法对初始聚类中心的选择较为敏感。针对这一问题，使用密度峰值聚类（DPC ）算法对原有的聚类算法进行优化，提出DPC -

CapsNet 模型，以提高动态路由算法的整体性能。基于TensorFlow 框架的DPC -CapsNet 模型的实验结果表明，结合了DPC 算法的胶囊网络结构在MNIST 和Fashion -MNIST 数据集上均具有较快的收敛速度，以及较高的分类准确率，证明了算法的有效性，同时也说明了胶囊网络在图像分类领域的应用潜力。

关键词：深度学习；图像分类；胶囊网络；动态路由；DPC 算法中图分类号：TP391

文献标识码：A

文章编号：1673-1603（2021）02-0061-07

DOI ：10.13888/jki.jsie （ns ）.2021.02.012

第17卷第2期2021年4月Vol.17No.2Apr.2021

沈阳工程学院学报（自然科学版）

Journal of Shenyang Institute of Engineering （Natural Science ）

随着深度学习的不断发展，卷积神经网络得到深入研究，在实时应用、人脸识别、复杂网络、迁移学

习及图像分割等领域都有着不凡的表现［1-5］。但是卷积神经网络存在两个重要缺陷，一是无法考虑部分与整体之间的空间关系，二是池化过程中丢失了大量有价值的信息。SABOUR S 等人［6］于2017年提出了胶囊网络及胶囊层间的动态路由算法。胶囊由一组神经元组成，将标量提升为向量，不仅可以表示特征（或实体）间的空间关系，还可以表示特征（或实体）存在的概率。动态路由算法中的不同胶囊层通过路由迭代的方式进行连接，使胶囊以更少的模型参数获得更大的泛化能力。随后，HIN ‐TON G E 等人［7］于2018年提出了使用EM 算法的矩

阵胶囊网络，其胶囊包括姿态矩阵和激活概率，感受野的增加使得该网络可以拟合复杂图像。

胶囊网络具备更好地拟合特征的能力，但是计算开销过大成为该网络模型无法广泛应用的阻碍，因此减少计算开销是胶囊网络的一个重要研究方向。文献［8］提出了一种孪生胶囊网络（SCNet ），并通过引入丢弃（dropout ）操作来减少胶囊的数量。文献［9］提出了SPARSECAPS 网络，建立了一种完全无监督的胶囊网络，并且去掉网络的全连接层。文献［10］则是提出了运用胶囊池化（capsule -pool ‐ing ）的方法来降低胶囊的数量。

提升胶囊网络的性能主要从两方面进行，即优化胶囊和优化路由［11］。上述胶囊网络的研究均通

第17卷

沈阳工程学院学报（自然科学版）过优化胶囊来提升网络的性能，而优化路由的方法较少。由于胶囊网络中的动态路由迭代过程非常耗时，SAHU S K 等人［12］提出了内联胶囊路由协议（inter capsule routing protocol ，ICRP ）来减少路由迭

代的计算时间。王维美等人［13］

压缩胶囊

提出一种改进的胶囊

网络知识图谱补全方法，通过路由操作产生维度较小的胶囊，生成连续向量并将其与权重向量做点积运算，构建评分函数用于判断三元组的正确性。张天

柱等人［14］将模糊聚类算法与动态路由相结合，并添

加信息熵度量不确定性的激活值，提出了FM -Cap ‐sule 及效果更好的F -Capsule ，提高了网络的性能。

胶囊网络中的动态路由规则是基于聚类算法思想来实现的，即通过聚类的方式对特征进行整合与递进。文献［6］中动态路由的聚类算法受初始聚类中心的影响较大。密度峰值聚类（DPC ）算法是一种基于密度的方法［15］，可以处理任意形状的类簇，并且对噪声不敏感，同时该算法具有参数唯一、实现简单、鲁棒性强的特点。本文将普适性更好的DPC 算法与动态路由规则结合，使用DPC 算

法获得初始聚类中心，提出DPC -CapsNet 模型。在

MNIST 及Fashion -MNIST 上的实验表明，该算法识别准确率较高，在图像分类中有一定的应用潜力和研究价值。

1胶囊网络

文献［6］提出的胶囊模型，又称为向量胶囊网

络。由于选取向量作为胶囊，网络的输出也是向量，因此可以用向量的长度表示目标的存在，向量的方向表示目标的特征。

胶囊模型的隐藏层包含卷积层、初始胶囊层和全连接层3种隐藏层，如图1所示。初始胶囊层将卷积层提取的特征图转化为向量胶囊，接着通过动态路由规则将初始胶囊层与全连接层连接输出最终的结果。

首先，卷积层有256个步长为1的9×9×1的卷积核，使用ReLU 激活函数从图像中提取特征图；其次，主胶囊层使用8个步长为2的9×9×256的卷积核将特征图转化为32个向量胶囊；最后，使用动态路由规则计算出全连接层的输出，得到一个大小为16×10

的矩阵。

图1向量胶囊网络结构

胶囊网络是一种具有全新结构的网络，与神经网络相比，神经元的输入和输出都由标量提升为向量，胶囊层间通过动态路由的方式进行特征的整合与传递。用向量的长度表示某个实体存在的概率，向量的模长越接近1，实体存在的可能性越大。此外，与标量相比，向量还能表达信息的种类（姿态、颜、纹理等），因此胶囊网络极大地丰富了特征的表达能力。

动态路由规则的实质就是通过聚类方法，将底层特征组合为上层的特征。文献［6］中的动态路由规则采用的是k -means 聚类算法。假设胶囊的输入特征为u i (i =1,2,…,n )，通过k -means 聚类获得k 个聚类中心v j (j =1,2,…,k )，即下一胶囊层的特征向量。低层胶囊通过聚类的方式将特征传递给高

层胶囊，如图2所示。

钢框胶合板模板

·62

第2期林凯迪，等：基于DPC

优化动态路由的胶囊网络算法

图2

低层胶囊通过聚类的方式将特征传递给高层胶囊

k -means 聚类算法因其快速简洁的优点而被广泛使用，但是也有局限性。该算法需要随机确定k 个初始聚类中心，并根据k 个中心来确定一个初始划分，然后迭代地进行调整，直到聚类中心不再改变［15］。因此，初始聚类中心的选择对聚类结果的优劣有关键性的作用。

密度峰值聚类（DPC ）算法是RODRIGUEZ A 等人［16］于2014年提出的一种新型聚类算法，能够快速地发现任意形状数据的密度峰值点，可以作为聚类中心。该算法具有参数易确定、鲁棒性强的特点。本文采用DPC 算法来计算初始聚类中心，解决k-means 算法对初始聚类中心敏感可能导致聚类结果不稳定的问题。

密度峰值聚类的动态路由算法

本振泄露2.1

密度峰值聚类算法

密度峰值聚类算法是粒度计算模型。该算法

基于两个假设：

1）聚类中心被局部密度低的相邻数据点围绕；2）聚类中心与更密集的数据点i 之间的距离较远。

对于数据点i ，需要计算两个值：数据点的局部密度ρi 及样本距离δi 。

局部密度ρi 包括以下两种计算方式：

ρi =ì

íî

ïï

ïCut -off:∑j =1n

χ(d ij -d c )

Gaussian:∑j =1n exp(-(d ij d c )2)（1）

式中，d c 为截断距离，由人工确定，通常选取将所有

数据对象两两之间的距离按升序排序后前2%位置的数值距离作为截断距离。

数据点i 的样本距离：

ìí

ïδi =min j :ρ>ρ(d ij )i ≥1δj =max j (d ij )ρi 最大

（2）

2.2

基于密度峰值聚类的动态路由算法

胶囊网络中的动态路由规则是基于k -means

聚类算法的思想实现的，该算法只能处理球形数据，并对初始聚类中心的选择较为敏感。针对这一问题，本文将DPC 算法与动态路由规则结合，提出DPC -CapsNet 模型，从优化路由的角度提高网络的性能。

胶囊网络中，用输出向量的长度表示实体存在的概率。因此，使用非线性的压缩函数将向量压缩至［0,1］。

v j

s j

1+ s j

s j

（3）

式中，

v j 是胶囊j 的向量输出；s j 是总输入。除第一个胶囊层，胶囊的总输入s j 由下一层的所有胶囊的预测向量u j|i 计算求得。

u j|i =W ij u i

（4）s j =∑i

c ij u j|i

（5）

式中，pva抛光轮

W ij 是权重矩阵；c ij 是由动态路由迭代过程决定的耦合系数，表示胶囊i 和胶囊j 的连接概率，且有∑c ij =1。

c ij =

exp(b ij )

∑j

exp(b ij )

（6）

式中，b ij 是胶囊i 和胶囊j 的先验概率，通过路由迭

代的方式进行更新。

在文献［6］中，

b ij 初始化为0。考虑到k-means 算法易受初始聚类中心的影响，本文使用密度峰值聚类算法先获得初始聚类中心，并将胶囊与聚类中心的距离作为权重。

·63

第17卷

沈阳工程学院学报（自然科学版）

首先计算局部密度。式（1）中，前者Cut-off ker‐

nel针对的是离散的数据，后者Gaussian kernel针对

的是连续的数据。本文选取第2种计算公式，即

ρi=∑j=1n exp(-(d ij d c)2)（7）

连续的局部距离ρi便于计算和编程实现。将聚类中所有样本点之间的相互距离进行升序排序，在2%的位置的距离数值记为d c，即2%×N，N= []

|D|×(|D|-1)/2。

样本距离δi是该样本点到比其密度大的点的距离的最小值。设{q i}m i=1表示{ρi}m i=1的一个降序排列的下标序，使其满足ρq≥ρq≥⋯≥ρq，有如下定义：

δqi=ì

min j<i{d q q}i≥2

max j≥2{δq}i=1（8）

对于每一个样本数据均可求出对应的ρi和δq，令γi=ρiδq，对γi(i=1,2,⋯,m)再按从大到小的顺

序排列。由于本文所使用的两种图像数据集均为10个分类，所以取前10个对象作为聚类中心

j(j=1,2,⋯,10)。计算胶囊i与聚类中心a j的距离，并将该距离作为初始连接概率，更新b ij。然后进入路由迭代阶段。文献［6］中建议在路由迭代过程中迭代3次，本文采用同样的次数，即取r=3，迭代3次后得到胶囊j的输出向量v j。

综上，使用密度峰值聚类算法的动态路由规则的流程如下：

输入：迭代次数r，胶囊层数l；

输出：胶囊j的输出向量v j。

step1：低层胶囊权重映射；

step2：确定截断距离d c；

step3：计算局部密度ρi和样本距离δq；step4：计算γi=ρiδq，并对γi降序排列，取前10个值作为聚类中心a j；

step5：计算每个对象与各聚类中心a j的距离，更新b ij；

step6：迭代r次：

①根据c ij=softmax(b ij)，计算胶囊层间

的连接概率；

②计算下一层胶囊的总输入s j；

③将s j压缩到［0,1］；

④更新b ij；

step7：返回v j。

3实验及结果分析

3.1实验环境

实验仿真环境为python3.6、TensorFlow1.14、keras2.2.5。硬件配置为戴尔（DELL）T640深度学习GPU运算塔式服务器主机，内存为64G，显卡为1RTX2080。

3.2数据集

实验采用测试图像分类任务算法性能的2个图像数据集（MNIST和Fashion-MNIST数据集）对算法进行测试和评价。

MNIST来自NIST（National Institute of Stan‐dards and Technology）的手写数字数据集，常用于各种图像处理的训练及测试。训练集由250个不同人手写的数字构成，分别为125名高中学生和125名人口普查局的工作人员。测试集也由相同比例的数据构成，且所有图片均为28×28的灰度图像。训练集图像有60000张，测试集图像有10000张。

由XIAO H等人［17］创建的Fashion-MNIST数据集来自10个类别，每个类别有7000幅图像，包括T恤、裤子、套头衫、连衣裙、外套、凉鞋、衬衫、运动鞋、包和靴子。与MNIST相同，该数据集同样有70000张大小为28×28的灰度图像，训练集和测试集的比例为6:1。

3.3实验分析

DPC-CapsNet模型由编码器和解码器构成。编码器由卷积层、PrimaryCaps及DigitCaps构成，解码器由后三个全连接层构成。各层参数如表1所示。

··64

第2期林凯迪，等：基于DPC 优化动态路由的胶囊网络算法

表1

DPC-CapsNet 模型参数

卷积层PrimaryCaps DigitCaps 全连接层一全连接层二全连接层三

输入28×2820×20×2566×6×8×32

16×10

5121024

输出20×20×2566×6×8×32

16×32512

1024784

卷积核大小9×9×19×9

----

激活函数ReLU

-----

本文从训练损失值及图像分类的准确率两方面对算法进行测试和评价。模型的损失函数为

loss =y ∗max (0,m +-y )2+λ(1-y )∗

max (0,y -m -)

（9）

式中，

y 为样本的实际值；y 为样本的预测值；m +=0.9，m -=0.1，λ=0.5。

在训练过程中，设置路由次数为3，batch_size

为128，迭代周期epoch 为50。DPC-CapsNet 模型在

MNIST 上的实验结果如图3所示。其中，图3a 为损失情况，图3b 为训练集上的准确率，图3c 为测试

集上的准确率。从图中可以看出，训练经过2000步时，损失函数值和训练精度基本趋于平稳，收敛速度较快，测试精度平均值为99.51%。仅以三层（一个卷积层和两个胶囊层）的网络结构达到了较高的准确率，证明了该网络在特征拟合上的高效性，以

及较强的泛化能力。牧草收割机

a 损失值

b 训练集准确率

c 测试集准确率

图3

MNIST 上的实验结果

为了进一步证明DPC-CapsNet 的有效性，将模型在更加复杂的图像数据集Fashion-MNIST 上进行实验，结果如图4所示。由图4可以看出，与MNIST 上的实验相比，训练时间更长，收敛速度随着数据集的复杂程度升高而降低，训练达到5000

步时，损失函数值和训练精度基本达到平稳状态。测试集的平均准确率虽然低于上一个实验，但是也可以达到91.41%，这说明本文提出的模型在图像

分类中具有一定的优势。

a 损失值

b 训练集准确率

c 测试集准确率

图4

Fashion-MNIST 上的实验结果

·65

本文发布于:2024-09-22 12:48:16，感谢您对本站的认可！

本文链接：https://www.17tex.com/tex/2/338756.html

上一篇：PW-220K转向架空气弹簧通风口防护胶套结构优化

下一篇：碳粉的作用——精选推荐

标签：胶囊聚类算法路由网络

留言与评论（共有 0 条评论）