残差卷积自编码网络图像去噪方法

第38卷第5期计算机仿真2021年5月
文章编号:1006 - 9348(2021)05 -0455 -07
残差卷积自编码网络图像去噪方法
罗仁泽U’3,王瑞杰2,张可2,范顺利2
(1.西南石油大学油气藏地质及开发工程国家重点实验室,四川成都610500;
2.西南石油大学电气信息学院,四川成都610500;
3.西南石油大学地球科学与技术学院,四川成都610500)
摘要:传统图像去噪模型一般为浅层线性结构,特征提取能力有限,而现有基于深度学习的图像去噪模型存在去噪效率低、
泛化能力弱等问题。针对上述缺点,以残差块、批归一化层和自编码器组成的残差卷积自编码块为基本网络结构,提出多功
能去噪残差卷积自编码神经网络(D R C A E N N m)和去噪残差卷积自编码神经网络(D R C A E N N)
两种基于深度学习的去噪网
络模型。实验结果表明,D R C A E N N m模型不仅具有盲去噪能力,还可以去除与训练数据类型不同的噪声,具有强泛化能力;
D R C A
E N N模型收敛快,去噪效率远超其它网络模型。
关键词:深度学习;图像去噪;卷积神经网络;自编码网络;残差网络
中图分类号:TP183;TN911.73 文献标识码:B
Image Denoising Method of Residual Convolution
Auto - Encoder Network
LUO Ren -z e12 3,WANG Rui -j ie2, ZHANG Ke2, FANG Shun -l i2
(1. State K e y Laboratory of Oil and G as Reservoir Geology and Development Engineering,
Southwest Petroleum University, C h e n g d u Sichuan 610500, C h i n a;
2. School of electrical information, Southwest Petroleum University, C h e n g d u Sichuan 610500, C h i n a;
3. School of Earth Science and Technology,Southwest Petroleum University, C h e n g d u Sichuan 610500, China)
A B S T R A C T:T h e traditional image denoising models are generally shallow linear structures with limited feature ex­
traction capabilities. However, existing image denoising models based on deep learning have the problems such as
low denoising efficiency and w e a k generalization ability. In view of the above shortcomings, combined with the advan­
tages of Convolutional Auto -Encoder Network and Residual N e t work,using the Residual Convolutional Auto -E n­
coder consisting of residual block, Batch Normalization layer and Auto - Encoder as the basic network structure,
multi -functional denoising residual convolution Auto -Encoding neural network (D R C A E N N m)and denoising re­
sidual convolution Auto -Encoding Neural network (D R C A E N N)are proposed. T h e experimental results show that
the D R C A E N N m model not only has the ability to blindly denoise, but also can filter out the noises different from the
training data type ;D R C A E N N model can converge faster and the denoising efficiency far exceeds other network m o d­
els.
K E Y W O R D S:D e e p learning;Image denoising;Convolutional neural network(C N N);Auto -encoder(A E);R e­
sidual network
基金项目:国家重点研发计划深地专项项目(2016YFC0601100);四川
省科技计划项目(2019C X R C0027)
收稿日期:2019 -07 -31修回日期:2019 -08-01
—455—
1引言
传统图像去噪模型可分为基于空间域、变换域、稀疏表 示以及自然统计四大类。其中具有代表性的方法有:基于空 间域的中值滤波法[n,此方法忽略了每个像素自身的特点,去噪后图像将会出现较为严重的模糊现象;基于变换域的 BLS- G S M U],此方法在去噪的同时会丢失一部分有用信息;基于稀疏表示法的NLSC;3],此方法去噪计算时间较长、去噪 效率低;基于自然统计的B M3D[4],此方法只能滤除某种特定的噪声。
为了克服传统去噪模型的局限性,基于深度学习的非线 性、深度的图像去噪模型被大量提出。其中基于自编码(Au­t o- encoder,A E)网络H 、卷积神经网络-8_1°](C o n v o l u t i o n a l N e u r a l Network,C N N)、生成对抗网络‘11M3] (G e n e r a t i v e Ad­v e r s a r i a l Networks,G A N)广泛应用于图像去噪领域。基于自 编码网络的d c a e n n[5],可有效去除胸部X线图像的噪声,但只能去除已知的噪声,不具有泛化能力;基于栈式稀疏去 噪自编码网络的SSDAs [6],通过多个SSDAs相组合,
将稀疏 编码与去噪自编码器预训练的深度神经网络相结合进行图 像去噪,但SSDAs较依赖有监督的训练,只能除去训练集中 出现的噪声;基于栈式去噪自编码网络的SDA m,由多层的 全连接网络构成,网络模型训练所需时间较长;基于残差卷 积神经网络的D N C N N[9],利用残差学习和批量归一化来加 速训练过程,D N C N N模型能够处理水平未知的高斯噪声,但 不能去除种类未知的噪声;基于空洞卷积的IRCNN[M],通过 使用空洞卷积增大感受野,进而使背景信息对重构受损像素 起作用;基于堆叠生成对抗网络的S G A M[12],该模型将估计 图像分布分解为多个相对较容易的任务来处理数据,有较好 的去噪效果,但网络不易训练,资源消耗大,去噪的同时也会 生成假象;基于条件生成对抗网络的C G A S[13],将训练过的 网络和锐度检测网络相结合来引导训练过程,C G A s减少了 生成对抗网络的训练难度,但去噪同时容易丢失特征信息。
本文提出的多功能去噪残差卷积自编码神经网络(M u l t i -F u n c t i o n a l D e n o i s i n g R e s i d u a l C o n v o l u t i o n Auto - Encoding N e u r a l Network,D R C A E N N m)和去噪残差卷积自编码神经网
(D e n o i s i n g R e s i d u a l C o n v o l u t i o n Auto- En coding N e u r a l Ne t-work,D R C A E N N),均以残差块、B N层和自编码器组成的残差卷积自编码(R e s i d u a l C o n v o l u t i o n a l Auto- Encoder,R C A E)块为基本网络结构,将含噪声的图像经过网络模型训练优化,输出为去噪后的图像。与d n c n n[9]、d c a e n n[5]和IRCNN[14]模型对比,D R C A E N N在去噪质量和网络收敛
速 度方面表现最好,仅用其它网络训练所需的四分之一时间,就能达到最佳去噪效果;用单一噪声训练完成的D R C A E N-N m,不仅可以去除水平未知的噪声,还可以去除与训练数据 类型不相同的噪声,泛化能力超越已知的去噪网络模型。—456—2基本原理
2.1残差学习
残差学习(R e s i d u a l L e a r n i n g)[|5]解决了常规网络随着 深度的加深容易出现梯度弥散,而导致深层网络去噪效果变 差的现象。
Xi .
I d e n t i t y
图  1 ID B lo c k结构
以两层残差块为例,见图1所示,不加恒等映射(I d e n t i t y Mapping)时,经两层神经网络后输出可用式(3)表7T C: A经线性变换后用\+1表示,则
^,+1= ^i+l* + b u l
(1) \+1经激活函数g之后输出为A+1
A+l= g*hi+l(2)经两层神经网络后乂+2可表示为式(3)
^i+2= 8*h U2
(3)其中入+2为A+1经过线性变换后的输出。
若加上I d e n t i t y结构,网络第二层输出用i c〇i+2表示,见式(4):
尤(⑷i+2 =g
* (/i i+2 + A)(4)将式(3)、(4)展开:
^i+2 = g*(W i+2*«i+l+ b U l)
(5)
^i+2 = g*(W U2* X i+l+ b i+2+ X i)
(6)
假设 A+2=0A+2=〇则:
^.+2= g* 0 =0(7)
x(id)i+2= g*x(=(8)由式(7)、(8)可知,不加恒等映射时网络输出为零,即此节点发生梯度消失现象,而残差结构构成等函数后,保证 了来自后一层的梯度值完好的传到前一层,消除了梯度消失 现象。
2.2批置归一化
批量归一•化(B a t c h N o r m a l i z a t i o n,B N)保证网络正向 传播和反向传播时的输出在同一分布区间,可以解决梯度爆 炸现象。同时,批量归一化还能加快网络收敛速度、可代替 Dr〇P〇u t[n]层、提高网络泛化能力的优点。
假设某层的输人为* = U1,…)共n维批样本集 合为B= U,,x2,…,批量归一化见式(9)-式(12)
M b= 4- Y,xi(9
)
X
_ 弘《)2
M b
,,(n )
〇^B
ci (r e ) +/3(n )
(10)
(
11)
(12)
式中,> 为输人*的第n 维叫为样本集合S 的期望;〇■,为 样本集合B 的方差;*(i ))为输人*的正则化结果;y (">为x u> 的批量正则化结果;y B )、)3U >为待学习的参数。
Block 组成,最后一层为一个全连接层。
D R C A
E N N 和D R C A E N N m 网络整体结构见图2
、图3。
其中,输入为1〇〇 * 1〇〇的含噪声图像,输出是与输入对应的 降噪后的图像,为了减少有效信息丢失,提高去噪的精确度,
D R C A
E N N m 和D R C A E N N 两个网络均不使用池化层。
3残差卷积自编码网络模型去噪方法
为了高效去除图像中的噪声,以提出的RCAE  Block 为
基本网络结构,搭建了 D R C A E N N 和D R C A E N N m 两个去噪
网络模型。
3.1 DRCAENN  和 DRCAENNm  去噪模型含噪图像可表示为
y  =f + n
(13)
其中7为含噪图像;/为无噪声图像;n 为噪声。
本文选取均值平方差损失函数来指导D R C A E N N 和
D R C A
E N N m 去噪模型的收敛方向,其公式为:
MSE (O )
N X (/,(ri ;
e ) -/)2# 04)
其中/v 表示有/v 对训练样本;0= |〇<,M 为网络参数#为权 重必为偏执为模型预测的第
i 个不含噪的图像,乂
为第i 个真实不含噪的图像,对均值平方误差越小代表/p  (y ,;0)与/越接近,网络去噪效果越好。
本文构建的D R C A E N N 和D R C A E N N m 去噪模型,其目 的为利用式(14)和自适应矩阵估计(Adam )算法[18],通过不 断迭代优化参数0得到最优去噪网络模型,输出不含噪 图像。
3.2 DRCAENN  和 DRCAENNm  结构设计
3.2. 1 DRCAENN  和 D R C A E N N m  模型结构
D R C A
E N N 为2 *8的神经网络,艮P 有2个8层的RCAE
Block 组成;D R C A E N N m 共
17层,第一层由一个用来降维的
卷积层组成,2、3、4层由一个3层的RCAE  Block 组成,为了 升维5、6、7层由一个C  Block 组成,接下来的6层由2个3 层的RCAE  Block 组成,然后为了降维14、15、16层由一个C
M
De  n oising
f  CBIodc
«RCAEBlock
SRCAEBlodc
100*100
L _____A *______J !______A #______J  100*100
图2 D R C A E N N 结构
3.2.2残差卷积自编码块
卷积自编码网络有助于提取图像主要信息,从而得到更 准确的潜在特征表达空间,在深度学习中为了让网络得到更 好的效果,常用自编码网络处理后的数据代替原数据。结合 残差网络和卷积自编码网络的优点,本文提出由残差块、BN 层和自编码结构组成的残差卷积自编码块(RCAE  Block )。
图4为多层RCAE  Block 结构。
l *l ,oonv ^____________________i !~| r
iv +bn ,643*3,conv +bn ,64
Relu  j :Relu
J 5*5,conv +bn ,64
j
3*3,conv +bn ,64
广
——
11 5*5,conv -fhn ^ I
i  ^
E e h i 」丨
I
| 3*3,c o :nv +bnt a ~~| ^
——^ 制u  — '
1
M axpo ^,Unp 〇ol  |I
3*3,transpose ^
图3 DRCAENNm 结构
—457
其中,a 表示输人、输出特征图个数;n 为卷积核大小为5 *5和3 *3的双通道卷积层个数;捷径部分由两层编码器 (Encoder )、最大池化、反池化和两层的解码器(Decoder )组 成。RCAE  Block 对比ID  Block 有以下改进:
1) 恒等映射改为卷积自编码结构,此时输出为
X n*2 = F (x ) + X c a ,
(15)
为输入z 经过卷积自编码器提取的潜在特征,F U
)为输
人*经过n  + 2个卷积层输出的结果;
2) 加人双通道卷积层,并配合网络参数,将原来两层卷 积层改为三层或三层以上;
3) 仅用Relu 函数,改为Relu 函数与B N 结合或单独使
用Swish 函数。
3.3
D R C A
E N N m
和D R C A E N N 激活函数选取
引人非线性的激活函数可以解决线性模型表达能力不 足的缺陷,在神经网络里面常用的激活函数有S i g m 〇id、Tanh 和Relu 等。其中,Relu 激活函数较为常用,但
Relu 有一个缺
点:后层的某个梯度非常大时,权重更新后就会变得更大,从 而引起该层的输人小于零,造成输出结果为零,因此该神经 元将不会被激活。
Swish 拥有不饱和、光滑、非单调性的特征,可以克服Re - lu 函数的缺点,同样模型参数下,仅将Relu 函数替换为
Swish 函数,可以提高模型的准确率。
Swish 函数为
f (x ) = x  * sigmoid (p x )
(16)
式中/3为;c 的缩放参数,本文值取1。
图 5 为 RCAE  B l o c k  与传统的丨D  B l o c k  和 CONV  B l o c k  迭代1万次去噪对比。
其中,RCAE  - R  Block 表示激活函数为Relu 的
RCAE
Block,RCAE  - S  B l o c k  表示激活函数为 S w i s h  的 RCAE Block 。由图可知,改进后的RCAE  Block 在每次迭代仅增加
0.01s 的情况下,去噪能力明显优于ID  Block 和C  Block ,而 且选用Swish 激活函数的去噪效果好于Relu 激活函数。4
实验结果分析与对比为了验证D R C A E N N m 和
D R C A
E N N 网络模型的有效性
和准确性,使用汤姆林森地球物理服务公司(T o m l in so n  Geo ­
p h y s i c a l  S e r v i c e s  I nc ,TGS ) 岩体识别挑战赛的地震数据集,并
100
200
300
400
500
600
700
Train  Time/s
图5
单个残差块去噪对比
将其预处理为100 * 100像素的单通道灰度图像后进行仿 真,其中,2_张图像作为训练集,2000张图像作为测试 集。网络模型均基于T e n s o r f l o w l O . 1版本编写,运行环境
CPU  为 I n t e l  C o r e  i 7 -8750H ,GPU  为 NVIDIA  G TX 1060。分
别在性能和运算时间两个方面与先进的D N C N N [9]、DCAE -
N N [5]和IRCNN [14]模型对比,说明本文方法的可行性。
4.1性能对比
从单一噪声去噪对比、盲去噪对比、不同类型噪声去噪
对比,三方面做性能对比。
1)单一噪声去噪对比
去除单一噪声表示,训练好的网络模型只去除与训练数 据水平相同的噪声。不同模型去噪平均P S N R 如表1所示,
最佳结果已加粗显示。
表1
不同模型去噪平均P S N R (d B )网络模型
〇■=
训练
:70测试a  =训练:50测试a  =
训练
=30测试D R C A E N N m 25.6225. 1527.4527.3529.8529.23D R C A E N N
25.7925.7827.5227.4230. 1930.51d n c n n
[9]25.5425.4327. 1827. 3330.0530.35d c a e n n [5]
24.8024.7026. 1225.6428.6327.99i r c n n
[14]
25.62
25. 12
27.31
27.21
29.85
29. 15
图6不同模型去噪结果
注:(a )原始图像;(b )噪声/14.57dB;(c) D R C A E N N m  去噪结果/27.99 dB;(d) D R C A E N N  去噪结果/27.75 dB;(e) D N C N N  去噪结 果/27. 66 d B ; (f) D C A E N N  去噪结果/26. 07 d B ; (g) I R C N N  去噪结果/27. 26 册。
—458
表1为不同网络模型对含高斯噪声(标准差(7分别为 70、50、30)的图像去噪效果对比,实验结果表明:〇既六£聊 的峰值信噪比最高,去噪效果最好;D R C A E N N m去除<1为 70、50的噪声效果要好于D N C N N,但当(T为30时DRCAEN-N m去噪效果稍逊于D N C N N;I R C N N去噪质量介于DRCAE-N N m和D N C N N之间;D C A E N N去噪效果最差。
通过主观评价法对比不同网络模型去噪效果,图6为C T =50的测试集去噪结果。
图6中第一幅图为原始图像,第二幅为含噪声图像,其 余四幅图依次为D R C A E N N m、D R C A E N N、D N C N N、D CA E-N N'I RC NN去结果,从标记框可看出:D R C A E N N m和D R-C A E N N在去除噪声的同时也可保留局部细节特征;D NC NN 可去除强信号地方的噪声,但在弱信号的地方容易丢失局部 特征;D C A E N N在去除去噪的同时,会去除大量原有信息; IRC1V N去噪保真度较高,但去噪同时也会产生一些不存在的 伪影。
由表I和图6结论可知,D R C A E N N单一噪声去噪效果 最好,D R C A E N N m次之。
2)盲去噪对比
盲去噪能力表示,此网络模型不仅可以去除与训练数据 水平相同的噪声,还可去除其它水平的噪声。表2为<7=70 的高斯噪声训练后的D R C A E N N m、D R C A E N N、D N C N N、D C A E N N、I RC NN模型盲去噪对比结果,最佳结果已加粗显示。
表2测试集盲去噪平均P S N R(d B)
网络模型a=90〇•= 80〇•= 60〇■=40
D R C A
E N N m24. 1524.8225. 7326.71
D R C A
E N N22. 3424.7825.6426.07
d n c n n[9]15.6617.8724. 5625. 21
d c a
e n n[5]23. 6224. 1024. 9725. 59
i r c n n[,4]20.2423. 5424.6818.61
表2用ct大于70的90、80和小于70的60、40测试<7= 70训练好的网络,由表2可知,本文提出的D R C A E N N m模型 去噪后效果最为明显,其中P S N R最高提升8.49dB;因此,D R C A E N N m模型去噪效果最好。
图7为用(7=70的单一高斯噪声训练后的不同模型去 除c x= 80的高斯噪声的结果。
(a)0>)(c)(d)(e)(<)(g)
卷积编码⑷原始图像;(h)噪声/ 丨丨.68dB;(c)DRCAENNm去噪结果/26.31 dB;(d)DRCAENN去噪结果/26.10 clB;(e)DNCNN去噪结果/24.80 dB;
(f)DCAENN去噪结果/25.93 dB;(g)IRCNN去噪结果/24.54 dB
图7不同模型盲去噪结果
由图7标记部分示出,D R C A E N N m去噪后图像细节保 持完整,其它模型均产生较严重的模糊现象;IRCNN、D NC NN 去噪同时可使原图纯净的背景产生大量伪影,盲去噪效果 较差。
由表2和图7结论可知,D R C A E N N m盲去噪效果最好,在产生较少伪影的同时,可使去噪后的图像边缘光滑,主要 细节保留完整。
3)不同类型噪声去噪对比
传统方法去除高斯噪声一般采用线性滤波,椒盐噪声一 般采用中值滤波。然而,用单一的高斯噪声训练好的D R-C A E N N m模型,不仅可去除高斯噪声,还可去除类型、水平未 知的噪声。
本文分别用P S N R平均为20. 12d B的加性噪声:L o c a l-v a r;P S N R平均为25. 78d B的乘性噪声:Sp e c k l e;P S N R平均 为 18.49dB的椒盐噪声:S a l t - pepper(S&P),测试(T= 50 的高斯噪声训练后的 D R C A E N N m、D R C A E N N、D N C N N、D CA E-N N、IRCNN去噪效果,表3为各模型去除与训练数据类型不 同的噪声测试对比结果,最佳结果已加粗显示:
表3不同类型噪声去噪P S N R(d B)
网络模型Localvar Speckle S&P
D R C A
E N N m27.0427.4528. 34
D R C A
E N N27.0424.0828.30
D N C N N [9]19.8216.7120. 19
D C A
E N N[5]25. 1826.3526. 39
I R C N N[14]20.3917.9721.48
由表3可知,用高斯噪声训练好的D R C A E N N m对比其 它模型,去除三种测试噪声后的图像有最高的P SN R,D R-C A E N N和D C A E N N次之,D N C N N和I R C N N不能去除其它种类的噪声。
图8为各模型去除S&P噪声的测试结果,从图中标注处 可知D R C A E N N m和D R C A E N N模型去除噪声的同时也能很 好地保留图像细节特征;D C A E N N模型可以去除S&P噪声,但去噪保真度较弱;D N C N N和I R C N N不能去除S&P噪声。
由表3和图8结论可知,D R C A E N N m模型去除类型、水 平未知噪声的同时,去噪效果和去噪精度最理想,其中PSNR
—459

本文发布于:2024-09-21 21:41:40,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/4/377729.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:网络   模型   噪声
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议