基于小波深度卷积生成对抗网络的人脸图像生成

2020年第11期信息通信2020
(总第215期)INFORMATION&COMMUNICATIONS(Sum.No215)基于小波深度卷积生成对抗网络的人脸图像生成
杨思渊,蒋锐鹏,海仁古丽•阿不力提甫,姑丽加玛丽•麦麦提艾力
(新疆师范大学数学科学学院,新疆乌鲁木齐830017)
摘要:文章在深度卷积生成对抗神经网络的人脸图像生成模型基础上,为了进一步提高人脸图像生成效率,对模型进行改进提出了改进的生成对抗网络模型,为了得到更多局部特征,在生成模型中用非线性小波基取代第一卷积层的激活函数。通过大量实验对原始和改进的生成对抗网络模型结构和参数进行反复调整,最后得到了原图像逼真的人脸生成图像,并用主观和客观评价实验来验证本文研究思路的可行性。
关键词:生成对抗网络;卷积神经网络;小波函数;人脸图生成
中图分类号:TP391.41文献标识码:B文章编号:1673-1131(2020)11-0069-04
Face image generation based on wavelet deep convolution generation confrontation network Yang Siyuan,Jiang Ruipeng,Hairenguli•Abulitifii,Gulijiamali・Maimaitiaili
(School of Mathematical Sciences,Xinjiang Normal University,Urumqi,XinJiang830017) Abstract:I n this paper,based on the fece image generation model of d eep convolutional generation antagonistic neural networic,in or­der to further improve the efficiency of f ace image generation,an improved generation antagonistic network model is proposed to im­prove the model.In order to obtain more local features,the activation function of t he first convolutional layer is replaced by nonlinear wavelet basis in the generation model.Through a large number of e xperiments,the structure and parameters of t he original and impro­ved generation antagonistic network model were adjusted repeatedly,and finally a realistic face generation image of t he original image was obtained.Subjective and objective evaluation experiments were used to verify the feasibility of this research idea.
Key words:Generative Adversarial Networks;Convolutional Neural Network;Wavelet function;Face image generation
0引言
生成对抗网络(Generative adversarial networks,GAN)是Goodfellow111^在2014年提出的一种生成模型,也是一种无监督学习模型。目前,GAN取得了的广泛的研究与应用,在图像与视觉领域已经用于人脸检测、分割图像恢复、低分辨率图像生成髙分辨率图像等叫另外,GAN还被应用于语音处理叭隐私保护⑷和病毒检测切等问题。
DCGAN(深度卷积生成对抗网络)是Dundar等凶人在2015年在GAN模型的基础上提出的全新的架构,该架构在训练过程中状态稳定,并且能够有效实现髙质量的图片生成及相关的生成模型应用。由于其具有非常强的实用性,在它之后的大量GAN模型都是基于DCGAN进行的改良版本[7].DCGAN 将GAN中的生成模型和判别模型替换为两个卷积神经网络(Convolutional neural networks,CNN)。在卷积神经网络中,通常在卷积层之后加入激活函数,之后传递到下一层神经网络,在解决非线性问题时,激活函数起到了关键作用,它使得神经网络能更好的解决较为复杂的问题。
小波变换是一种信号的时间-尺度(时间-频率)分析方法,它具有多分辨分析的特点,而且在时频两域都具有表征信号局部特征的能力。在处理分析信号时,小波变换具有对信号的自适应性,也是一种优于傅里叶变换和窗口傅里叶变换的信号处理方法。
本文在GAN和DCGAN网络框架结构基础上,为了进一步提高人脸图像生成效率,对DCGAN模型进行了改进,在生成模型中为了得到原始图像的更多局部特征,用非线性小波基取代了DCGAN生成模型第一卷积层激活函数,最后通过大量原始人脸图像的训练来得到新的人脸图像并用主观和客观评价实验来验证本文研究思路的可行性。
1深度卷积生成对抗网络模型的图像生成
1.1生成对抗网络结构
生成对抗网络由两个模型构成,生成模型(生成器,G)和判别模型(判别器,D)o G通过随机噪声z生成图像,记为G(z)o D负责对输入的样本进行判别,判断样本是真实的数据还是生成的数据G(z)。而训练过程中,生成模型G的任务是尽量生成真实的图片以达到欺骗判别模型D的目的,而判别模型D则需要尽量将生成模型G生成的图片与真实图片区分开,二者构成了一个动态的博弈,直至达到均衡。GAN的流程如图1所示:
tzta
图1基于GAN的图像生成流程图
生成对抗网络实现的具体步骤如下叫
第1步:G接收一个随机的噪声z并生成数据,D判断生
收稿日期:2020-09-09
基金项目:国家自然科学基金应急项目(61751316)o
作者简介:杨思渊(1994-),男,硕士研究生,主要研究方向:人工智能及应用;蒋锐鹏(1995-),男,硕士,主要研究方向:深度学习与模式识别;海仁古丽•阿不力提甫(1995-),女,硕士研究生,主要研究方向:人工智能及应用。
通讯作者:姑丽加玛丽•麦麦提艾力(1984-),女,博士,副教授,主要研究方向:语音与语言处理。
69
成的数据是不是“真实的”。
第2步:计算生成模型G 的损失函数:
log(l-Z)(G (z)))
(1)
式⑴中,G(z)表示生成模型的输出,D(G(z))表示判别
模型D 判断生成模型G 生成的数据是否为真实的概率。
第3步:计算判别模型D 的损失函数:
log(l-zXG (z)))+logD (x)
(2)
中国妇幼保健研究式(2)中,x 表示输入参数,即真实样本数据,D(x)表示判 别模型的输出,即输入x 为真实数据的概率。
第4步:计算优化函数:
min  max  V (D,G )=g  d
(3)
&x~/U 』ogD (x)]+ Ez~/)[log(l  - D (G (z)))]
式⑶中,巴G )表示随机噪声z 的概率密度,p^a )表示
参数数据X 的概率密度。
第5步:在训练过程当中,G 尽可能生成真实的数据去欺
骗D,而D 则尽量把G 生成的数据和真实的数据区分开来,最 终生成模型和判别模型形成了一个动态的“博弈过程”。
第6步:判断D 是否能判别G 所生成的数据为真实,若 能,则得到训练好的数据,否则,需要调整输入参数x 后继续 执行第2步。
第7步:理想状态下,G 生成足以“以假乱真”的G(Q  ,对于
D 而言,无法判定G 所生成的数据是否真实,即Q(G(z)) =0.5。
1.2深度卷积生成对抗网络模型
为了使得GAN 能够很好的适应卷积神经网络架构,DCGAN
提出了四点架构设计规则叫分别是:
(1) 使用卷积层替代池化层。(2) 去除全连接层。
(3) 使用批归一化(Batch  Normalization)。
⑷使用恰当的激活函数。生成器中使用ReLU 函数,判
别器中使用LeakyReLU 函数。
生成器G 的输入是1个100维的随机数据z,服从范围在
[-1,1]的均匀分布。生成器G 网络的第一层为全连接层,其任 务是将100维的噪声向量变成4x4x1024维的向量,并从第二 层开始使用步长卷积做上釆样操作,逐步减少通道数,最终的 输出为64 x  64x3的图像。生成器G 的网络结构如图2所示:
扬州一工地坍塌图2 DCGAN 中生成器G 的网络结构
对于判别器D 的结构,基本是生成器G 的反向操作,如图
3所示。输入层为64x64x3的图像数据,经过一系列的卷积降 低数据维度。最终输出是一个二分类数据。
在DCGAN 中,一张图像经判别器D 处理后,其输出结果
表示此图像是真实图像的概率。而判别器D 通过若干层对输
入的图像的卷积后,提取卷积特征,并将得到的特征输入Log ­
istic  函数中,输出可看作是概率。
2基于小波基函数的深度卷积生成对抗网络要卡尼丁
2.1小波函数的构造
小波变换具有多分辨分析的特点,在时频两域都具有表
征信号局部特征的能力,本文在DCGAN 网络的生成模型中 为了得到原始图像的更多局部特征,用非线性小波基取代了
DCGAN 生成模型第一卷积层激活函数,在小波函数的选取上
考虑了传统激活函数有相似性质的小波基。
小波中母小波种类很多,其中Morlet 小波振幅光滑且连
续忆本文中选择了 Morlet 小波作为激活函数来构建小波深度
卷积生成对抗网络,其函数表达式为:
呎"=Ce  2 cos (5t)
(°)
其中C 是重构时的归一化常数。Morlet 小波没有尺度函
数,而且是非正交分解,时域波形图如图4所示:
图4小波基函数时域图
为了更好的适应激活函数的特征,将Morlet 小波的系数 做出修改,修改后的表达式为:
讽r)=-扌2
2
(5)
相应的时域图如图5所示:
图5修改的小波时域图
2.2基于小波函数的生成模型
将修改的小波函数加入到生成器中的第一个卷积层中去, 代替激活函数,如图6所示。
CONV4
tun
约翰邓恩
图6加入小波函数的生成器结构
图3 DCGAN 中判别器D 的网络结构$12
70
3实验结果与分析
本文使用的是Celeb-A Faces数据集,数据集大小为20万2599张人脸图,训练图像大小统一为64x64x3,除了tanh激活函数缩放范围缩放到[-1,1]之外,在生成器中额外加入了小波函数,并与原始方法进行对比。
数据集中所有模型均釆用小批量随机梯度下降进行训练,最小批量为128。权重初始化使用满足均值为0,标准差为0.02的高斯分布随机变量。对于激活函数LeakyReLU,其中Leak的部分设置斜率为0.2«使用训练过程中使用Adam优化器进行超参数优化,学习率为0.0002。
3.1实验结果
图7是训练周期数epoch=20的原始DCGAN,加入小波基函数的DCGAN判别器D和生成器G的损失函数对比结果。
»10*
"10*
*10*加小波函数的DCGAN判别器损失函数
>10*
加小波函数的DCGAN生成器损失函数
图7损失函数变化图
从图7各个损失函数图像可以看到,加入小波函数的DCGAN在整体趋势上接近原始DCGAN损失函数,本文选用的小波函数对网络的训练没有带来损失,判别器也最后呈下降趋势。
图8是部分训练样本(真实图像)和两个方法的结果图对比,可以看到有些生成的人脸图像己经近似于真实的人脸图像了。
真实图像
DCGAN生成图像
小波DCGAN生成图像
图8原始方法与本文方法的DCGAN生成结果
从图8中可以看到,无论是原始方法还是本文的方法,生成的图像与真实都己经高度相似,肉眼很难
分辨两种方法生成图像的质量,因此需要进一步分析客观评价指标来对比生成图像结果。
3.2评价指标
本文对原始图像、原始DCGAN生成的图像和加小波函数的DCGAN生成的图像进行随机抽样,计算亮度和对比度的平均值。数据选取的比例为l:l:b分别采样1000张图像,数据对比情况如表1所示。
表1图像亮度和对比度均值对比
亮度对比度
原图134.2347.9
DCGAN129.4276.2小波+DCGAN131.5289.0
通过数据可以看出,改进后的DCGAN相比于原始DCGAN在平均亮度上提升1.62%,对比度上提升4.6%,更加接近原始图像。
71
2020(Sum. No  215)
2020年第11期(总第215期)
信息通信
INFORMATION  & COMMUNICATIONS
复杂天气下交通场景多目标识别方法研究
董天天',曹海啸阚希魏得右'
(1.江苏信息职业技术学院电信学院;2.南京信息工程大学滨江学院物联网学院,江苏南京210000)
摘要:针对复杂天气下,目标受雨、雪、雾等彩响,造成语义识别困难,误检率高等问题,提出了一种基于AlexNet 融合改
进的YOLOv3网络模型叫该网络基于卷积神经网络可以提取不同天气图像中判别性特征,然后基于不同天气状况使
用不同方法去除干扰,最后使用改进的YOLOv3进行多目标判识。结果表明,复杂天气下该方法可以提高检测精度,并 能满足实时性的需求。
关键词:目标检测;深度学习;复杂天气;交通中图分类号:TP391.41
文献标识码:A
文章编号:1673-1131(2020)11-0072-03
Multi  Target  Recognition  Method  of  Traffic  Scene  In  Complex  Weather
Abstract: Aiming  at  the  problems  of  difficult  semantic  recognition  and  high  false  detection  rate  caused  by  rain, snow, fog  and  other  effects  on  targets  in  complex  weather, an  improved  YOLOv3 network  model  based  on  AlexNet  fusion  is  proposed.The  net ­work  can  extract  discrimmant  features  in  different  weather  images  based  on  convolutional  neural  network, then  use  different  me ­thods  to  remove  interference  based  on  different  weather  conditions, and  finally  use  improved  YOLOv3 for  multi-target  identi- fication.The  results  show  that  the  present  method  can  also  maintain  the  existing  detection  accuracy  under  complex  weather, and  can  meet  the  real-time  requirements.
Key  words: target  detection; deep  learning; complex  weather; traffic
0引言
2019年中国汽车销售量达到2576.9万辆,汽车数量的日 益增多,交通安全事故也愈发频繁。据统计,
有近30%的交通 事故是由恶劣天气造成的,其发生率较晴朗天气上升了 70%。 因为在雨雪雾等恶劣天气下驾驶员视线受到干扰,很难完全
掌握周围路况信息,造成行车判断失误。因此恶劣天气已经
成为影响道路安全行车的重要因素,如何有效预防和减少此
类问题,己成为热点研究领域之一。
随着人工智能技术,特别是图像处理与目标检测技术的快
速发展,使用深度学习算法已经可以达到实时性检测的要求。在
目标检测方面主要分为两类,一类是基于候选框策略,比如R-
CNN (Regions  witti  CNN  features), Fast  R-CNN  (Fast  Regions  with
CNN  featues),这些网络结构上都是将特征提取、区域提取、分 类器都整合在一个网络中,使得综合性能有了很大的提高;另_
类是基于回归的目标检测与识别算法,主要有YOLO(YbuLook
Only  Once), SSD(Single  Shot  MultiBox  Detector),这些算法的特shaq vs
点是将物体检测问题当成是回归问题,用一个卷积神经网络结
心理杂志订阅构就可以从输出图像中直接预测回归边框和类别概率,极大地
提高了检测的速度,可以实时对物体进行分类检测閥。
然而在复杂天气背景下,受到雨雪雾等天气干扰,目标的 特征提取变的困难,图像十分模糊,即使是人眼观察也很容易 造成误判,这严重降低了目标检测的精度。本文提出的网络
模型主要分为两步,首先使用卷积神经网络Alexnet 实时分类 当前天气状况,进而运用暗通道先验算法、小波融合算法去除
收稿日期:2020-09-10
基金项目:江苏高校品牌专业建设工程项目(PPZY2015B190)、江苏省大学生创新训练计划项目(202013108002Y)研究成果。 作者简介:董天天,男,江苏信息职业技术学院,电子信息工程学院教师,硕士研究生,主要研究方向为模式识别;
4结语
本文主要研究了深度卷积生成对抗网络在图像生成方面
的应用,在原始DCGAN 网络框架的基础上,在DCGAN 生成 模型中为了得到更多的原始图像局部特征,根据小波变换在
图像分解方面的优势,有效地把小波基函数加入到DCGAN 生 成模型卷积层激活函数。对原始的模型和改进的方法进行了 主观和客观的对比实验,实验结果表明,改进的DCGAN 模型 在图像亮度和对比度方面有所改善,从实验结果可以看出本 文提出的方法的可行性,但结果提升还不是很理想,在将来的
研究中会对模型做进一步改进。
参考文献:
[1] Goodfellow  I, Pouget-Abadie  J, Mirza  M, et  al. Generative
adversarial  nets  [C]//Advances  in  neural  information  pro ­cessing  systems. 2014: 2672-2680.
[2] Goodfellow  I. NIPS  2016 tutorial: Generative  adversarial
networks[J]. arXiv  preprint  arXiv:1701.00160, 2016.[3] 柯健,徐志京•基于生成对抗网络的语音增强算法研究[J].
信息技术与网络安全,2018,37(05):54-57.
[4] 毛典辉,李子沁,蔡强,薛子育•基于DCGAN 反馈的深度差分
隐私保护方法[J]•北京工业大学学报,2018,44(06):870-8力.[5] Hu  W  Tan  Y. Generating  adversarial  malware  examples  for
black-box  attacks  based  on  GAN[J]. arXiv  preprint  arXiv: 1702.05983,2017.
[6] Radford  A, Metz  L, Chintala  S . Unsupervised  representation
learning  with  deep  convolutional  generative  adversarial  net- works[J]. arXiv  preprint  arXiv: 1511.06434, 2015.
[7] 史丹青.生成对抗网络入门指南[M]寸掠机械工^出版社2)18.[8] 朱纯,王翰林,魏天远,王伟.基于深度卷积生成对抗网络的
语音生成技术[J] •仪表技术,2018(02):13-15+20.
[9] 刘颖,罗泽,朴英超•基于分段Morlet 小波变换的植被物候
遥感识别方法[J].计算机系统应用,2017,26(11):226-232.
72

本文发布于:2024-09-23 06:30:58,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/494545.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:生成   图像   模型
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议