基于LSTM与传统神经网络的网络流量预测及应用

神经网络预测
“人工智能”专题
37
2019年第8期
*通信作者
收稿日期:2019-07-15
Network Traffi c Prediction and Application Based on
LSTM and Traditional Neural Networks
提出了一个基于长短期记忆循环神经网络与传统神经网络的网络流量预测模型。通过与传统机器学习流量预测方法相对比,验证了该模型在网络流量预测中的适用性与更高的准确性。将上述流量预测模型应用在基于软件定义网络技术的智能化承载网切片系统中,以提升网络资源利用率,并提供了实验室验证结果。
流量预测;神经网络;长短期记忆;网络切片
This paper proposes a traffi c prediction model based on long short term memory (LSTM) and traditional neural networks. Compared with traditional machine learning-based traffi c prediction methods, experiments show that the proposed model has the applicability and higher accuracy in the network traffi c prediction. Finally, the above traffi c prediction model is applied in the SDN-based intelligent transport network slicing systems to improve the utilization of network resources, and the laboratory verifi cation results are affi c prediction; neural network; LSTM; network slice
(中国电信股份有限公司北京研究院,北京 102209)
(China Telecom Corporation Limited Beijng Research Institute, Beijing 102209, China)
【摘  要】【关键词】王海宁,袁祥枫*,杨明川
WANG Haining, YUAN Xiangfeng, YANG Mingchuan
[Abstract]
[Key words]
doi:10.3969/j.issn.1006-1010.2019.08.007      中图分类号:TN929.5
文献标志码:A      文章编号:1006-1010(2019)08-0037-08
引用格式:王海宁,袁祥枫,杨明川. 基于LSTM与传统神经网络的网络流量预测及应用[J]. 移动通信, 2019,43(8): 37-44.
扫描二维码与作者交流
OSID :
基于LSTM与传统神经网络的网络流量预测及应用
1  引言
网络流量的建模和预测是研究网络的性能、管理、协议及服务质量的基础,对网络的规划设计具有重要意义。精准地预测网络流量变化对提高网络稳定性,提升用户体验,节省运营商成本等具有重要意义。
针对网络流量预测问题,国内外的学者展开了深入的研究工作,且已经取得了非常不错的成果。网络流量预测这类序列预测问题,按照建模方法基本可以分为两类:第一类是基于时间序列建模的线性预测方法,例如自回归模型[1]、自回归滑动[2]、差分自回归移动平均模型[3]、HoltWinters 指数平滑法[4]等;第二类
是基于机器学习算法的非线性预测方法,如主持向量机、梯度提升回归树、神经网络[5]等。多个实验证明,
Copyright©博看网 www.bookan. All Rights Reserved.
“人工智能”专题
38
非线性预测方法比线性预测法具有更好的效果[6]。
循环神经网络(R e c u r r e n t  N e u r a l  N e t w o r k , R N N )是一种改进的神经网络,它包含自循环的神经元,可以将历史信息在神经元中进行传递。在众多R N N 的变体中,长短期记忆(L o n g  S h o r t  Te r m Memory, LSTM )[7]方法弥补了RNN 梯度消失、梯度爆炸、长期记忆能力不足等问题,在处理序列问题时效果拔。近些年在序列回归预测问题中,有很多学者使用了RNN 与
LSTM 。R Vinayakumar 等人应用LSTM 对骨干网流量进行预测[8]
。王祥雪和许伦辉将LSTM 应用在了短时交通流预测研究中[9]。江务学提出了一种基于改进双线性递归神经网络模型的非线性网络流量预测方法
[10]
。刘渊和姚萌提出了一种基于Elman 递归神
经网络、小波和自回归的网络流量组合预测模型[11]
以上方法是基于序列本身的性质进行预测,没有考虑外部环境特征对序列波动的影响。本文提出一种在多层LSTM 网络的基础上加入传统神经网络,引入外部人工构造特征的神经网络结构,提升对网络流量预测的精度。
2  相关理论与技术
2.1  RNN 与LSTM
RNN 适用于处理序列数据。如图1所示,RNN 有一个重复使用的神经元,形成一个循环的链式结构,循环链长度取决于输入序列的长度。这种链式使得不同阶段的序列数据所包含的信息能够在神经元中保留下去。基本的RNN 中这个重复的神经元结构很简单,如图2所示的RNN 结构,神经内只有一个tanh 层。当序列长度过长,这样简单的结构会使得距离较远的信息丢失,并伴随着梯度消失、梯度爆炸等问题。
图1    RNN 循环示意图
经(h t G update output t
(5)
(3)当前时刻神经元隐藏状态C t通过tanh激活函
图4至图7为4种场景下LSTM的结构展开图。多对
一(
多(
在接下来的循环中产生输出序列,可用于序列生成问
题,如输出一段音乐。多对多(many-to-m any)结构
many
3
3.1
为1
原始数据存在缺失值与异常值。对于个别时间的
缺失值,使用前后时间点流量的均值填补;对于一段
时间的缺失值则舍去。异常值在模型训练过程中会对
模型效果产生偏差,根据拉依达准则(3σ准则),将
[0.003, 0.997]区间外的值判定为异常值,进行平滑
处理。
本文模型的输入由两部分组成,序列数据与外部
特征。序列数据为长度为168的流量数据,如设置当前
时间点为X,[X-167, X]共168个流量数据为序列数据输
入。外部特征是人工构造的一些输入特征。本次实验
通过当前时间的时间戳提取时间特征,如是否周末、
一天中的第几个小时等,并经过独热编码处理,得到
74个时间特征;通过计算最近时间点流量序列的统计
信息,如均值、方差、模拟一阶差分等,得到25个统
3.2
入,
据。
图5    一对多场景网络结构
图6    多对多(输入输出长度相等)场景网络结构
1
2t
切片实例123456t
切片实例
y n
Copyright©博看网 www.bookan. All Rights Reserved.
“人工智能”专题
40
2019年第8期
作为全连接层的输入。全连接层前两层的激活函数使用relu ,最后一层为linear 激活函数,最终输出main_output 预测下一个1~6小时的业务量预测值。
按照8:1:1的比例进行训练集、验证集、测试集拆分。使用Adam 算法进行参数优化。损失函数采用均方
根误差(Mean Square Error, MSE ),公式如下所示:
L (Y ,f (X ))=
2
1
1(,())())
n j j i L Y f X Y f X n ==−∑(j - f (X j ))2              (7)
3.3  总结与对比
和传统的机器学习回归模型相比,本文的模型可以同时预测输出下1~6个时间点的预测值,便于实际应用场景中对未来流量趋势的判断与策略制定。图9显示测试集上模型预测的流量变化趋势与真实数据的对比。该模型可以准确预测网络流量在未来一段时间的变化趋势。
和传统的序列预测方法相比,本文模型考虑了外部特征对序列曲线的影响。由于数据集信息有限,这里只提取了时间特征与统计特征。在具体的应用场景中,还可根据实际情况添加特征进行训练。
本次实验在测试集上将本文提出的模型与三
x t
t
图9    预测的流量变化趋势与真实数 据对比
图8    模型结构
Copyright©博看网 www.bookan. All Rights Reserved.
“人工智能”专题
41
2019年第8期
L S T M 模型、支持向量回归模型(S u p p o r t  Ve c t o r Regression, SVR )、梯度提升回归树模型(Gradient Boosting Regression Tree, GBRT )对下一时刻流量值的预测情况进行对比,结果如表1和图10所示。可见,本文LSTM+DNN 模型效果最好,其次是SVR 。GBRT MSE 值优于LSTM ,但GBRT 的预测曲线有明显的滞后性,对真实值曲线的偶然波动较为敏感。LSTM 的曲线较平滑,对真实值曲线的偶然波动不敏感。
表1
不同算法效果对比
4  基于流量预测的应用实践
4.1  智能化网络切片场景
当前电信业务已经呈现出多场景、差异化的特点,如果为每种业务建立一个专用网络,则需要极高的成本,而网络切片可以使多个逻辑网络能够通过云和网络功能虚拟化(Network Function Virtualizatio
n, NFV )技术共享一个共同的物理基础设施,有效节约成本。同时,这样的共享为灵活的网络服务提供了新的商业模式,在垂直行业,具有弹性资源的网络架构
将根据服务需求动态变化。与传统网络相比,这种方式更加灵活可用,但灵活动态的需求也给基于人机交互的当前网络运营带来了新的挑战。
网络切片是5G 网络的重要使能技术,是端到端的逻辑子网,涉及核心网络(控制平面和用户平面)、无线接入网和承载网,需要多领域的协同配合。不同的网络切片之间可共享资源也可以相互隔离。网络切片可以帮助用户实现想要的功能和特性,完成业务的快速部署,减少上线时间。
在承载网中,为避免流量高峰期资源紧缺,切片的分配一般以满足用户峰值要求来部署,这也造成了大多数非高峰期时段网络带宽、服务质量等专属资源的冗余和浪费。因此,精准预测流量使用状况,按需动态配置切片资源,智能化管理承载网切片成为合理分配网络资源,保障业务服务质量的关键。
4.2  智能化承载网切片系统架构
智能化承载网络切片系统的功能架构如图11所示。智能化承载网络切片系统主要包括:基于AI 模型的流量预测系统、智能策略生成器、承载网络切片管理器(Transport Network Slice Manager, TNSM )以及承载网节点设备。其中,TNSM 和承载网节点设备之间采用软件定义网络(Software Defined Net
work, SDN )技术,实现TNSM 对多个承载网节点设备的集中控制,并提供流量数据采集及配置策略自动化下发。
流量预测系统推断预测流量前,需要使用历史流量数据进行训练。在实际应用中,承载网切片实例的
图 10    不同算法效果对比曲线图
680                              700                              720                              740                              760
54321
TRUE
LSTM+DNN LSTM GBRT SVR
Copyright©博看网 www.bookan. All Rights Reserved.

本文发布于:2024-09-22 21:31:31,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/2/360883.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:预测   网络   流量   序列   模型   切片   特征
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议