基于非线性时间序列分析的网络流量预测

2022-03-05 09:49:29 | 浏览次数:

摘 要:通过对网络流量的准确预测,实现流量的宏观调控和自适应调节,可避免网络拥堵。传统方法对网络流量的预测采用线性信号分析方法,而忽略了网络流量的非线性耦合特性,对流量的预测精度不高。提出一种基于线性时间序列分析的网络流量预测算法。仿真实验表明,采用该算法进行网络流量预测,能有效提高预测精度,并具有较强的稳定性和抗干扰性,具有较好的应用价值。

关键词:网络流量;流量预测;非线性时间序列分析

DOIDOI:10.11907/rjdk.1511026

中图分类号:TP393

文献标识码:A 文章编号文章编号:1672-7800(2015)012-0163-03

0 引言

随着网络规模的扩大和网络特性的变化,需要对网络流量时间序列进行定量分析和研究。通过对网络流量的准确预测,实现对网络流量序列的宏观调控。网络流量是网络中数据进行上行和下行传输的数据和文件,网络流量的预测即对这些数据通过信号处理方法实现未来趋势的评估,以实现信号参量的估计和检测。网络流量从本质上而言是一组线性和非线性组合的时间序列,是网络终端用户在下载和上传数据信息资源时产生的时间序列采样振荡数据。因此,通过分析网络流量序列的内在特性,采用信号处理方法进行更准确的预测和控制,研究网络流量的准确预测算法,在进行网络监控和网络拥堵防治等领域具有较高的应用价值[1]。

通过对网络流量的准确分析和控制,可提高网络服务质量,预防网络拥堵。传统方法中,对网络流量的预测主要采用ARMA模型算法、统计信号分析算法、Poisson模型算法和谱分析算法等[2,3]。其中文献[4]提出一种基于递归率REC特征提取的网络流量预测算法,采用相空间重构实现对网络流的多维特征分析,提高预测精度,但是该算法存在计算量大、抗干扰性不强的问题;文献[5]提出一种基于粒子群优化差分进化的网络流预测算法,提取高斯密度特征,通过粒子群进化实现流量预测,通过更新两个“极值”来更新流量变化,减少预测误差,但该算法无法有效把流量时间序列的初始聚类误差收敛到有限域中,收敛性不好。可见,传统方法对网络流量的预测采用线性信号分析方法,而忽略了网络流量的非线性耦合特性,对流量的预测精度不高。针对上述问题,本文提出一种基于线性时间序列分析的网络流量预测算法。首先网络流量的非线性时间序列分析模型,基于定量递归分析方法进行网络流量的非线性递归特征提取,以此为特征参量实现网络流量的准确预测,实现算法改进,并通过仿真实验进行性能测试和验证。仿真实验表明,采用该算法进行网络流量预测能有效提高预测精度,具有较强的稳定性和抗干扰性,因此得出有效性结论。

1 问题描述和网络流量非线性时间序列分析

1.1 网络流量预测建模和信号模型构建

定义网络流量数据集为n个数据采样点的非线性时间序列,流量序列的分簇向量之间的属性矩阵为s,流量序列的特征表达式是n×n的矩阵,具体为:

D=0d(1,2)d(1,3)…d(1,4)d(2,1)0d(2,3)…d(2,n)d(3,1)d(3,2)0…d(3,n)0d(n,1)d(n,2)d(n,3)…0(1)

在局域中心网络链路层中,使用Ei、etSi、erji和etik分别代表节点i的总能量、在场景Si中传输一个单元数据所需要的功率、节点i到节点j的接收功率消耗和节点i到节点k的传输功率流量,得到网络流量时间序列的非线性特征的欧式距离为:

d(i,j)=(xi1-xj12+…+xid-xjd2)(2)

对于任意网络流量采样点xi和xj之间的定量递归距离为s(i,j),s(i,j)值越小,两个网络流量采样点相似度则越大,非线性耦合程度越大;值越小,则网络流量相似度越小。当d(i,j)=d(j,i),d(i,i)=0,网络流量信道结构均衡,以此为原理进行网络流量预测。

1.2 网络流量的非线性时间序列分析

本文以非线性时间序列分析为基础,进行流量预测,网络流量的非线性三阶自相关特征为:

Cor3=[(xn-x)(xn-d-x)(xn-D-x)][(xn-x)3](3)

其中,xn表示固定网络流量的采样时间序列,d表示相空间重构实验,D=2d,x表示互信息均值,[x(n)]代表对x(n)取方差,如式(4)所示。

[x(n)]=1/N∑Nn=1x(n)(4)

采用非线性时间序列分析方法,计算客户机与服务器间的网络流量的幅度和相位信息,如式(5)所示。

a(t)=x2(t)+y2(t),θ(t)=arctany(t)x(t)(5)

对于非线性高维空间中的流量序列特征任意一点Xn,采用相位随机化处理,以实际采集的网络流量时间序列{xn}作为非线性时间序列分析系统的输入,如式(6)所示。

xn=h(zn)+ωn(6)

在高斯密度谱估计中,使用递归图平面中递归点作为非线性特征,假设x1>x-1,则0位于[p0,p1]中,0则位于对角线平行线段区间[p-1,p0]中。由此可见,采用递归图的递归率能有效反映网络流量的非线性特征,通过高斯密度谱估计,确定峰值所在区间,从而实现网络流量的预测。

2 网络流量预测算法实现

在上述网络流量非线性时间序列分析的基础上,针对传统方法对网络流量的预测采用线性信号分析方法,忽略了网络流量的非线性耦合特性,对流量的预测精度不高的问题,为了克服传统方法的弊端,本文提出一种基于线性时间序列分析的网络流量预测算法。首先网络流量的非线性时间序列分析模型,基于定量递归分析方法进行网络流量的非线性递归特征提取,以此为特征参量实现网络流量的准确预测,如果网络流量时间序列中具有非线性成分存在,得到:

r(t)=sbu[s(t-τ0)]+αn(t)(7)

式(7)中,α为网络流量非线性时间相空间重构后的非高斯线性特征系数,u为振幅,τ为流量数据采集时延,n(t)为非线性耦合干扰噪声。以i为横坐标、j为纵坐标的坐标系采用定量递归分析方法,得到网络流量预测应度值:

f=αd11+βd2(8)d1=2∑ki=0∑kj=i+1d(ωi,ωj)k(k-1)(9)

其中,{ωi,ωij,mi}分别为定量递归特征空间中第i个流量的预测聚类中心,第j个数据元组和数据总数为{α,β}={1.3,2.6},考虑互相独立的零均值的高斯白噪声作为流量预测干扰因素,用u表示流量宽带高斯密度函数的均值向量,ε为协方差矩阵,得到网络流量预测的特征区间候选解为:

u(k+1)i=u(k+1)i1,u(k+1)i2,...,u(k+1)iD(10)

通过上述分析,得到网络流量预测的特征信号模型表达为:

x(t)=Re∑ni=1ai(t)ejωi(t)=Re∑ni=1ai(t)ej∫ωi(t)dt (11)

上式反映了多分簇网络流量的幅值、时间和频率之间的关系,信号的幅值可以表示为时间t和瞬时频率ω的函数H(ω,t),则此时每个路由器存储器的命中率为h(x)=∑1≤i≤xNi-α/∑1≤i≤Ni-α→x1-α。 当 N→∞,粒子群时间-频率联合分布的集合为V={v1,v2,v3...vN},N为粒子群个数,粒子群群路线的集合为E={e1,e2,e3...eM},M为幅值在整个频率段上随频率的迭代步数。由此实现网络流量预测算法的改进。

3 仿真实验与性能测试

为了测试本文算法进行网络流量预测的性能,进行仿真实验,仿真软件为Matlab7,算法运行平台为VC++6.0和SQLServer2005,网络流量数据采用网络Web数据集KDDCUP99和B400C20D40大型数据库的网络信息流量。数据采集服务器中有30个访问点,其中流量数据采集的访问点1、2位于区域1,访问点3、4位于区域2。在网络流量的预测模型设计中,构建网络Web流数据采样点,共有10个簇,每个簇5个节点,流量采集分为上行流量采集和下行流量采集,流量采集的带宽为3.4 dB,采集时间为2015年5月30日~7月8日。以此为样本,得到原始的流量序列时间序列波形如图1所示。

图1 流量序列时域波形

以上述流量数据为原始输入,进行流量预测。采用非线性时间序列分析方法,设置流量序列的初始相位容量为4 Mbps,流量数据采集延时20ms。基于定量递归分析方法进行网络流量的非线性递归特征提取,以此为特征参量实现网络流量的准确预测,得到网络流量预测非线性递归特征提取结果如图2所示。

图2 网络流量预测非线性递归特征提取结果

由图2可见,采用本文方法对流量进行非线性时间序列分析,提取的非线性递归特征能有效反映流量序列的内部细节谱特征,非线性成分的耦合特性得以有效展现,特征聚焦性能较好,实现了流量的准确预测。为了对比算法性能,将本文算法和传统算法进行比较,得到性能对比结果如图3所示。由图可见,采用本文算法进行流量预测的执行时间较短,预测精度较高,展示了较好的特性。

4 结语

网络流量从本质上而言是一组线性和非线性组合的时间序列,是网络终端用户在下载和上传数据信息资源时产生的时间序列采样振荡数据。因此,通过分析网络流量序列的内在特性,采用信号处理方法,进行更准确的预测和控制,研究网络流量的准确预测算法,在进行网络监控和网络拥堵防治等领域具有较好的应用价值。本文提出一种基于线性时间序列分析的网络流量预测算法。首先网络流量的非线性时间序列分析模型,基于定量递归分析方法进行网络流量的非线性递归特征提取,以此为特征参量实现网络流量的准确预测,并实现算法改进。仿真结果表明,采用本文算法对网络预测精度较高,具有较好的性能。

图3 预测性能对比

参考文献参考文献:

[1] 杨雷,李贵鹏,张萍.改进的Wolf一步预测的网络异常流量检测[J].科技通报,2014.30(2):47-49.

[2] 李振刚.基于高斯过程回归的网络流量预测模型[J].计算机应用,2014,34(5):1251-1254.

[3] CHANG Y C,LIN Z S,CHEN J L.Cluster based self organization management protocols for wireless sensor networks[J].IEEE Transactions on Consumer Electronics,2006,52(1):75-80.

[4] KOLHE J P,SHAHEED M,CHANDAR T S,et al.Robust control of robot manipulators based on uncertainty and disturbance estimation[J].International Journal of Robust and Nonlinear Control,2013,23(1):104-122.

[5] 陆兴华,陈平华.基于定量递归联合熵特征重构的缓冲区流量预测算法[J].计算机科学,2015,42(4):68-71.

[6] YUNTONG LIU.K-pruning algorithm for semantic relevancy calculating model of natural language[J].Journal of Theoretical and Applied Information Technology,2013,48(3):231-235.

(责任编辑:黄 健)

推荐访问: 序列 网络流量 预测 时间 分析