基于分形原理的时间序列分析及预测研究
2023-07-05
来源:榕意旅游网
第43卷增刊(II) 2013年11月 东南大学学报(自然科学版) JOURNAL OF SOUTHEAST UNIVERSITY(Natural Science Edition) Vo1.43 Sup(II) Nov. 2013 doi:10.3969/j.issn.1001—0505.2013.S2.025 基于分形原理的时间序列分析及预测研究 邱华旭 黄张裕 郑建雷 魏锦德 (河海大学地球科学与工程学院,南京210098) 摘要:引入分形原理分析时间序列问题.运用数组存储代替重复计算的方式改进饱和关联维数 法,当时间序列样本数据为100时,改进饱和关联维数法的运行时间比改进前缩短了61倍,程序 的运算步骤有效简化,且计算出的关联维为1.415 6,证明该时间序列具有分形特征.用变标度极 差分析法求时间序列的Hurst指数,结果为0.907 4,说明该序列具有持续效应.用累加和变换法 建立短时间序列的分形预测模型,建立的模型预测后一期数据的残差最大绝对值都小于1 nil/1. 实验结果表明:使用分形原理可有效描述时间序列的有关特征,且分形预测模型为短时间序列的 预测问题提供了一种新方法. 关键词:分形原理;时间序列;饱和关联维数法;变标度极差分析;累加和变换 中图分类号:P208 文献标志码:A 文章编号:1001—0505(2013)S2-0334-04 Ti1 ln serime serles analeS anal3"and predictiysis an predicti ̄on based 0n tracta theory based on fractal th ̄ 'yQiu Huaxu Huang Zhangyu Zheng Jianlei Wei Jinde (College of Earth Science and Engineering,Hohai University,Nanjing 210098,China) Abstract:The fractal theory iS introduced to analyze time series problem.Saturation correlation di. mension is improved by the method of storing the data into an array,instead of calculating repeated— ly.Specifically,when the sample data of time series is 100,the running time of the new algorithm shortens 6 1 times than that of the original one,and the calculation steps are effectively simplified. Moreover,the correlation dimension iS 1.415 6.which proves that the time series have ffacta1 fea— ture.Then the Hurst exponent obtained by the rescaled—range analysis iS 0.907 4.which indicates its continuous effect.Based on the fractal forecast mode1 of short time series established by the accumu— lative transform method.the maximum absolute residuals of he data collected from tthe next observa. tion period iS 1 nTIT1.Experimental results show that some characteristics of time series can be de— scribed by the fractal theory,and the fractal forecast model provides a new approach to solve the pre— diction problem of short time series. Key words:fractal theory;time series;saturation correlation dimension;rescaled—range analysis; accumulative transform 交通工程测量中会出现较多的时间序列问题, 序列建立预测模型 时间序列具有随机性、多尺度变化性等复杂特 性¨J,有效识别时间序列包含的内在规律 及客 观现象是分析和处理时间序列数据的目的.分形理 1 分形原理 至今分形尚未有严密的定义.1986年美国科 学家Mandelbrot给出了一个较为广泛、通俗的定 论为分析时间序列提供了新途径,从一个新的角度 获取时序的特征及规律.本文基于分形原理,探讨 时间序列的特征,预测其发展趋势,并针对短时间 义:分形是局部和整体具有某种方式相似的 形 H .分形思想的产生来源于地貌 ,具有分 收稿日期:2013-08—20. 作者简介:邱华旭(1988一),男,硕士生;黄张裕(联系人),男,博士,副教授,nj~hzy@hhu.edu.cn. 引文格式:邱华旭,黄张裕,郑建雷,等.基于分形原理的时间序列分析及预测研究[J].东南大学学报:自然科学版,2013,43(s2):334— 337.[doi:10.3969/j.issn.1001—0505.2013.s2.025] 增刊(II) 邱华旭,等:基于分形原理的时间序列分析及预测研究 335 形特性的形体都具有自相似性及标度不变性.用分 形理论分析杂乱无章的复杂系统,可发现它们仍然 具有数学规律,并能用分形维数表示.分形维数简 称分维,它是表征分形的参数,常用的分形维数有 Hausdorff维数、关联维数、盒维数、谱维数等. 2饱和关联维数法计算分维 在研究时间序列时,用散落在时间轴上的样本 数据无法描述复杂多维系统的变化规律 J,相空 间重构为其提供了条件.饱和关联维数法 刮(简 称G—P算法)是相空间重构理论中确定关联维数 最常用的方法.其原理如下: 对时间序列{X。, ,…,X }取延迟时间t及嵌 入维数 进行相空间重构,重构后的序列为{x , x2,…,x肼},其中,Xf:{Xf, f+ ,…, f+( 一1 }(1≤f ≤ ),M是相点个数,且M=N一(m一1).取邻域 半径r,定义关联积分 c( ) (r一 一 *) (1) 式中, ,= 观察原始的G—P算法过程,发现每次计算关 联积分都需进行m次时间序列元素间的减法运 算.于是定义函数 Ox(f, )=I置一 1≤i≤ ≤^, (2) 该函数表示每两个时间序列元素间差的绝对 值存放在数组Dx(f, )中,自变量f, 即时间序列 元素的下标.G—P算法运行时,先取遍定义域内所 有f,J,计算得出数组Dx(i,‘『)的所有取值.每次循 环计算I lxf—x 时,不需再进行计算,只需比较 向量 一x 中m个元素绝对值的大小,最大值即 为II 一x .因此,当嵌入维数个数取 、邻域 半径个数取 ,时,改进前后G—P算法计算次数之 差 An:—- =——————■■————一mM(M1)KNIKr———一』一 v (3)l j, 由于时间序列元素个数Ⅳ》 ,将式(3)变形, 得到 △n:—mK mK—r(JV— +1)(Ⅳ一 )一J7v2》0(4) 即An>>O.因此,改进后算法的计算次数大幅度减 小. 取 ,个不同的邻域半径r计算关联积分,绘 制ln(C(m,r))-In(r)曲线图,曲线斜率的大小即 时间序列的关联维数D.取 个不同的嵌入维数 m重复上述过程,绘制D-m曲线图,当D随m的 增大不再变化时,临界的m值表示描述该时间序 列所需的最少变量个数,且该时间序列在相空间趋 于有限维D . 3变标度极差分析法 英国水文学家赫斯特(Hurst)对时间序列数据 的标度行为进行了研究,发现时间序列记录的结果 具有自仿射特性,从而创立了变标度极差分析法 (rescaled range analysis),简称R/S分析法,进而 可以借助分形理论对其进行描述 。。.根据R/S分 析法的原理 川,计算得出Hurst指数,其大小可 揭示时间序列相关性的强弱, 与0.5之间的差距 越大表明时间序列内部的相关性越强,具体关系见 表1. 表1 Hurst指数取值与时间序列状态对应表 垦堕垫垦 [ ! : : : ! 时间序列状态反持续效应 不相关 持续效应 完全确定 4 累加和变换法计算分维原理 分形的幂级数分布定义为 Ⅳ= (5) 式中,,.表示特征线度;N表示所测对象的量值;D 表示分形维数;C为参数.在标准的分形分布中分 维是常数,将直线上任意2点(r ,Ⅳ1),(,.,,Ⅳ』)代 入式(5),整理得D和C的计算公式为 。= D。 ㈤ (6) C=Ni rjD (7) 标准分形的lnN-lnr双对数图像中点位分布是 一条直线,但在实际应用中分维通常并不是常数, 双对数图像中并不显现直线关系,原有的分形方法 无法处理,针对此种情形可采用累加和变换的方 法 卜 ].将{ⅣI}作为基本列,求各阶累加和数列, 即 { l }={Ⅳl,Ⅳ1+Ⅳ2,Ⅳl+Ⅳ2+Ⅳ3,…},i=1,2,…,n { }={ l1,S11+S12,S11+S12+S13,…},i=1,2,…,n {S(j+1) }={ , 。+ , + 2+ ,…}, i=1,2,…,n 分别由(ri, )、(r + , + )(i=1,2,…,n一 1)确定相应累加和数列的分维D.取各段分维比 336 东南大学学报(自然科学版) 第43卷 较接近,即分形分布拟合结果较好的累加和数列 { }作为模拟及预测数列.因为未来的发展趋势 与建模使用的最后一段分维的关系最密切,所以选 择这段分维作为预测使用的分维,根据式(6)计算 得 ,再由式(8)、(9)计算出 ,完成预测. S(j一1) =sj 一 一 (8) N =S1 一 1 (9) 5 实例分析 5.1 G.P算法改进前后的对比分析 采用G—P算法与改进G—P算法分别对相同数 据量的某时间序列计算关联积分,统计程序的运行 时间.其中,嵌人维数m=2,3,…,20,邻域半径 取值个数Kr=20,统计时间为程序在相同条件下 运行5次的平均值,时间序列样本数Ⅳ分别取 100,200,400,1 000及2 000,设优化比=改进后运 行时间/改进前运行时问,统计结果见表2. 表2改进前后G—P算法运行时间对比表 由表2可知,样本数据个数取100时,优化比 为1/61,样本数据取200时,优化比为1/117,样本 数据取400时,优化比达到1/148,改进后G—P算 法的运行时间远远小于改进前,原本复杂的程序可 快速得到结果,且随着样本数据的增加,优化比越 小,算法的改进效果越显著.当样本数增加到1 000 时,使用改进前方法所用的时间大于1 min,且极 易造成程序运行中断,无法获得结果.使用改进后 G—P算法所用的时间仅为2.109 S.当样本数为 2 000时,改进后的G P算法得出结果所用的时间 依然小于10 S. 5.2时间序列的关联维数及R/S分析 对某时间序列运用改进后G.P算法计算关联 维数,绘制ln(C(m,r))一ln(,一)图像,计算图像中每 条曲线直线部分趋势线的斜率D,绘制出的D—m 图像如图1所示.由图可知,随着嵌入维数m的增 图1 D-m示意图 大,曲线斜率D起初逐渐增大,发展到后来则基本 趋于一致.从m=7开始D随m的增加基本不再变 化,稳定值D =1.415 6,说明该时问序列在相空间 趋于有限维1.415 6,即饱和关联维为1.415 6. 对该时间序列进行R/S分析,得到In(R/S)一 ln(f)图像如图2所示.由图可知,利用R/S分析法 估计出时间序列的Hurst指数H=0.907 4,相关系 数R=0.99,表明该时间序列有较强的持续效应,预 测该序列会按照现有状态持续发展. 图2 R/S分析结果图 5.3基于分形原理的短时间序列预测模型的建立 采用某城区6个沉降监测点(儿~J6)连续11 期观测数据进行实验,其中前8期数据作为建模数 据,后3期作为模型验证数据.由于实验数据是等间 隔观测,在式(5)中,按照观N JJ ̄,序取第1期观测的 ,.=1,第2期观测的r=2,依此类推,由式(6)得出原 始序列的分维D,绘制D—r散点图,发现D随r的改 变逐渐增大,不符合分形分布的要求.对原始观测值 进行一阶累加和变换处理,得到序列{ 1 },计算 { 1 两点间的分维,发现使用一阶累加和数列计算 出的各分维D基本相同,符合分形分布的要求,可 以用作模型的建立.选择与待预测数据最接近的第 7、8期数据计算出的分维D作为预测模型的分维 值,再由式(7)计算出C.将计算出的D和c代人式 (5),变形得到 S1=e (10) 将待预测数据的序列号9,10,11代人式(10), 得出 1 , l 0, 1 再按式(8)、(9)对 19, 1 o, 1 还原,得到预测值Ⅳq, 。,Ⅳ】。.具体预测值、真实值 及残差值见表3. 由表可知,第9期数据的预测残差都在±1 mii1 以内,第l0期、第11期数据的预测值残差稍大,其 中,第l0期的预测值残差绝对值都在3 mill以内, 第ll期的预测值残差绝对值都小于5 IlllTI. 6结论 分形原理是描述非线性动力系统的一个活跃 增刊(II) 邱华旭,等:基于分形原理的时间序列分析及预测研究 337 的分支,本文基于分形原理对时间序列进行研究分 析,得到以下结论: 1)采用数组存储代替重复计算的思路对饱和 关联维数法加以改进,改进后的G—P算法节省了 程序运行时问,有效提高了运行效率.该思路为处 理其他包含复杂计算的研究分析提供了寻求便捷 的有效途径. 2)对时间序列求取关联维数,验证了时间序 列存在分形特征.计算分形序列的Hurst指数为 0.907 4,说明了此分形序列具有较强的持续效应. 3)利用累加和变换法计算短时间序列的分 维,建立出的分形预测模型能够非常精确地预测出 未来一期的时间序列数据,比较准确地预测出未来 2~3期的数据.为解决短时间序列模型的建立及 预测问题提供了一种新方法. 参考文献(References) [1]倪富健,方昱,薛智敏.时间序列在路面平整度预测中 的应用[J].东南大学学报:自然科学版,2006,36 (4):634~637. Ni Fujian,Fang Yu,Xue Zhimin.Prediction of pave— merit roughness wim time series auto regression model [J].Joumal of Southeast University:Natural Science Edition,2006,36(4):634—637.(in Chinese) [2]刘志强,黄张裕.建筑物沉降监测时序分析方法与预 测应用[J].勘察科学技术,2006(6):52—54. Liu Zhiqiang,Huang Zhangyu.Time series analysis method and predicting for buildings settlement[J].Site Invesitgation Science and Technology,2006(6):52— 54.(in Chinese) [3]张济忠.分形[M].北京:清华大学出版社,2011. [4]孙霞,吴自勤,黄昀.分形原理及其应用[M].合肥: 中国科学技术大学出版社,2003. [5]李后强,艾南山.分形地貌学及地貌发育的分形模型 [J].自然杂志,1992,15(7):516—519. Li Houqiang,Ai Nanshan.Fractal geomorphology and fractal model of geomorphic development[J].Chinese Journal of Nature,1992,15(7):516—519.(in Chi— nese) [6] 吴伶.分形理论在事故预测中的应用[D].西安:西安 电子科技大学,2008. [7] Martin Casdagli.Chaos and deterministic versus sto— chastic non—linear modeling[J].Journal of the Royal Staitstical Society:Series B(Mehtodologica1),1992, 54(2):303—328. [8]邵辉,施志荣,赵庆贤.事故关联维数的分形特征分析 [J].系统工程理论与实践,2006(4):141—144. Shao Hui,Shi Zhirong,Zhao Qingxina.Fractal features analysis on correction idmension of accidents[J].Sys— tems Engineering--Theory nad Practice,2006(4):141 —144.(in Chinese) [9]潘伟,吴超,李明,等.基于关联维的事故时间序列分 形特征分析[J].中国安全科学学报,2007,17(6): 157—161,177. Pan Wei,WuChao,LiMing,et al,Analysis onfractal features of accident time series based on correlation di. mension[J].China Safety Science Journal,2007,17 (6):157—161,177.(in Chinese) [10]屈世显,张建华.复杂系统的分形理论与应用[M]. 西安:陕西人民出版社,1996. [1 1]Alvarez—Ramirez J,Echeverria J C,Rodriguez E.Per— formance of a high—dimensional R/S method for Hurst exponent esitmation[J].Physica A:Statistical Me— chanics nad Its Applications,2008,387(26):6452— 6462. [12]聂伟,邵春福,杨励雅,等.分形理论在货运量预测中 的应用探讨[J].物流技术,2007,26(2):104—106, 109. Nie Wei,Shao Chunfu,Yang Liya,et a1.Application of fractla hteory in rfeight volume forecast[J].Logis— tics Technology,2007,26(2):104—106,109.(in Chinese)