英语原文共 13 页,剩余内容已隐藏,支付完成后下载完整资料
非线性动力学、延迟时间和嵌入窗口
摘 要:
为了构造一个非线性时间序列的嵌入,必须选择合适的延迟时间。通常使用自相关函数进行估计;然而,这并没有适当地处理非线性,它可能会产生一个不正确的值。另一方面,可以从互信息中找到“d”的正确值,但这个过程在计算上相当繁琐。在此,我们提出了一种用相关积分估计d的简便方法。我们将其称为C-C方法,并在几个非线性时间序列上进行测试,获得与使用互信息的结果一致的估计。此外,一些研究人员认为,一个人不应该选择一个固定的延迟时间,独立于嵌入维数m,但是,相反,一个人应该选择一个适当的延迟时间窗口的值,张成的总时间的每个嵌入点的组件。不幸的是,不能使用自相关函数估计或互信息,估算,没有标准的程序已经出现。然而,我们也证明了C-C方法也可以用来估计w。基本上,w是数据独立性的最佳时间,而d是第一个局部最优时间。作为测试,我们将C-C方法应用于洛伦兹系统,一个三维的不合理的圆环,罗斯勒系统,以及拉比维-法布里康德系统。我们还演示了这种方法对噪声存在的鲁棒性。@1999 Elsevier Science B.V.版权所有。
关键词:延迟时间;相关积分;嵌入;时间序列
PACS: 05.45. b; 47.52. j
1.绪论
混沌时间序列分析在许多科学和工程领域中都很常见,延迟方法在标量时间序列的吸引子重构中也得到了广泛的应用。从吸引子动力学中,可以估计出相关维数和其他量,以确定标量时间序列是混沌的还是随机的。因此,吸引子重构是混沌时间序列分析的第一阶段。由于采用延迟方法进行吸引子重构的延迟时间的选择还没有得到充分的发展,许多研究人员使用自相关函数,计算方便,不需要大数据集。然而,有人指出[1],自相关函数不适用于非线性系统,相反,应选择“d”作为互信息的第一个局部最小值。不幸的是,这种方法在计算上很麻烦,需要大量的数据集[2]
根据Packard等[3]和Takens[4],延迟的方法可以用来嵌入标量时间序列},i = 1,2,hellip;,进入m维空间如下:
(1)
其中t是指数滞后。如果采样时间为,则延迟时间为 = t。Takens定理假设我们有一个无限的无噪声数据集,在这种情况下,我们几乎可以任意选择延迟时间。然而,由于真实的数据集是有限且有噪声的,所以延迟时间的选择在标量时间序列的吸引子重构中起着重要的作用。如果太小,重构吸引子压缩在标识线,这就叫做冗余。如果太大,吸引子动力学可能成为由断开连接,这就叫做枝节问题[5]。
在惯例,延迟时间是选择,以确保组件是独立的,和相同的延迟时间是用于所有嵌入维m。然而,近年来,它已经表明,延迟时间窗口,,整个时间跨越的的组件,应独立于m[11]。在这种情况下,延迟时间是随着嵌入维数m的变化而变化的。Rosenstein etal[6]比较了几种估计的方法,并指出每种方法的关键缺点,如不一致性和长计算时间。利用冗余和不相关的几何概念来评价吸引子重建的质量。有人建议[11],延迟时间窗口可能设置为ge;,轨道周期均值,可以近似通过检查的振荡
时间序列。Martinerie等。[7]检查延迟时间窗口,并与延迟时间估计使用自相关函数和互信息,但他们认为不能使用这两种方法估计。基本上,是数据独立性的最佳时间,但这些方法仅估计了第一个局部最优时间,即d。
在此工作中,我们开发了一种利用相关积分来选择延迟时间或延迟时间窗的技术。尽管在估计维度上,“w”可能比“d”更有用,但许多研究人员仍然使用“d”来利用延迟的方法来进行“吸引子”的重构。同时,使用该技术对d和w的估计有助于阐明这两个量之间的差异。Brock等[12,13],在一个时间序列的非线性测试的发展中,使用了统计,其中C(m,N,r)为相关积分(参见Eq.(2))。在这里,我们使用相似的统计量,我们检验它对指数滞后t的依赖性,因此,我们称我们的技术为C - C方法。与互信息的使用相比,C-C方法更容易实现,对较小的数据集更有用,对计算的要求也更低。也,其估计的同意互信息的第一个局部最小值。
2.相关积分和BDS统计量
Grassberger和Procaccia[14,15]引入的相关维度在许多领域被广泛应用于奇异吸引子的表征。嵌入时间序列的相关积分是:
(2)
其中
Theta;(a) = 0, if a lt; 0, Theta;(a) = 1, if a ge; 0,
N是数据集的大小,t是指数滞后,M = Nminus;(Mminus;1)t M维空间中嵌入点的数量,和表示sup-norm。测量,i = 1,2,hellip;,M,其sup-norm分离不大于r。如果C的限制存在每个r,然后分数的所有状态向量点在对方用和相关维度定义为。由于N对实数数据集是有限的,所以我们不能让r趋于0;相反,我们在logC(m,N,r,t) 对比logr中寻找一个斜率为的线性区域。
Brocketal[12,13]研究了基于相关积分的BDS统计量,检验给定数据集独立且分布(iid)的零假设。该测试对混沌系统和非线性随机系统特别有用。为了完整起见,我们简要回顾一下BDS统计数据。让F为状态空间中变量X的不变分布,并定义空间相关积分如下:
(3)
如果X是iid,然后使用并且
其中,
(4)
Denker和Keller[16]表明,C(m,N,r)是一个u统计量的估计量。Brock等[12,13]利用u -统计学理论进行了绝对正规的证明过程,证明了方法。正态分布均值为0,方差= 4
(5)
其中
(6)
(假设K gt; )。因此,BDS统计量定义为:
(7)
接近标准正态分布。然而,由于分布F通常是未知的,所以我们不能从上面的定义中得到C和K的值,以及方差。相反,必须从样本数据中估计相关积分C(1,r)和方差。因此,C(r)估计用C(1,N, r ,t)和)估计:
(8)
其中并且
与M = N- (M-l)t。然后,在iid假设下,如果和m gt; 1, BDS统计量就会变成
这个收敛于一个标准正态分布,如。
BDS从相关积分的统计特性出发,测量了相关维数的统计意义。虽然BDS统计量不能用于区分非线性确定性系统和非线性随机系统,但它是区分随机时间序列与混沌或非线性随机时间序列的有力工具。进一步的统计特性和证明可以在[12,13]中找到。
3.非线性依赖的测量
3.1.C-C方法
本研究关注的是的性质。我们将评论布鲁克et al。[12]:“如果随机过程我为iid,它将表明对所有m,r。也就是说,关联积分的行为就像一个串行字符串的特征函数的连续字符串的相关积分独立随机变量是相关的产品积分的组件的子字符串。这导致我们将统计数据(m,N,r,t)解释为非线性时间序列的序列相关性。因此,它可以被看作是非线性依赖的无因次度量。对于固定的m、N和r, S(m,N,r,t)与t的图是一个非线性的类似于自相关函数与t的图。
为了研究非线性依赖和消除虚假的时间相关性,我们必须细分时间序列,i = 1,2,hellip;N为t离散时间序列,其中t为指数滞后。S(m,N,r,t)的计算结果如下:
对于t = 1,我们有单个时间序列{x 1, x 2,hellip;,x N }:
对于t = 2,我们有两个间断时间序列{x 1,x 3,hellip;,x N 1}和{x 2,x 4,hellip;,x N},每个长度为N/2,我们取这两个级数的S(m,N/2,r,2)的平均值:
对于一般t,这变成了:
最后,当N→infin;,我们可以写:
对于固定的m和t, 对于所有的r都等于0,如果数据是iid和N。然而,实际数据集是有限的,数据可能是连续相关的;一般来说, 0 。因此,局部最优时间可能是的零交叉,或者与r的最小变化,因为这表明点的分布几乎是均匀的。因此,我们选择几个代表值,并定义了数量。
这是r的S(m,r,t)的变化量的度量,局部最优t是S(m,r,t)的零交叉和的最小值。S(m,r,t)的零相交对于所有的m和r都应该是相同的,对于所有m, 的最小值应该几乎相同(否则,时间不是局部最优的)。延迟时间将对应于这些局部最优的第一次。
3.2.选择有限样本容量的m和r
在决定一个有限的时间序列的非线性依赖通过使用统计年代(m,N,r,t),你必须有标准选择的值m和r。此外,一个人必须知道的角色固定值的样本大小N . N,随着m变得大,数据变得非常稀少,所以C(m,N,r,t)变得很小很小。同样,如果r大于吸引子的大小,那么C(m,N,r,t)饱和,因为大多数对点在距离r内,因此,m和r都不应该太大。
通过检验BDS统计数据,可以找到合适的选择形式,N和r。Brocketal。[12]利用一系列渐近分布产生的时间序列进行了这样一项调查。时间序列和三个样本大小,N = 100,500年和1000年,通过蒙特卡罗模拟生成六个渐近分布:标准正态分布、t分布和三个自由度,双指数分布、卡方分布有四个自由度,均匀分布,双峰态分布的混合物。这些研究得出的结论是m应该在2到5之间,而r应该在/2和2之间。此外,当N 500时,渐近分布很好地逼近有限时间序列。
作为一个例子,我们用三个耦合微分方程的洛伦兹系统(m,N,r,1)来说明统计S(m,N,r,1)的依赖性[17]:
其中a b c是常数。我们解出a = 16.0,b = 4.0, c = 45.92的方程组,生成一个变量x的时间序列, = 0.01。不同样本大小的S(m,N,r,1)的值,m和r的不同值如图1所示。对于N gt; 100, S(m,N,r,1)对所有r在0到4之间都是正的,在这里是数据集的标准差,r gt; 4的标准差接近0。N gt; 1000年代的行为(m,N,r,1)r的函数范围内0 lt; r lt; 4sigma;为N = 1000几乎是一样的,这代表了时间序列的相关性。
然而,当N小于100时,S(m,N,r,1)不能代表真正的相关性。例如,当N = 15和m = 10时,S(m,N,r,1)在r =(0.5) sigma;处消失,它从N = 1000的曲线中明显地分离出来。另一方面,对于m = 2, S(m,N,r,1)的行为基本正确,即使是小到15。这些结果与Brock等人的结论是一致的。在区间和中,量S(m,N,r,1)表示在图1中所考虑的N值范围内的序列相关。最后,注意,而渐近分布很有限的时间序列的近似大小Nge;500,没有必要为N这个大为了使用年代(m,N,r,1)研究时间序列的非线性依赖。
sigma;范围sigma;/ 2le;rle;2sigma;,我们选择四个代表值=(0.5)sigma;,=(1.0)sigma; ,=(1.5)sigma;,=(2.0)sigma;。然后我们定义了由Eqs给出的量的下列平均值。(14)和(15):
图1所示.S(m,N,r,1)和r = r /sigma;为各种样本大小N和m = 2,5并且使用10个时间序列变量x的Eq的洛伦兹系统。(16)其中a= 16.0, b = 4.0,c = 45.92,= 0.01。
我们寻找的第一个零交叉macr;S(t)或第一个局部最小值在当地找到第一个最佳时间为独立的数据,使延迟时间 = t年代。的最佳时间是指数滞后和都是接近0。如果我们赋予这两个量相等的重要性,那么我们可以简单地寻找数量的最小值。
图2所示.S(m r t)从洛伦兹系统变量x的Eq。(16)其中a= 16.0, b = 4.0,c = 45.92, = 0.01使用3000数据点。的圆圈表示附近,第一个局部最小值发生变化的S(m r t)与r。
而这一最佳时间给出了延迟时间窗口 = t。
4.数值例子
下面的例子表明,C-C方法相对容易实现,延迟时间tau;d与使用互信息获得的延迟时间tau;d一致,延迟时间窗tau;w与由Martinerie等人获得的延迟时间窗tau;w一致,并且方法 对噪声的存在是强有力的。
4.1.应用动力系统
我们解决情商的洛伦兹系统。(16)a= 16.0,b = 4.0,c = 45.92生成一个3000年的时间序列数据点与 = 0.01。然后我们从Eq.(14)计算S(m,r,t),结果如图2所示。图2中的圆表示在r的变化(m,r,t)在第一个局部最小值时的指数滞后t,图3(a)更清楚地显示了第一个局部最小的S(m,t)。我们选择的延迟时间在这一点上,使 = 10 = 0.10。这与Abarbanel等人发现的延迟时间一致。[18]使用第一个局部最小的相互信息。同时,从图3(c)中最小的,我们选择延迟时间窗口为= 100, = 1.0。
如果我们选择a= 10,b = 28日和c = 8/3。[7],来生成一个3000年的时间序列数据点与 = 0.01,然后获得一个延迟时间 = 0.18和延迟时间= 1.23的窗口。对于这种情况,Martinerie等。[7]获得 = 0.17从第一个最小互信息和 = 1.0从他们的经验过程,和我们的价值观和他们的协议。
接下来,我们从以下三个系统中为变量x生成3000个
全文共11306字,剩余内容已隐藏,支付完成后下载完整资料
资料编号:[11909],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。