ccf(as.numeric(milk.electricity[,1]),as.numeric(milk.electricity[,2]),
main='milk & electricity',ylab='CCF')
两者相关性似乎非常的强,但实际上这是因为他们的各自存在很强的自相关性。
4 预白化与随机回归
对于具有强自相关的数据而言,很难评估两个过程之前是否存在依赖关系,因而,宜将x和y之间的线性关系关联从其各自相关关系中剥离出来。预白化正是为了达到此目的的一个有效工具。
4.1 牛奶与电量的CCF预白化校正
> data(milk) >
me.dif=ts.intersect(diff(diff(milk,12)),diff(diff(log(electricity),12))) >
prewhiten(as.vector(me.dif[,1]),as.vector(me.dif[,2]),ylab='CCf')
再次分析两者的相关性,此时除了时滞-3具有边缘显著外,其他地方没有一个相关系数是显著的。幌动防震 这给出的35个样本互相关系娄中大约会出现 1.75=35x0.05个虚假警报,即这个-3系数的显著可能就是一个虚假的信息。因此,牛奶与耗电量序列实际上是基本不相关的。从而认为之前在原始数据序列中发现的强互相关是伪相关的。
4.2 Log(销售量)与价格数据的相关性分析 4.2.1 预白化处理
plot(bluebird,yax.flip=T)#画两者的时间序列对比图
预白化处理
prewhiten(y=diff(bluebird)[,1],x=diff(bluebird)[,2],ylab='ccf')
从CCF图可以看出两者之间只在时滞0处是显著的。即价格与销售量之间存在着很强的同期负相关关系。即当期提高价格将导致销售量的当期下降。
4.2.2 一般线性回归分析
> sales=bluebird[,1] > price=bluebird[,2]
> chip.m1=lm(sales~price) > summary(chip.m1)
Call:
lm(formula = sales ~ price)
Residuals:
Min 1Q Median 3Q Max
-0.54950 -0.12373 0.00667 0.13136 0.45170
Coefficients:
Estimate Std. Error t value Pr(>|t|) (Intercept) 15.890 0.217 73.22 <2e-16 *** price -2.489 0.126 -19.75 <2e-16 *** ---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.188 on 102 degrees of freedom Multiple R-squared: 0.7926, Adjusted R-squared: 0.7906 F-statistic: 389.9 on 1 and 102 DF, p-value: < 2.2e-16
> acf(residuals(chip.m1),ci.type='ma')
由于回归后的残差自相关在四阶是显著的,因此我们要对其进行再一步的分析
> eacf(residuals(chip.m1)) AR/MA
0 1 2 3 4 5 6 7 8 9 10 11 12 13 0 x x x x o o x x o o o o o o 1 x o o x o o o o o o o o o o 2 x x o x o o o o o o o o o o 3 x x o x o o o o o o o o o o 4 o x x o o o o o o o o o o o 5 x x x o x o o o o o o o o o 6 x x o x x x o o o o o o o o 7 x o x o o o o o o o o o o o
Eacf推荐其残差包含一个以(1,4)为顶点为的零值三角形,从而表明其为arma(1,4)模型,因此可将对数化销售量拟合成对于价格序列的带有ARMA(1,4)误差的回归模型。
相关推荐: