而分组区间数目为k?r?2,其中r为最小区间数。以上三个参数确定之后就可以计算样本概率密度。 2.4.3独立性检验
在时间序列分析和建模过程中,除了要求检验样本数据的平稳性和正态性之外,还要求检验其独立性。本节介绍的独立性方法是基于正态随机变量自相关函数的统计性质。
设随机变量X~N(0,?),其自相关函数
2?(r)???1,r?0 (2.55)
0,r?0??(r),一般不等当r?1时,?(r)?0。实际中我们只能得到样本自相关系数的估计值?于0,从自相关系数的估计值判断是否满足独立性条件,需要借助Bartlett公式。
Bartlett公式:若?(r)在r?M时趋于零,则在N足够大的情况下其方差为
1M2?(r)]??(m)(r?M) (2.56) D[???Nm??M?(r)近似于正态分布。 并且,当r?M时,??(r)是白噪声的自相关系数,则M?0 若??(r)]?D[?1N(r?0) (2.57)
根据统计检验的2?准则,当
?(r)?1.96?11?2 (2.58) NN或
?(r)?2 (2.59) N??(r)为零的可能性是95%,从而接受??(r)?0(r?0)这一估计,即数据是独时,便可认为?立的。
?(r)(r?0)超出式(2.57)所约束的范围,可以采用另一种检验该随机变如果有个别?量是否独立的整体检验方法。考虑到r?1时,白噪声序列的样本自相关分布渐近于正态分
?(1),布,或是说当N较大时,{N??(2),?,N??(k)}这k个量近似为相互独立的正N?2态随机变量N(0,1),因而它们的平方和符合?分布。构造统计量为
16
?2(r) (2.60) Q?N??r?1k则检验x1,x2,?,xN是否为白噪声样本值的问题可转化为检验统计量Q是否是自由度为k的?分布问题。
具体算法是:以“{xt}为白噪声”做原假设,以?为显著水平,则根据?和自由度k由?分布表查出相应的?a(k)值,并与计算出的Q值比较。如果
2Q??a(k) (2.61)
222则肯定原假设,即在(1??)的置信水平上接受{xt}为独立的假定。如果
2Q??a(k) (2.62)
则否定原假设。
2.4.4离群点的检验与处理
离群点是指一个时间序列中,远离序列一般水平的极端大值和极端小值,也成为奇异值或野值。形成离群点的原因是多种多样的,例如由于数据传输过程、采样及记录过程中发生信号失真或丢失等而产生,又如研究现象本身由于受各种偶然非正常的因素影响而形成离群点等等。不论何种原因引起离群点,通常都会在之后的时间序列分析中带来误差,影响建立时序模型的精度。在得到时间序列以后,首先要检查是否存在离群点,下面介绍一种线性外推的方法来寻找和剔出离群点。
该方法是将时间序列值与平滑值进行比较,认为正常的数据是“平滑的”,而离群点是“突变的”。用Xi表示先对序列进行平滑、再平方得到的数值,Xi2表示先对序列取平方、再做平滑而得到的数值,用Si表示方差,有Si=Xi2-Xi,如果
Xi?1?Xi?kSi (2.63) 则认为Xt?1是正常的,否则认为Xt?1是一个离群点。K是常数,一般取3-9的整数。
2222?来代替,即 如果Xt?1是离群点,则可用Xt?1??2X?X (2.64) Xt?1ii?1为避免出现无休止的外推计算,建议事先规定连续外推的次数,因为接连检测到一些离群点后,最终的外推结果可能偏离很远,以致会排出本来是很正常的数据点。
17
习题二
2.1
EVIEWS软件介绍(Ⅱ)
借助Eviews5.1,我们可以很方便的判断一个时间序列是否平稳以及是否为纯随即性序
列。作出判断的步骤如下:
一、绘制时间序列图
时序图可以大致看出序列的平稳性,平稳序列的时序图应该显示出序列始终围绕一个
常数值波动,且波动的范围不大。如果观察序列的时序图显示出该序列有明显的趋势或周期,那它通常不是平稳序列,现以例子来说明。
例1、1964-1999年中国纱年产量序列(单位:万吨)。
按照第一章的方法建立工作文件和导入外部Excel文件,创建新序列SHA,如图2.2。点击主菜单Quick/Graph就可作图,见图2.3,分别是折线图(Line graph)、条形图(Bar graph)、散点图(Scatter)等,也可双击序列名,出现显示电子表格的序列观测值,然后点击工具栏的View/Graph。如果选择折线图,出现图2.4的对话框,在此对话框中键入要做图的序列,点击OK则出现折线图,横轴表示时间,纵轴表示纱产量,见图2.5,选择图2.5上工具栏options可以对折线图做相应修饰。点击主菜单的Edit/Copy,然后粘贴到文档就变成了如图2.6的折线图。
图2.2
18
图2.3
图2.4
图2.5
19
600500400300200100019651970197519801985SHA19901995 图2.6
从图1.5可以看出,纱产量呈现波动中上升的趋势,显然不平稳,所以不是一个平稳序列。这一结论,还可以通过平稳性统计检验来进一步说明。
二、平稳性判断
例1续. 为了进一步的判断序列SHA的平稳性,需要绘制出该序列的自相关图。双击序列名sha出现序列观测值的电子表格工作文件,点击View/Correlogram,出现图1.6的相关图设定对话框,上面选项要求选择对谁计算自相关系数:原始序列(Level)、一阶差分(1st difference)和二阶差分(2nd difference),默认是对原始序列显示相关图。下面指定相关图显示的最大滞后阶数k,若观测值较多,k可取?T/10?或?T?;若样本量较小k一般取?T/4???(T表示时间序列观测值个数,?。若序列是季节数据,一般k?表明不超过其的最大整数)
取季节周期的整数倍。设定完毕点击OK就出现图1.7的序列相关图和相应的统计量。
图2.7
20
搜索“diyifanwen.net”或“第一范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,第一范文网,提供最新医药卫生时间序列分析的基本概念 (4)全文阅读和word下载服务。
相关推荐: