广西GDP的实证分析与预测
统计1243 121001404121 陈巨灿 一、 研究背景
随着中国经济的快速发展们,人们经济观念的转变,越来越多的人开始理性地看待GDP这个指标,而且GDP 不仅能够在总体上度量国民产出和收入规模, 也能够在整体上度量经济波动和经济周期状态, 也是政府制定经济发展战略和经济政策的重要依据. 因此, 准确地分析和预测GDP,对指导人们的生活,对广西经济的发展具有重大参考价值.
二、 数据来源及研究方法
本文中我们从国家统计局收集了1990年—2014年广西的GDP数据,并以此为研究对象,探究和预测广西GDP的增长变化情况。
指标:地区生产总值(亿元) 地区:广西壮族自治区 时间:1990—2004 2014年
2011年
2013年 2012年
2010年 2009年 2008年 2007年 2006年 2005年 7021 5823.41 4746.16 3984.1 15672.97 14449.9 13035.1 11720.87 9569.85 7759.16 2004年 2003年 2002年 2001年 2000年 1999年 1998年 1997年 1996年 1995年 1911.3 1817.25
1697.9 1497.56
3433.5 2821.11 2523.73 1994年 1198.29 1993年 1992年 871.7 646.6 2279.34 2080.04 1971.41 1991年 518.59
1990年 449.06
数据来源:国家统计局
表 1 广西壮族自治区地区生产总值
时间序列分析法是用随机过程理论和数理统计方法研究随机数据序列的规律,从而对实际问题作出预测。社会经济系统中存在大量的时间序列数据需要通过时间序列分析建立合适的模型将其规律找出来,从而对该现象进行分析与预测。
本文主要采用的是ARMA模型,利用Eviews软件对数据分别进行数据预处理、平稳性检验、模型定阶、参数估计、模型检验、预测等。
三、 数据预处理
Y16,00014,00012,00010,0008,0006,0004,0002,000090929496980002040608101214 图 1 GDP时序图
由图1看以看出GDP有明显的上升趋势,是一个非平稳的时间序列,不符合ARIMA模型的基本假设,故需对该时间序列进行差分处理。
DY2,4002,0001,6001,200800400090929496980002040608101214D2Y1,2008004000-400-800 -1,20090929496980002040608101214 图 2 GDP一阶差分 图 3 GDP二阶差分
如图2图3所示对GDP分别作一阶差分和二阶差分,从左图上能看出后半部分有明显的上升趋势,即一阶差分是非平稳的。从右图看出已经没有明显的趋势了,但很难看出是否为平稳的。因此,需进行ADF单位根检验。 检验类型 ADF检验量 P值 临界值(5%显著性水平) 结论 -1.956406 (0,0,1) -0.381430 0.5356 非平稳 0.6073 -2.998064 (C,0,1) -1.309193 非平稳 0.2848 -3.622033 (C,T,1) -2.596421 非平稳 0.0000 -1.957204 (0,0,2) -5.450204 平稳 0.0006 -3.012363 (C,0,2) -5.046081 平稳 0.0040 -3.644963 (C,T,2) -4.922824 平稳 注:(C,T,K)分别代表是否带有截距项、时间趋势和差分阶数 表 2 ADF检验
由表2可知GDP一阶差分的ADF的检验值均大于显著水平为5%的临界值,故接受
存在单位根的假设,显示出非平稳性,但其二阶差分ADF的检验值均小于显著水平为5%的临界值,故拒绝存在单位根的假设,判断其二阶差分是平稳时间序列。
四、 模型识别与定阶
使用eviews7.0,计算二次差分后时间序列12阶自相关函数和偏相关函数,如下图所示,可以看出ADF和PADF都在延迟大概两阶,基本控制在两个标准差范围之内,具有短期相关性,同时也可以认为该序列为平稳随机序列。样本的自相关函数和偏相关函数没有出现明显的截尾现象,基本出现逐步衰减态势,二者都呈现一定的拖尾特性,由此认定该序列为平稳的白噪声序列,可构造ARIMA模型。
图 4 自相关和偏相关图
从图4上可大致考虑p=2、q=2,但要最终确定p、q 的参数值,本文采用AIC 准则进行判断,最终选择最优模型。在选择最小的AIC 值之外,还要考虑对估计结构进行显著性检验和残差随机性检验。如果能通过就是最佳模型,若无法通过检验则选择次优方案。
AR MA 0 0 1 14.60339 2 14.50394 1 18.67912 14.427 14.64883 2 17.88423 14.50343 14.55452 表 3 AIC表
通过Eviews6.0 反复多次运算,并且考虑到自相关和偏自相关图形的特征,即具有最小的ACI 值,同时又能通过显著性检验,最终把模型定为ARIMA(1,2,1)。
五、 参数估计
由以上分析我们可建立广西GDP时间序列模型ARMA(1,2,1)
d设ARMA模型为: ( 1??B)(1?B)yt? ( 1 ??B)et?C,
其中??1,d?2,??1
表 4 参数估计表
解得C=0,AR(1)的系数为1.125347,MA(1)的系数为0.696822
由表可知,调整后的R2为0.99568,只有较少的信息缺失,拟合效果良好。AR(1)、MA(1)、C的P值均小于显著性水平0.05,可以认为在显著性水平0.05下,各个解释变量均显著。显然此模型效果更好。
六、 模型检验
一个好的模拟模型应该能够提取观察值序列中几乎所有的样本相关信息,即残差序列应该为白噪声序列;反之,如果残差序列为非白噪声序列,那就以为这残差序列中还有残留的相关信息未被提取,这就说明模型拟和模型不够有效。
图 5 残差的自相关和偏相关图
如图5 所示,没有任何的自相关和偏自相关是在统计上显著的,说明拟合情况还令人满意。
相关推荐: