应用ARIMA模型在居民消费价格指数预测
来源:UC论文网2015-11-30 21:18
导读::时间序列预测方法的基本思想是:预测一个现象的未来变化时。模型的表现形式。居民消费价格指数反映的市场价格信号真实。 论文关键词:时间序列,ARIMA模型,居民消费价格
导读::时间序列预测方法的基本思想是:预测一个现象的未来变化时。模型的表现形式。居民消费价格指数反映的市场价格信号真实。
论文关键词:时间序列,ARIMA模型,居民消费价格指数
1 引言
居民消费价格指数(CPI)是用来测定一定时期内居民支付所消费商品和服务价格变化程度的相对数指标,它既是反映通货膨胀程度的重要指标,也是国民经济核算中缩减指,这一指标影响着政府制定货币、财政、消费、价格、工资、社会保障等政策,同时,也直接影响居民的生活水平及评价[1]。居民消费价格指数反映的市场价格信号真实,带动价格舆论导向正确,有利于改善价格总水平调控。首先,它有利于维护正常的经济生活和市场价格信息秩序。其次,有利于引导消费形成合理的消费价格,促进有效需求。目前,医疗、教育、交通等垄断行业价格上涨过快,导致居民大量增加储蓄,使正常消费受到压抑,消费结构变形,影响经济增长。再次,它有利于综合运用价格和其他经济手段,实现价格总水平调控目标。所以,对该指标的分析与预测是非常有意义的工作。
2 ARIMA模型的表现形式
ARIMA时间序列预测方法的基本思想是:预测一个现象的未来变化时,用该现象的过去行为来预测未来,即通过时间序列的历史数据揭示现象随时间变化的规律,并将这种规律延伸到未来,从而对该现象的未来做出预测。ARIMA模型是一种比较成熟的时间序列模型,主要有三种基本形式:自回归模型(AR:Auto-regressive),移动平均模型(MA:Moving-Average)和混合模型(ARIMA:Auto-regressiveMoving-Average)。
2.1自回归模型AR(p)
AR(p)模型的预测方式是通过过去的观测值和现在的干扰值的线性组合预测,自回归模型的数学公式是:
其中:参数 c 为常数;f1, f2 ,…, fp 是自回归模型系数;p为自回归模型阶数;et 是均值为0,方差为s 2的白噪声序列。
AR(p)模型的意义在于仅通过时间序列变量的自身历史观测值来反映有关因素对预测目标的影响和作用,不受模型变量相互独立的假设条件约束论文网,所构成的模型可以消除一般回归预测方法中由于自变量选择、多重共线形等造成的困难。
2.2移动平均模型MA(q)
MA模型的预测方式是通过过去的干扰值和现在的干扰值的线性组合预测,移动平均模型的数学公式是:
其中:参数 m 为常数;参数q1 ,q2 ,…, qq是 q 阶移动平均模型的系数;et 是均值为0,方差为s 2的白噪声序列。
MA(q)模型用过去各个时期的随机干扰或预测误差的线性组合来表达当前预测值,AR(p)的假设条件不满足时可以考虑用MA(q)形式。MA(q)总是满足平稳条件,因为其中参数取值对时间序列的影响没有AR模型中参数P的影响强烈,即较大的随机变化不会改变时间序列的方向。
2.3 ARIMA(p,q)模型
自回归模型和移动平均模型的组合就构成了用于描述平稳随机过程的自回归移动平均模型ARIMA,数学公式为:
特殊情况下,q=0,,模型即为AR(p),p=0,模型即为MA(q)。
2.4模型对比
AR(p),MA(q),ARIMA(p,q)等模型在工程技术,社会经济等建模分析中起着非常重要的作用。
AR(p),MA(p),ARIMA(p论文网,q)都是有限参数线性模型,只要确定出有限个参数的值,模型就完全确定、由于都是线性模型,用它们来对数据进行拟合,考察数据内在的统计特征以及做最佳预测时数学上的分析处理都比较方便。AR(p)模型的偏自相关函数是以P步截尾的,自相关函数拖尾。MA(p)模型的自相关函数具有q步截尾性,偏自相关函数拖尾。这两个性质可以分别用来识别自回归模型和移动平均模型的阶数。ARIMA(p,q)模型的自相关函数和偏相关函数都是拖尾的。
注意AR(p)和MA(q)之间具有对偶性。如MA(1)的自相关函数在一个实滞(k=1)后中断,而AR(1)的自相关函数呈指数衰减到0。相反,MA(1)的偏自相关函数呈指数衰减到0,而AR(1)的偏自相关函数在一个实滞(k=1)以后中断。对于一般的自回归和移动平均过程都近似地存在这种对偶性。序列的这些特性被用来识别模型。
三种平稳时间序列ARIMA性质比较如表1所示:
表1 ARIMA模式比较
模型 | AR(p) | MA(q) | ARIMA(p,q) |
相关性系数 | 拖尾 | 截尾 | 拖尾 |
偏相关性系数 | 截尾 | 拖尾 | 拖尾 |
2.5 ARIMA建模流程
用ARIMA模型预测要求序列必须是平稳的,也就是说,在研究的时间范围内研究对象受到的影响因素必须基本相同。若所给的序列并非稳定列,则必须对所给的序列做预处理,使其平稳化,然后用ARIMA模型建模。其步骤如图1所示:
图1 ARIMA建模流程
(1)序列的预处理,判断该序列是否为平稳随机序列。若为非平稳序列,对该序列行处理使其符合ARIMA模型建模的条件论文网,即处理后的序列是平稳序列;
(2)计算出观察值序列的样本自相关系数(AC)和样本偏自相关系数(PAC)的值;
(3)根据样本自相关系数和偏自相关系数,选恰当的ARIMA模型进行拟合;
(4)估计模型中的未知参数;
(5)检验模型的有效性。如果拟合模型通不过检验,转向步骤3,重新选择模型再拟合;
(6)模型优化。如果拟合模型通过检验,仍然转向步骤2,充分考虑各种可能,建立多个拟合模型,从所有通过检验的模型中选择最优模型;
(7)利用拟合的模型,预测序列的将来走势。
3 实例分析
根据山东统计年鉴发布的居民消费价格指数时间序列数据(1951到2005进行估计,2006到2008年用来计算误差)[2]。原始数据为基期价格指数(1950=100)(见表2)。
表2 1951-2005山东居民消费价格指数 以1950=100
1951年 | 1952年 | 1953年 | 1954年 | 1955年 | 1956年 | 1957年 | 1958年 | 1959年 | 1960年 |
110.8 | 113.2 | 116.9 | 120.9 | 120.8 | 121.7 | 122.9 | 122.4 | 123.1 | 123.7 |
1961年 | 1962年 | 1963年 | 1964年 | 1965年 | 1966 年 | 1967年 | 1968年 | 1969年 | 1970年 |
131.5 | 132.2 | 130.5 | 127.6 | 124.8 | 123.2 | 123.3 | 123.1 | 123 | 121.7 |
1971年 | 1972年 | 1973年 | 1974年 | 1975年 | 1976年 | 1977年 | 1978年 | 1979年 | 1980年 |
121.6 | 121.6 | 121.4 | 121.3 | 121.5 | 121.7 | 121.5 | 121.9 | 122.8 | 128.9 |
1981年 | 1982年 | 1983年 | 1984年 | 1985年 | 1986年 | 1987年 | 1988年 | 1989年 | 1990年 |
131.2 | 132.4 | 135.6 | 137.6 | 149.6 | 156.3 | 169.1 | 200.7 | 235.5 | 243.5 |
1991年 | 1992年 | 1993年 | 1994年 | 1995年 | 1996年 | 1997年 | 1998年 | 1999年 | 2000年 |
255.4 | 272.8 | 307.4 | 379.4 | 446.1 | 489 | 502.6 | 499.6 | 496.1 | 497.1 |
2001年 | 2002年 | 2003年 | 2004年 | 2005年 | | | | | |
506 | 502.5 | 508 | 526.3 | 535.2 | | | | | |
数据来源:山东省统计年鉴
使用Eviews软件对山东居民消费价格指数进行分析,从消费价格指数的曲线图图(2)可以看出,1951年到1985年中期消费价格指数在一个比较小的空间里波动,且一度探到150以下,这说明政府在这期间动用了许多积极的财政政策和货币政策,但经济没有走出通货紧缩;至1985年后期,积极政策开始奏效,投资持续升温、经济增长势头强劲,CPI以较快速度上扬,政府与学者关注的焦点也逐渐由通货紧缩转向通货膨胀。
图2 消费价格指数走势图
从图1可以看出数据具有明显的递增趋势,再运用数组窗口View/Unit RootText对序列CPI进行单位根检验论文网,从表3中知P >0.05。说明:序列CPI没有通过ADF检验即该时间序列是非平稳的。因此建立模型之前,必须对序列CPI进行平稳化处理。一般,我们用差分法来消除序列的趋势。一阶差分可以消除线性趋势,二次差分则可消除二次曲线趋势。经过一阶差分后,我们从差分后序列DCPI的自相关和偏自相关函数图(图3)和ADF检验结果见表4,可知DCPI是平稳的,且其自相关和偏自相关函数图显示出具有ARIMA模型的特征,我们考虑用ARIMA来拟合CPI。
从序列DCPI的自相关和偏相关图看出:偏自相关函数在k=2后很快趋于0,所以取p=2;自相关函数呈现拖尾现象,所以取q=0。
综合考虑,我们建立ARIMA (1, 1, 0)和ARIMA(2,1,0)模型, 综合比较比较两个模型的AIC、SC和拟合优度R2值(结果如表5)。
表3 差分前ADF检验
ADF-test statistic | | t-Statistic | Prob.* |
| | -0.985600 | 0.9375 |
Test critical values | 1% level | -4.133838 | |
| 5% level | -3.493692 | |
| 10% level | -3.175693 | |
表4 差分后ADF检验
Phillips-Perron test statistic | | t-Statistic | Prob.* |
| | -4.26597 | 0.0070 |
Test critical values | 1% level | -4.133838 | |
| 5% level | -3.493692 | |
| 10% level | -3.175693 | |
图3 序列DCPI自相关—偏自相关分析图
表5 各模型检验结果
(p,q) | (1,0) | (2,0) |
AIC | 7.43 | 7.31 |
SC | 7.46 | 7.38 |
R2 | 0.62 | 0.68 |
比较表5中各模型的检验结果。第二个模型的AIC和SC值与第一个模型相比较小,并且第二个模型拟合优度比第一个高。因而选择第二个即ARIMA (2, 1, 0)模型比较合适。
Variable | Coefficient | Std. Error | t-Statistic | Prob. |
AR(1) | 1.174182 | 0.130007 | 9.031672 | 0.0000 |
AR(2) | -0.407498 | 0.131317 | -3.103165 | 0.0031 |
R-squared | 0.682285 | Mean dependent var | 8.044231 | |
Adjusted R-squared | 0.675931 | S.D. dependent var | 16.131825 | |
S.E. of regression | 9.187081 | Akaike info criterion | 7.311176 | |
Sum squared resid | 4220.123 | Schwarz criterion | 7.386224 | |
Log likelihood | -188.0906 | Durbin-Watson stat | 1.825194 |
图4ARIMA(2,1,0)模型参数估计与相关结果
由图4可得出ARIMA(2,1,0)模型展开式:
若残差序列不是白噪声,意味着残差序列还存在有用信息没被提取,需要进一步改进模型。本例直接对残差序列resid操作,可以得到相应的自相关分析图(图5)。
图5 残差序列的自相关—偏相关分析图
利用上述模型对我国2006至2008居民消费价格指数预测,其中预测分为静态与动态之分,通过比较静态与动态的预测值,得静态预测较动态预测要精确,同时由图6可观察出预测与实际值的误差不大。