还剩18页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
时间序列分析第一章时间序列基础概念时间序列分析是研究按时间顺序收集的数据点序列的统计方法通过探索数据的内在结构(如趋势、季节性、周期性和不规则成分),我们能够理解历史模式并预测未来走势什么是时间序列?时间序列是按照时间顺序排列的观测数据序列,每个数据点与特定时间点相关联这些连续的观测值反映了被研究对象随时间变化的规律与特性常见的时间序列示例经济金融类气象环境类股票价格日涨跌幅每日最高气温••季度增长率月降雨量•GDP•月度消费者价格指数年平均污染指数••企业运营类日销售额•月度网站访问量•时间序列的特点时间序列数据通常由四个基本组成部分构成,理解这些组成部分对于选择合适的分析方法至关重要趋势()季节性()Trend Seasonality序列长期的增长或下降走向,反映数据的长期发展方向例如中国在固定时间间隔内重复出现的周期性波动例如零售业在春节期间的的长期增长趋势、全球温度的上升趋势销售高峰、夏季用电量的增加GDP周期性()随机性()Cycle Noise非固定时间间隔的波动,通常与经济或商业周期相关例如经济的扩不规则波动,无法用模型其他部分解释的随机变动这些波动可能来自张与收缩周期、房地产价格的波动测量误差或不可预见的事件时间序列数据的采集与要求高质量的时间序列分析依赖于规范的数据采集过程和充足的样本量根据北京大学数学系课程标准和行业实践,时间序列数据应满足以下要求样本量要求数据点不少于个时间点,以确保统计推断的可靠性和模型估计的准确性100等间隔观测观测值应在等间隔时间点收集(如每小时、每日、每月),以简化分析过程数据来源数据应来源明确,背景清晰,便于理解数据生成过程和分析实际问题完整性尽量避免缺失值,若存在缺失值应采用适当方法处理(如插值、删除或估计)一致性时间序列与横截面数据的区别在统计分析中,时间序列数据与横截面数据是两种最常见的数据类型,它们在结构和分析方法上存在本质区别时间序列数据横截面数据同一对象随时间变化的连续观测值同一时间点多个对象的观测值••关注时间维度上的变化和发展关注不同对象间的差异和比较••数据点之间存在时间依赖关系数据点之间通常相互独立••适用于趋势分析和预测适用于群体特征和关系研究••例某公司年的月度销售额例年全国个省市的•10•202330GDP两种数据类型也可以结合形成面板数据(),同时捕捉时间变化和个体差异,如年全国个省市的年度数据Panel Data2010-202330GDP数据类型维度分析重点常用方法时间序列时间动态变化、指数平滑ARIMA横截面个体差异比较回归分析、方差分析面板数据时间个体动态差异固定效应、随机效应模型+时间序列示意图趋势、季节性与噪声叠加下图展示了时间序列的经典分解视图,直观呈现了各个组成部分如何相互叠加形成最终观测到的时间序列数据通过分解,我们可以分别观察和研究原始数据包含所有成分的完整时间序列•趋势成分显示长期增长或下降的基本走向•季节性成分展示固定周期的规律性波动•残差(噪声)去除趋势和季节性后的随机波动•理解这种分解对于选择合适的预测模型至关重要强趋势序列可能需要差分处理,显著季节性则需要考虑季节性模型,而高噪声序列可能需要更复杂的随机过程建模第二章时间序列的基本分析方法在掌握时间序列的基本概念后,我们需要学习一系列分析工具和技术,以深入理解数据的内在结构和特性本章将介绍时间序列分析的基础方法,包括平稳性检验、相关性分析、时间序列分解和转换技术这些方法构成了时间序列建模的前期准备工作,帮助我们识别数据特征,为后续模型选择和参数估计提供依据通过这些基本分析,我们能够更准确地把握时间序列的性质,提高预测和分析的可靠性010203数据可视化与初步分析平稳性检验相关性分析绘制时间序列图,观察趋势、季节性和异常值通过统计检验确定序列是否平稳计算自相关函数和偏自相关函数0405时间序列分解数据转换将序列分解为趋势、季节性和随机成分通过差分、对数等变换实现序列平稳化平稳性与非平稳性平稳性是时间序列分析的核心概念,决定了模型选择和分析方法平稳序列的统计特性不随时间变化,使得建模和预测更为可靠平稳序列的特征均值不随时间变化(恒定均值)•方差不随时间变化(恒定方差)•协方差仅与时间间隔有关,与具体时间点无关•不存在明显趋势或季节性波动•例白噪声序列、某些金融资产的收益率序列•非平稳序列的特征均值随时间变化(如存在增长趋势)•方差随时间变化(如波动幅度增大)•存在明显的趋势、季节性或周期性成分•自相关不随时间衰减•例大多数经济指标、股票价格、销售量等•在实际分析中,大多数原始时间序列都是非平稳的,需要通过差分、对数变换等方法转换为平稳序列后再进行建模自相关函数()与偏自相关函数()ACF PACF自相关函数和偏自相关函数是识别时间序列内部依赖结构的重要工具,它们反映了序列不同时间点之间的相关性强度,为模型的参数确定提供ARIMA了重要依据自相关函数()偏自相关函数()ACF PACF测量时间序列与其自身滞后值之间的相关性,反映序列的整体记忆特性测量时间序列与其特定滞后值之间的直接相关性,排除中间滞后值的影响定义定义消除中间滞后影响后,与的相关性•$\rho_k=\frac{CovY_t,Y_{t-k}}{VarY_t}$•$Y_t$$Y_{t-k}$测量序列与其期滞后值的线性相关程度仅测量序列与其期滞后值的直接线性相关•k•k包含直接和间接影响的综合相关性排除了其他滞后期的间接影响••用于识别移动平均()过程的阶数用于识别自回归()过程的阶数•MA•AR平稳序列的会随滞后期数增加而逐渐衰减过程的在滞后期后截尾•ACF•ARp PACF p和图的特征模式可以帮助识别适当的模型类型和阶数过程的逐渐衰减而在阶后截尾;过程的在阶后截尾ACF PACFARIMA ARACF PACF p MAACF q而逐渐衰减;过程则两者都呈现渐进衰减PACF ARMA趋势与季节性分解时间序列分解是将原始序列拆分为几个基本组成部分的过程,有助于更好地理解数据的内在结构,为预测和分析提供基础常用的分解方法包括经典分解法和分解法STL原始数据趋势成分包含所有成分的完整时间序列序列的长期发展方向随机成分季节性成分去除趋势和季节性后的残差固定周期的重复波动主要分解模型加法模型乘法模型$Y_t=T_t+S_t+R_t$$Y_t=T_t\times S_t\times R_t$各组成部分相加得到原始序列各组成部分相乘得到原始序列••季节性波动幅度恒定不变季节性波动幅度随趋势变化••适用于季节变动幅度不随趋势变化的序列适用于季节变动幅度随趋势增大而增大的序列••单位根检验与差分单位根检验是判断时间序列是否平稳的统计方法,而差分是将非平稳序列转换为平稳序列的常用技术这两个工具在模型构建中尤为重要ARIMA单位根检验通过统计检验判断序列是否存在单位根(非平稳性标志)检验()最常用的单位根检验•ADF AugmentedDickey-Fuller Test检验检验序列是否为趋势平稳•KPSS检验检验,对异方差更稳健•PP Phillips-Perron原假设序列存在单位根(非平稳)若值,则拒绝原假设,认为序列平稳p
0.05差分操作通过计算相邻观测值之间的差值消除非平稳性一阶差分,消除线性趋势•$\nabla Y_t=Y_t-Y_{t-1}$二阶差分,消除二次趋势•$\nabla^2Y_t=\nabla\nabla Y_t$季节性差分,消除季节性,为季节周期•$\nabla_s Y_t=Y_t-Y_{t-s}$s差分次数即为模型中的值ARIMA d过度差分会导致模型效率降低,应只进行必要的差分实践中,通常先进行检验判断是否需要差分,然后逐步进行差分直到序列平稳,再通过和图确定适当ADF ACF PACF的模型结构与图示例ACF PACF(自相关函数)和(偏自相关函数)图是识别时间序列模型结构的重要可视化工具通过分析它们的特征模式,我们可以初步判断序列的类ACF PACF型和适当的模型阶数过程的特征过程的特征ARp MAq呈指数衰减或正弦波形式逐渐衰减在滞后期后截尾(突然变为不显著)•ACF•ACF q在滞后期后截尾(突然变为不显著)呈指数衰减或正弦波形式逐渐衰减•PACF p•PACF例的在滞后期后的值接近于零例的在滞后期后的值接近于零•AR2PACF2•MA1ACF1过程的特征ARMAp,q前期后呈指数衰减或正弦波形式•ACF q前期后呈指数衰减或正弦波形式•PACFp两个函数都不会呈现明显的截尾特征•在实际应用中,和图的解读需要结合理论知识和经验判断图中的蓝色阴影区域表示显著性边界,超出该边界的相关系数被认为在ACF PACF统计上显著,表明序列在该滞后期存在相关性第三章时间序列建模核心技术在了解时间序列的基本特性和分析方法后,我们进入时间序列建模的核心内容本章将介绍一系列经典的时间序列模型,这些模型构成了时间序列分析的理论基础和实践工具从简单的自回归模型到复杂的季节性模型,我们将系统学习各类模型的数学原理、参数估计方法、应用条件和预测技巧掌握这些模型对于理解时间序列的生成机制和进行科ARIMA学预测至关重要高级模型1GARCH、VAR、神经网络复合模型
2、、SARIMA ARIMAXVARMA基础混合模型
3、、ARMA ARIMAETS基本模型
4、、简单指数平滑AR MA预处理技术5差分、变换、去季节性自回归模型()AR自回归模型是时间序列分析中最基础的模型之一,它假设当前观测值可以通过过去观测值的线性组合来预测模型在金融、经济、气象等多个领域AR有广泛应用模型定义模型特性ARp AR阶自回归模型的数学表达式平稳性条件特征方程的根必须在单位圆之外p•对于,平稳条件为•AR1$|\phi_1|1$参数估计方法最小二乘法、最大似然法•其中预测利用已知系数和历史值递推计算•识别在滞后期后截尾•PACFp是时刻的观测值•$Y_t$t常见模型是常数项•$c$AR是自回归系数•$\phi_1,\phi_2,...,\phi_p$AR1$Y_t=c+\phi_1Y_{t-1}+\varepsilon_t$是白噪声误差项•$\varepsilon_t$AR2$Y_t=c+\phi_1Y_{t-1}+\phi_2Y_{t-2}+\varepsilon_t$是模型阶数,表示考虑的过去值数量•$p$模型适用于具有短期记忆特性的时间序列,即当前值主要受近期历史值影响的序列模型的阶数通常通过图判断或使用信息准则(如、AR pPACF AIC)确定BIC移动平均模型()MA移动平均模型与自回归模型不同,它假设当前观测值是过去若干期随机冲击(误差项)的线性组合模MA型特别适合捕捉时间序列中的短期波动和随机干扰模型定义MAq阶移动平均模型的数学表达式q其中是时刻的观测值•$Y_t$t是过程的期望值(常数项)•$\mu$是移动平均系数•$\theta_1,\theta_2,...,\theta_q$是白噪声误差项•$\varepsilon_t,\varepsilon_{t-1},...,\varepsilon_{t-q}$是模型阶数,表示考虑的过去冲击数量•$q$模型特性MA任何参数值下过程都是平稳的•MA模型的记忆长度有限,最多为期•MA q参数估计通常使用最大似然法•存在可逆性问题,需满足特定条件•识别在滞后期后截尾•ACF q与模型ARMA ARIMA和模型是时间序列分析中最常用的模型类型,它们结合了自回归和移动平均的特性,能够更全面地捕捉时间序列的动态结构ARMA ARIMA模型模型ARMA ARIMA自回归移动平均模型,结合和的特性差分自回归移动平均模型,处理非平稳序列AR MA适用于已经平稳的时间序列适用于通过差分可转化为平稳的序列参数(自回归阶数)和(移动平均阶数)参数、(差分次数)和p qp dq优势同时考虑历史观测值和随机冲击的影响优势能处理带有趋势的非平稳序列方法Box-Jenkins模型建模的经典方法,包括以下步骤ARIMA010203模型识别参数估计模型诊断通过、图和单位根检验确定、、值使用最大似然法估计模型参数检验残差是否为白噪声,模型是否适当ACF PACFp dq0405模型选择预测应用使用、等信息准则比较不同模型利用最终模型进行预测和分析AIC BIC季节性()ARIMA SARIMA季节性模型是模型的扩展,专门用于处理具有周期性波动的时间序列,如月度销售数据、季ARIMA ARIMA度、日均气温等模型能同时捕捉序列的常规动态和季节性模式GDP SARIMA模型定义SARIMA模型通常表示为,其中SARIMA SARIMAp,d,qP,D,Qs非季节性部分的阶数,与相同•p,d,q ARIMA季节性部分的阶数•P,D,Q季节周期长度(如月度数据,季度数据)•s s=12s=4模型的数学表达式较为复杂,包含非季节性和季节性的、差分和成分AR MA其中是滞后算子,满足B$B^k Y_t=Y_{t-k}$模型特点SARIMA同时处理趋势和季节性的非平稳性•季节性差分消除周期性波动•季节性项捕捉相隔期的自相关•AR s季节性项捕捉相隔期的随机冲击影响•MA s模型参数增多,需更多数据支持估计•指数平滑法()ETS指数平滑法是一类直观而强大的时间序列预测方法,其核心思想是对历史观测值赋予不同的权重,离当前时间越近的观测值权重越大这类方法计算简单,预测效果良好,特别适合短期预测简单指数平滑()霍尔特线性趋势()霍尔特温特季节性(SES Holt-Holt-)Winters适用于无明显趋势和季节性的序列适用于具有趋势但无季节性的序列适用于同时具有趋势和季节性的序列加法模型季节效应幅度恒定•乘法模型季节效应幅度随水平变化其中是平滑参数,取值范围为•$\alpha$[0,1]包含三个平滑方程水平、趋势和季节越大,模型对近期观测值越敏感•$\alpha$性实质上是对所有历史观测的加权平均,权重引入第二个平滑方程估计趋势三个平滑参数、和•$\alpha$$\beta$呈指数衰减和是水平和趋势的平滑参$\alpha$$\beta$$\gamma$数模型()是指数平滑法的状态空间表示,提供了更严格的统计框架,允许计算预测区间并应用信息准则进行模型选择ETS Error,Trend,Seasonal模型拟合与预测实例ARIMA本节展示模型在实际时间序列数据上的应用过程和效果,包括模型拟合、诊断和预测步骤ARIMA模型构建步骤模型评估指标数据可视化绘制原始序列图,观察趋势和季节性均方根误差()
1.•RMSE$\sqrt{\frac{1}{n}\sum_{i=1}^{n}y_i-平稳性检验进行检验,确定差分次数\hat{y}_i^2}$
2.ADF d平均绝对误差()差分转换对原序列进行适当差分,获得平稳序列•MAE$\frac{1}{n}\sum_{i=1}^{n}|y_i-
3.\hat{y}_i|$模型识别分析和图,初步确定、值
4.ACFPACFp q平均绝对百分比误差()•MAPE参数估计拟合多个候选模型
5.ARIMAp,d,q$\frac{100\%}{n}\sum_{i=1}^{n}|\frac{y_i-\hat{y}_i}{y_i}|$模型比较使用、准则选择最优模型
6.AIC BIC预测区间覆盖率实际值落入预测区间的比例•残差诊断检验残差是否为白噪声
7.图中可以看到模型对原始数据的拟合情况(蓝线)以及未来预测预测应用使用最终模型进行预测和评估ARIMA
8.值(红线)和预测区间(灰色区域)模型成功捕捉了数据的整体趋势和短期波动,预测结果与实际走势吻合度较高时间序列建模是一个反复迭代的过程,需要不断尝试不同的模型设定和参数组合,结合专业知识和统计诊断进行判断在实际应用中,还应考虑外部因素的影响,可能需要引入回归项(模型)或使用多变量时间序列模型ARIMAX。
个人认证
优秀文档
获得点赞 0