
2.1 时间序列的统计概念
我们简要地回顾一下统计分布的一些基本性质和随机变量的矩,设Rk表示k−维欧几里得空间,表示x是Rk的中的点,考虑两个随机向量
和
令
表示X在子空间
中,且Y在子空间
中的概率,由此可以得到这两个随机向量的一些统计概念。
2.1.1 联合分布函数
参数为θ的X 与Y的联合分布表示为:

其中不等号“≤”是分量对分量的运算;X和Y的规律由刻画。如果X和Y的联合概率密度函数
存在,则:

这时,X和Y是连续型随机向量。
2.1.2 边际分布
X的边际分布是:

这样,X的边际分布可通过对Y求积分得到,同理,Y的边际分布也可类似得到。
如果k=1,X是一个一元随机变量,其分布函数为:

称为X的累积分布函数(Cumulative Distribution function,CDF)。一个随机变量的CDF是非降的(即对有
且有
2.1.3 概率分布
对于时间序列我们这样来定义它的概率分布:任取正整数m,任取t1,t2,…,tm∈T,则m维随机向量
的联合概率分布记为:

由这些有限维分布函数构成的全体:

就称为序列{Xt}的概率分布族。
2.1.4 特征统计量
一种更为简单,更实用的描述时间序列统计特征的方法是研究该序列的低阶矩,特别是均值、方差、自协方差和自相关系数,它们也称为特征统计量。
尽管这些特征统计量并不能描述出随机序列的主要概率特征,但是由于它们的概率意义明显,易于计算,而且往往能代表随机序列的主要概率特征,所以我们对时间序列进行分析,主要就是通过分析这些特征量的统计特征,推断出随机序列的性质。
1.均值
对时间序列而言,任意时刻的序列值Xt都是一个随机变量,都有它自己的概率分布,记Xt的分布函数为Ft(X )。只要满足条件:

就一定存在某个常数µt,使得随机变量Xt总是围绕在常数值µt附近做随机波动。我们称µt为序列{Xt}在t时刻的均值函数:

当t 取遍所有的观察时刻时,就得到一个均值函数序列它反映的是时间序列
每时每刻的平均水平。
2.方差
当时,可以将时间序列的方差函数定义为用以描述序列值围绕其均值做随机波动时的平均波动程度:

同样,当t取遍所有的观察时刻时,我们得到的一个方差函数序列
3.自协方差函数
类似于协方差函数和相关系数的定义,在时间序列分析中我们定义自协方差函数(Autocovariance Function)和自相关系数(Autocorrelation Function)的概念。
对于时间序列任取t,s∈T,定义γ(t,s)为序列{Xt}的自协方差函数:

考虑时间序列Xt与它的过去值Xt−l的线性相关性时,可以把相关系数的概念推广到自相关系数。Xt与Xt−l的相关系数称为Xt的间隔为l 的自相关系数,通常记为在弱平稳性的假定下它只是l的函数。定义ρ(t ,s)为时间序列{Xt}的自相关系数,简记为ACF。

之所以称它们为自协方差函数和自相关系数是因为通常的协方差函数和相关系数度量的是两个不同的事件彼此之间的相互影响程度;而自协方差函数和自相关系数度量的是同一事件在两个不同时期之间的相关程度,形象地讲就是度量自己过去的行为对自己现在的影响。