在几率论中,重尾分布(英语:Heavy-tailed distribution)是一种几率分布的模型,它的尾部比指数分布还要厚。在许多状况中,通常右边尾部的分布会比较受到重视,但左边尾部比较厚,或是两边尾部都很厚的状况,也会被认为是一种重尾分布。
重尾分布之中,又有两个子类型,分别称为长尾分布(long-tailed distributions)以及次指数分布(subexponential distributions)。
重尾分布[编辑]
在一个累积分布函数中,一个随机变量 X 的分布状况,在以下状况时,被称为是一个重尾分布。假设:
![{\displaystyle \lim _{x\to \infty }e^{\lambda x}\Pr[X>x]=\infty \quad {\mbox{for all }}\lambda >0.\,}](https://wikimedia.org/api/rest_v1/media/math/render/svg/97e2d140666dca7c23aa221fe898d4f9340fec48)
如果以尾部分布函数的方式来呈现时,
![{\displaystyle {\overline {F}}(x)\equiv \Pr(X>x)\,}](https://wikimedia.org/api/rest_v1/media/math/render/svg/aaf349e91f953393a322798d2c799ef96886f550)
最后可以被写成:
![{\displaystyle \lim _{x\to \infty }e^{\lambda x}{\overline {F}}(x)=\infty \quad {\mbox{for all }}\lambda >0.\,}](https://wikimedia.org/api/rest_v1/media/math/render/svg/8e57db77b7cbc0d768880e379af930f6aaa89d98)
这相当于一个动差生成函数 F, MF(t) ,对所有的t > 0 来说,都是无限的[1]。
重尾分布的左尾,与双尾分布,定义相同。
长尾分布[编辑]
在一个累积分布函数中,一个随机变量 X 的分布,出现以下状况时,被称为是一个长尾分布。假设对所有t > 0 :
![{\displaystyle \lim _{x\to \infty }\Pr[X>x+t|X>x]=1,\,}](https://wikimedia.org/api/rest_v1/media/math/render/svg/9f7bd44e6fd7104d03335f83ad1e9759cdf643f3)
这相等于
![{\displaystyle {\overline {F}}(x+t)\sim {\overline {F}}(x)\quad {\mbox{as }}x\to \infty .\,}](https://wikimedia.org/api/rest_v1/media/math/render/svg/e4830dc912483fd34e658467ba70c91c0a802d38)
对一个右尾部形成长尾分布的状况,我们可以做一个直观的解释:假如一个长尾分布的尾部数量超过某个很高的水准,它超过另一个更高水准的几率会接近于一。也就是说,如果你发现状况很糟,它可能会比你想像的还要糟。
长尾分布是重尾分布中的一个特例。所有的长尾分布都是重尾分布,但反之则不然,也就是说,我们可以找出某一个重尾分布,它不是长尾分布。
次指数分布[编辑]
次指数分布是以几率分布的折积定义出来的。两个独立、不同的随机变数
的共同分布函数
,它自己的折积定义为
,使用勒贝格-史台杰斯积分(Lebesgue–Stieltjes integration)
定义为:
![{\displaystyle \Pr[X_{1}+X_{2}\leq x]=F^{*2}(x)=\int _{-\infty }^{\infty }F(x-y)\,dF(y).}](https://wikimedia.org/api/rest_v1/media/math/render/svg/b3902f84eb1b2b3896d5e8721d2ec3acd3d320d4)
n-fold折积的
也以同样方式定义。其尾端分布函数
定义为
。
当以下式子成立,几率分布函数
在正的中线(positive half-line)上,被定义为次指数分布:
![{\displaystyle {\overline {F^{*2}}}(x)\sim 2{\overline {F}}(x)\quad {\mbox{as }}x\to \infty .}](https://wikimedia.org/api/rest_v1/media/math/render/svg/659b305c6390d626832c7b1ea1a3363366d0e612)
这也意味着,对所有
来说:
![{\displaystyle {\overline {F^{*n}}}(x)\sim n{\overline {F}}(x)\quad {\mbox{as }}x\to \infty .}](https://wikimedia.org/api/rest_v1/media/math/render/svg/78352bcb8d15897e83a3213ccebf99bcb34d02d5)
- ^ Rolski, Schmidli, Scmidt, Teugels, Stochastic Processes for Insurance and Finance, 1999