Loi de probabilité à queue lourde

Dans la théorie des probabilités, une loi de probabilité à queue lourde est une loi de probabilité dont les queues ne sont pas exponentiellement bornées[1], ce qui signifie qu'elles ont des queues plus « lourdes » que la loi exponentielle. Dans de nombreuses applications, c'est la queue droite de la distribution qui est intéressante, mais une distribution peut avoir une queue lourde à gauche, ou les deux queues peuvent être lourdes.

Long tail.

Il y a trois sous-classes importantes de lois à queue lourde, les lois à queue épaisse, les lois à longue queue et les lois sous-exponentielles. Dans la pratique, toutes les lois à queue lourde couramment utilisées appartiennent à la classe sous-exponentielle.

Définitions

modifier

Loi à queue lourde

modifier

La loi d'une variable aléatoire X de fonction de répartition F est dite à queue lourde (à droite) si sa fonction génératrice des moments MX(t), est infinie pour tout t > 0., soit[2],[3]:

 

On peut traduire cette propriété en termes de densité de distribution de queue

 

comme

 

Loi à queue longue

modifier

La loi d'une variable aléatoire X de fonction de répartition F est dite à queue longue (à droite) si [1]

 

ou

 

On peut le comprendre ainsi : à partir d'un certain niveau, la probabilité qu'une variable aléatoire à queue longue dépasse un niveau supérieur tend vers 1.

Une loi à queue longue est nécessairement à queue lourde, mais la réciproque est fausse : il est possible de construire des lois à queue lourde mais pas longue

Lois sous-exponentielles

modifier

La sous-exponentialité est définie en termes de convolution de densités de probabilités. Pour deux variables aléatoires iid   de même fonction de répartition  , la convolution de   avec elle-même, notée  , est définie par l'intégrale de Lebesgue-Stieltjes :

 

et la convolution d'ordre n   est définie par récurrence :

 

La fonction de répartition de queue   est telle que  .

Une loi de fonction de répartition   est dite sous-exponentielle (à droite)[1],[4],[5] si :

 

On en déduit[6]:

 

On peut y voir l'interprétation probabiliste suivante[6]: pour une somme de   variables aléatoires iid   de loi commune  ,

 

On désigne cette propriété comme le principe du grand saut simple[7] ou principe de la catastrophe[8]

Une loi   sur la droite réelle complète est sous-exponentielle si la loi   l'est[9]; la fonction   est la fonction indicatrice de la demi-droite positive. De façon alternative, une variable aléatoire   réelle est sous-exponentielle ssi   est sous-exponentielle.

Toutes les lois sous-exponentielles sont à queue longue, mais on peut construire des lois à queue longue mais non sous-exponentielles.

Exemples de lois à queue lourde

modifier

Parmi les lois classiques à queue lourde, toutes sont sous-exponentielles[6].

Dans les lois à queue lourde à droite, on trouve :

Parmi les lois à deux queues lourdes :

Relation aux lois à queue épaisse

modifier

Une loi à queue épaisse (en) est une loi pour laquelle la densité de probabilités, pour de grandes valeurs de x, décroit en  . Puisqu'une fonction puissance est toujours bornée par une fonction exponentielle, les lois à queue épaisse sont toujours à queue lourde. Certaines lois, cependant, ont une queue qui décroit vers 0 plus lentement que la fonction exponentielle (dont sont à queue lourde), mais plus rapidement qu'une fonction puissance (donc pas à queue épaisse).

Références

modifier
  1. a b et c (en) Søren Asmussen, Applied probability and queues : Stochastic Modelling and Applied Probability, Berlin, Springer, , 438 p. (ISBN 978-0-387-00211-8 et 1441918094, lire en ligne)
  2. (en) Tomasz Rolski, Hanspeter Schmidli, Volker Schmidt et Jozef Teugels, Stochastic Processes for Insurance & Finance, (ISBN 9780471959250, DOI 10.1002/9780470317044)
  3. (en) Sergey Foss, Dmitry Korshunov et Stan Zachary, An Introduction to Heavy-Tailed and Subexponential Distributions, Springer Science & Business Media,
  4. (en) V. P. Chistyakov, « A Theorem on Sums of Independent Positive Random Variables and Its Applications to Branching Random Processes », ResearchGate,‎ (lire en ligne, consulté le )
  5. (en) Jozef L. Teugels, « The Class of Subexponential Distributions », Annals of Probability, Université de Louvain, vol. 3, no 6,‎ (DOI 10.1214/aop/1176996225  , lire en ligne, consulté le )
  6. a b et c (en) Embrechts P., Klueppelberg C. et Mikosch T., Modelling extremal events for insurance and finance, vol. 33, Berlin, Springer, coll. « Stochastic Modelling and Applied Probability », (ISBN 978-3-642-08242-9, DOI 10.1007/978-3-642-33483-2)
  7. (en) S. Foss, T. Konstantopoulos et S. Zachary, « Discrete and Continuous Time Modulated Random Walks with Heavy-Tailed Increments », Journal of Theoretical Probability, vol. 20, no 3,‎ , p. 581 (DOI 10.1007/s10959-007-0081-2, arXiv math/0509605, S2CID 3047753, CiteSeerx 10.1.1.210.1699, lire en ligne)
  8. (en) Adam Wierman, « Catastrophes, Conspiracies, and Subexponential Distributions (Part III) », sur Rigor + Relevance blog, RSRG, Caltech, (consulté le )
  9. (en) E. Willekens, « Subexponentiality on the real line », Technical Report, K.U. Leuven,‎
  10. (en) M. Falk, J. Hüsler et R. Reiss, Laws of Small Numbers: Extremes and Rare Events, Springer, (ISBN 978-3-0348-0008-2), p. 80
  11. (en) M.I.F. Alves, L. de Haan et C. Neves, « Statistical inference for heavy and super-heavy tailed distributions » [archive du ] [PDF], (consulté le )
  12. (en) John P. Nolan, « Stable Distributions: Models for Heavy Tailed Data » [archive du ] [PDF], (consulté le )
  13. (en) Stephen Lihn, « Skew Lognormal Cascade Distribution » [archive du ] [PDF], (consulté le )