Loi de probabilité à queue lourde
Dans la théorie des probabilités, une loi de probabilité à queue lourde est une loi de probabilité dont les queues ne sont pas exponentiellement bornées[1], ce qui signifie qu'elles ont des queues plus « lourdes » que la loi exponentielle. Dans de nombreuses applications, c'est la queue droite de la distribution qui est intéressante, mais une distribution peut avoir une queue lourde à gauche, ou les deux queues peuvent être lourdes.
Il y a trois sous-classes importantes de lois à queue lourde, les lois à queue épaisse, les lois à longue queue et les lois sous-exponentielles. Dans la pratique, toutes les lois à queue lourde couramment utilisées appartiennent à la classe sous-exponentielle.
Définitions
modifierLoi à queue lourde
modifierLa loi d'une variable aléatoire X de fonction de répartition F est dite à queue lourde (à droite) si sa fonction génératrice des moments MX(t), est infinie pour tout t > 0., soit[2],[3]:
On peut traduire cette propriété en termes de densité de distribution de queue
comme
Loi à queue longue
modifierLa loi d'une variable aléatoire X de fonction de répartition F est dite à queue longue (à droite) si [1]
ou
On peut le comprendre ainsi : à partir d'un certain niveau, la probabilité qu'une variable aléatoire à queue longue dépasse un niveau supérieur tend vers 1.
Une loi à queue longue est nécessairement à queue lourde, mais la réciproque est fausse : il est possible de construire des lois à queue lourde mais pas longue
Lois sous-exponentielles
modifierLa sous-exponentialité est définie en termes de convolution de densités de probabilités. Pour deux variables aléatoires iid de même fonction de répartition , la convolution de avec elle-même, notée , est définie par l'intégrale de Lebesgue-Stieltjes :
et la convolution d'ordre n est définie par récurrence :
La fonction de répartition de queue est telle que .
Une loi de fonction de répartition est dite sous-exponentielle (à droite)[1],[4],[5] si :
On en déduit[6]:
On peut y voir l'interprétation probabiliste suivante[6]: pour une somme de variables aléatoires iid de loi commune ,
On désigne cette propriété comme le principe du grand saut simple[7] ou principe de la catastrophe[8]
Une loi sur la droite réelle complète est sous-exponentielle si la loi l'est[9]; la fonction est la fonction indicatrice de la demi-droite positive. De façon alternative, une variable aléatoire réelle est sous-exponentielle ssi est sous-exponentielle.
Toutes les lois sous-exponentielles sont à queue longue, mais on peut construire des lois à queue longue mais non sous-exponentielles.
Exemples de lois à queue lourde
modifierParmi les lois classiques à queue lourde, toutes sont sous-exponentielles[6].
Dans les lois à queue lourde à droite, on trouve :
- la loi de Pareto ;
- la loi log-normale ;
- la loi de Lévy ;
- la loi de Weibull avec un paramètre de forme compris entre 0 et 1 ;
- la loi de Burr ;
- la loi log-logistique ;
- la loi log-gamma ;
- la loi de Fréchet ;
- la loi q-normale
- la loi log-Cauchy, parfois décrite comme ayant une "queue super-lourde" car elle montre une croissance logarithmique produisant une queue plus lourde que celle de la loi de Pareto[10],[11].
Parmi les lois à deux queues lourdes :
- la loi de Cauchy, elle-même cas particulier de la loi stable et de la loi de Student ;
- la famille des lois stables[12], à l'exception de la loi normale, qui est un cas particulier de cette famille. Certaines lois stables sont à une queue, comme la loi de Lévy.
- la loi de Student.
- la loi cascade log-normale asymétrique[13].
Relation aux lois à queue épaisse
modifierUne loi à queue épaisse (en) est une loi pour laquelle la densité de probabilités, pour de grandes valeurs de x, décroit en . Puisqu'une fonction puissance est toujours bornée par une fonction exponentielle, les lois à queue épaisse sont toujours à queue lourde. Certaines lois, cependant, ont une queue qui décroit vers 0 plus lentement que la fonction exponentielle (dont sont à queue lourde), mais plus rapidement qu'une fonction puissance (donc pas à queue épaisse).
Références
modifier- (en) Cet article est partiellement ou en totalité issu de l’article de Wikipédia en anglais intitulé « Heavy-tailed distribution » (voir la liste des auteurs).
- (en) Søren Asmussen, Applied probability and queues : Stochastic Modelling and Applied Probability, Berlin, Springer, , 438 p. (ISBN 978-0-387-00211-8 et 1441918094, lire en ligne)
- (en) Tomasz Rolski, Hanspeter Schmidli, Volker Schmidt et Jozef Teugels, Stochastic Processes for Insurance & Finance, (ISBN 9780471959250, DOI 10.1002/9780470317044)
- (en) Sergey Foss, Dmitry Korshunov et Stan Zachary, An Introduction to Heavy-Tailed and Subexponential Distributions, Springer Science & Business Media,
- (en) V. P. Chistyakov, « A Theorem on Sums of Independent Positive Random Variables and Its Applications to Branching Random Processes », ResearchGate, (lire en ligne, consulté le )
- (en) Jozef L. Teugels, « The Class of Subexponential Distributions », Annals of Probability, Université de Louvain, vol. 3, no 6, (DOI 10.1214/aop/1176996225 , lire en ligne, consulté le )
- (en) Embrechts P., Klueppelberg C. et Mikosch T., Modelling extremal events for insurance and finance, vol. 33, Berlin, Springer, coll. « Stochastic Modelling and Applied Probability », (ISBN 978-3-642-08242-9, DOI 10.1007/978-3-642-33483-2)
- (en) S. Foss, T. Konstantopoulos et S. Zachary, « Discrete and Continuous Time Modulated Random Walks with Heavy-Tailed Increments », Journal of Theoretical Probability, vol. 20, no 3, , p. 581 (DOI 10.1007/s10959-007-0081-2, arXiv math/0509605, S2CID 3047753, CiteSeerx 10.1.1.210.1699, lire en ligne)
- (en) Adam Wierman, « Catastrophes, Conspiracies, and Subexponential Distributions (Part III) », sur Rigor + Relevance blog, RSRG, Caltech, (consulté le )
- (en) E. Willekens, « Subexponentiality on the real line », Technical Report, K.U. Leuven,
- (en) M. Falk, J. Hüsler et R. Reiss, Laws of Small Numbers: Extremes and Rare Events, Springer, (ISBN 978-3-0348-0008-2), p. 80
- (en) M.I.F. Alves, L. de Haan et C. Neves, « Statistical inference for heavy and super-heavy tailed distributions » [archive du ] [PDF], (consulté le )
- (en) John P. Nolan, « Stable Distributions: Models for Heavy Tailed Data » [archive du ] [PDF], (consulté le )
- (en) Stephen Lihn, « Skew Lognormal Cascade Distribution » [archive du ] [PDF], (consulté le )