Liste de lois de probabilité

Cette liste de lois de probabilité donne un aperçu des lois de probabilité utilisées en théorie des probabilités et en statistiques.

Préambule

Toute fonction f(x), définie, intégrable et non négative sur un domaine A, peut servir de distribution de probabilité d'une variable aléatoire X prenant des valeurs dans le domaine A. Il faut et il suffit qu'elle soit multipliée par un facteur a qui assure que la « probabilité totale » — la somme ou l'intégrale des f(x) sur le domaine — soit égale à 1 (100 % de probabilité).

Lorsque la fonction f(x|θ) dépend d'un paramètre, le facteur a(θ) est appelé fonction de partition.
Une définition plus exacte et rigoureuse existe, valable également lorsque le domaine n'est pas simplement dénombrable ou continu.

Il y a donc une infinité de distributions possibles. Cependant, certaines sont plus courantes, plus utiles dans les applications pratiques ou plus importantes dans la théorie. Celles-ci ont en général reçu un nom particulier.

Convention de terminologie et notations
L'intersection du langage scientifique avec la langue vernaculaire a obscurci le sens rigoureux des termes « probabilité », « distribution » ou « loi ». En toute rigueur,
  • Fonction de répartition : FX(x) signifie la probabilité P(Xx).
  • Fonction de probabilité : fX(k) ou pX(k) signifie la probabilité de masse discrète P(X=k).
  • Fonction de densité fX(x) signifie la dérivée (continue) de la fonction de répartition.
  • Distribution (de probabilité) signifie le modèle auquel répond la variable (discret ou continu ou autre, fonctions de répartition et de densité/probabilité, fonctions génératrices, etc.).
  • Loi est un terme indûment[réf. nécessaire] utilisé par les Français (pas les francophones de Belgique ou du Canada) au lieu de « distribution ». En science, « loi » signifie un modèle théorique, une affirmation, comme les lois de Kepler ou de la thermodynamique. Ainsi, par exemple, la loi de Zipf (Zipf's Law) énonce que les fréquences de mots d'un texte suivent la distribution de Zipf (Zipf Distribution). Un Français dirait «Selon la loi de Zipf, les fréquences (…) suivent la loi de Zipf», ce qui n'est manifestement pas très compréhensible[non neutre].

On donne pour certaines distributions la forme fonctionnelle : il s'agit de la structure de dépendance de f(.) par rapport à la v.a., dépouillée de sa fonction de partition. Pour la formule complète, se référer à l'article correspondant. On a choisi d'utiliser k pour les valeurs d'une v.a. discrète et x pour une v.a. continue.

Distributions discrètes

Ces lois sont définies sur un support dénombrable, non continu (en général, des entiers). Le mot « discret » signifie « non continu ».

Domaine fini

Fonction de masse d'une loi uniforme discrète. Chacun des n éléments a une probabilité 1/n de sortir. Dans la figure, n = 5.
Fonctions de masse de plusieurs lois binomiales.
  • La loi uniforme discrète décrit un tirage aléatoire à n résultats possibles équiprobables : pile ou face, dé, roulette de casino, tirage d'une carte.
  • La loi triangulaire discrète décrit la somme de deux uniformes indépendantes de même paramètre : résultat du jet de deux dés.
  • La loi de Bernoulli décrit un tirage aléatoire à deux résultats possibles, de probabilités respectives p et 1-p. Des exemples courants : pile ou face (probabilité p=1/2), homme ou femme, produit valable ou défectueux, etc.
    • La loi de Rademacher est une Bernoulli équiprobable (p=1/2) où le succès vaut 1 et l'échec −1.
  • La loi de Markov-Pólya (à ne pas confondre avec la loi binomiale négative généralisée à un paramétrage non entier qui peut parfois aussi s'appeler loi de Pólya), qui compte de nombre de boules blanches tirées dans une urne contenant des boules blanches et noires après un certain nombre de tirages.
    • La loi binomiale correspond à la loi de Markov-Pólya dans le cas de tirages avec remise simple (on remet la boule que l'on vient de piocher dans l'urne). Elle compte ainsi le nombre de succès d'une série de n tirages Bernoulli indépendants de probabilité de succès p connue.
      • La loi Poisson binomiale décrit le résultat d'une série de tirages de Bernoulli indépendants dont la probabilité de succès p n'est pas constante.
    • La loi hypergéometrique correspond à la loi de Markov-Pólya pour des tirages sans remise. Ainsi elle décrit le résultat d'une série de tirages de Bernoulli dépendants.
    • La loi bêta-binomiale correspond à la loi de Markov-Pólya dans le cas de tirages avec remise double (on remet la boule que l'on vient de piocher dans l'urne à laquelle on ajoute une autre boule de la même couleur). Elle décrit également le résultat d'une série de tirages de Bernoulli indépendants de probabilité de succès p aléatoire de loi bêta. Plus précisément la loi bêta-binomiale est un mélange de lois Bernoulli-bêta.
  • Il existe des variantes (« généralisations ») de la loi hypergéométrique qui modifient la probabilité relative de tirage des boules :
  • La loi de Zipf est une distribution puissance, appliquée à la distribution des tailles ou des fréquences en fonction du rang, par exemple dans le calcul des fréquences relatives de mots dans un texte, ou celui des tailles relatives des villes d'un pays.
  • La loi de Benford décrit la fréquence relative des chiffres initiaux d'un ensemble de nombres. Elle est utilisée pour identifier le caractère artificiel de certains ensembles de données (fraudes économiques ou scientifiques).

Domaine infini

Fonctions de masse de différentes lois de Poisson.
Fonction de masse de différentes lois de Skellam.

Distributions continues

Sur un intervalle borné

Fonction de densité de la loi uniforme continue sur le segment [a, b].
Fonctions de densité de plusieurs lois bêta.
  • La loi uniforme continue exprime l'équiprobabilité sur tous les points d'un intervalle fini [a,b].
    • La loi rectangulaire est l'uniforme sur le domaine [-1/2, +1/2].
    • La loi triangulaire continue est la distribution de la somme de deux variables uniformes (convolution de deux distributions uniformes).
    • La loi de Irwin-Hall est la distribution de la somme de n variables uniformes [0,1] indépendantes.
    • La loi Bates, selon les sources, est la distribution de la moyenne de n variables uniformes [0,1] indépendantes.
  • La loi bêta est distribuée dans [0,1]. Elle sert par exemple à estimer les valeurs possibles d'une probabilité.
    • La loi bêta peut s'adapter sur un intervalle quelconque [c, d].
    • La loi arc sinus est un cas spécial de la loi bêta, sur [0,1] ou sur [c,d].
    • La distribution PERT, en ingénierie, et le modèle de Balding–Nichols, en génétique, sont des Bêta avec des paramètres particuliers.
    • La loi uniforme est un cas particulier de la loi bêta (a=b=1). La loi de Xenakis est aussi un cas particulier de loi Bêta.
    • La loi power-beta est celle d'une puissance d'une loi bêta ; elle se situe entre une loi bêta et une loi Kumaraswamy.
  • La loi Kumaraswamy est très proche de la loi bêta ; les formules de ses fonctions de densité et de répartition sont plus faciles à utiliser.
  • La loi bêta généralisée a des cas particuliers parmi toutes les catégories décrites ici.
  • La loi sub-bêta est la distribution de la fraction X(X+Y) quand X et Y suivent des lois exponentielles indépendantes.
  • La loi alpha est distribuée sur [0,1].
  • La loi de Pearson Type II est une loi bêta symétrique autour de zéro. Elle a pour limite la loi normale.
  • La loi du cosinus surélevé sur un intervalle [-s,+s]
  • La loi réciproque
  • La loi parabolique ou loi en U
  • La loi puissance
  • La loi logarithmique continue
  • La loi du demi-cercle de Wigner, ou de Sato-Tate, ou loi elliptique, joue un rôle dans la théorie des matrices aléatoires (distribution des valeurs propres).
  • La loi logit-normale, sur (0,1), est la distribution d'une variable dont la transformée logit est une v.a. normale.
  • La normale peut bien sûr être tronquée sur un domaine fini [c, d].
  • La loi de von Mises ou de Tikhonov ou loi normale circulaire établit la distribution d'angles ou de directions sur le cercle [0, 2π]. N.B.: cette loi peut être vue comme une distribution bivariée sur le cercle. Voir ci-dessous.

Sur un intervalle semi-fini

Fonctions de densité de lois du χ².
Fonction de densité de lois exponentielles.
Fonctions de densité de lois Gamma.
Fonctions de densité de lois de Pareto.
  • La loi exponentielle mesure le temps d'attente avant la survenance d'un événement aléatoire dans un processus de Poisson (ou, alternativement, la durée entre deux événements consécutifs). C'est un cas particulier de la loi Gamma.
  • La loi Gamma ou loi de Pearson Type III mesure le temps d'attente avant la survenance de N événements aléatoires dans un processus de Poisson. Elle généralise la loi exponentielle.
    • La loi d'Erlang est un autre nom de la distribution Gamma lorsque le paramètre N est entier.
    • La loi log-Gamma est la distribution d'une variable dont le logarithme suit une distribution Gamma.
  • La loi Gamma généralisée a beaucoup de cas particuliers, selon l'exposant de x dans l'exponentielle.
    • La loi inverse-gamma ou loi de Pearson Type V est la distribution d'une variable X dont l'inverse 1X suit une distribution Gamma.
    • La loi de Nakagami sert à modéliser la racine carrée d'une Gamma.
    • La loi de Rayleigh sert, entre autres, à distribuer la distance à l'origine d'un point tiré d'une Normale bivariée centrée en (0,0).
    • La loi de Rice est une généralisation de la loi de Rayleigh : distance d'une variable aléatoire normale bivariée à un point quelconque du plan.
  • La loi de Wald, ou loi inverse-gaussienne, est la distribution du temps d'attente d'un mouvement brownien.
    • La loi Ex-Wald, est la convolution (somme) d'une loi de Wald et d'une loi exponentielle.
  • La loi de Lévy est distribuée sur [µ,∞[ . (Voir loi stable)
  • La loi du χ² — prononcé « khi-carré » ou, parfois en France, « khi-deux » — est la distribution de la somme des carrés de n variables aléatoires Normales Standard indépendantes. Elle sert à décrire la distribution d'une variance d'échantillon. Elle a des applications dans les tests d'ajustement de données de comptage. C'est un cas particulier de la loi Gamma.
    • La loi du χ² non centrée est la distribution de la somme des carrés de n variables aléatoires normales (µ,1) indépendantes.
    • La loi inverse-χ² est la distribution d'une variable X dont l'inverse 1X suit une distribution Khi-carré.
    • La loi inverse-χ² recalibrée
    • La loi du χ décrit la distribution de la racine carrée d'une khi-carrée, par exemple un écart-type d'échantillon.
    • La loi du χ non centrée décrit la distribution de la racine carrée d'une khi-carrée non centrée.
  • La loi bêta prime (β'), ou loi Bêta II ou loi de Pearson de type VI, est la distribution du ratio de deux v.a. exponentielles indépendantes.
    • La loi bêta prime généralisée a pour cas particuliers la β', la Gamma composée, la loi de Dagum, la loi log-logistique, la loi de Burr.
    • La loi gamma composée est la distribution d'une v.a. Gamma dont le paramètre (λ) est distribué selon une Gamma. C'est un cas particulier (p=1) de la Bêta prime généralisée.
    • La loi log-logistique, ou distribution de Fisk, est la loi d'une variable aléatoire dont le logarithme est distribué selon une Loi logistique. Elle est utilisée pour modéliser des durées de vie, des débits de cours d'eau, des distributions de revenus.
    • La loi de Burr, ou de Singh-Maddala, ou loi log-logistisque généralisée, est communément utilisée pour étudier les revenus des ménages.
    • La loi de Dagum, ou Burr inverse, est la distribution de l'inverse d'une v.a. de distribution Burr. Il existe une loi de Dagum de type I à trois paramètres et une loi de Dagum de type II à quatre paramètres, qui ajoute un point de masse en zéro.
  • La loi F ou loi de Fisher ou de Fisher-Snedecor est la distribution du ratio de deux variables suivant une loi khi-2 indépendantes normalisées (c.-à.-d. divisées par leur degré de liberté). Elle s'utilise pour effectuer des tests en régression multiple et en analyse de la variance (ANOVA). Le carré d'une variable T de Student est une variable F de paramètre (1,m).
    • Le T² de Hotelling est la distribution d'une transformée de F, qui s'utilise pour effectuer des tests d'analyse de variance.
    • La loi F non centrée généralise la loi F au ratio de deux v.a. khi-carrées non centrées indépendantes normalisées.
    • La distribution du ratio de deux v.a. khi-carrées indépendantes non normalisées (c.-à.-d. non divisées par leur degré de liberté) est la loi bêta prime.
  • Distributions dérivées de la normale
  • La loi de Pareto a des applications dans l'étude de la répartition des richesses, entre autres. Elle a quatre types.
    • La Pareto (type I), ou « distribution puissance ».
    • La Pareto type II.
    • La Pareto type III.
    • La Pareto type IV.
  • La loi de Feller-Pareto est une généralisation supplémentaire de la type IV, à 5 paramètres.
  • La loi de Pareto généralisée a pour support [µ,∞[ si c > 0 et [µ,µ-bc[ si c > 0. Elle se réduit à une exponentielle si c tend vers 0.
  • Distributions d'extrema (voir GEV ou loi de Fisher-Tippett)
    • La loi de Weibull ordinaire, ou de Rosin-Rammler, est la distribution d'un minimum. Elle décrit la durée de vie de composants techniques, ou la distribution des tailles des particules produites par des opérations de concassage. Elle a pour cas particuliers la loi exponentielle (a=1) et la loi de Rayleigh (a=2).
    • La poly-Weibull est la distribution du minimum de plusieurs Weibull de paramètres différents.
    • La Weibull exponentiée est une généralisation.
    • La loi de Weibull renversée, ou loi de Fisher-Tippett de type III, est la distribution d'un maximum. Elle a pour domaine x<m.
    • La loi de Fréchet, ou loi de Fisher-Tippett de type II, est aussi une distribution de maximum. Son domaine est x>0.
    • La loi de Gumbel (de type 2) généralise la loi de Fréchet.
    • La loi de Gompertz, une Gumbel renversée, décrit des extrema et des taux de mortalité.
    • La loi de Gompertz avec dérive, décrit le maximum d'une loi exponentielle et d'une loi de Gumbel.
    • La loi gamma-Gompertz est une mixture gamma de lois Gompertz.
  • La loi Exponentielle-Logarithmique est la distribution du minimum d'un nombre N de variables exponentielles, où N a une distribution logarithmique.
  • La loi de Birnbaum–Saunders, ou loi du temps d'usure, est construite à partir de la normale, appliquée à une transformation . Elle a des applications en contrôle de qualité et modélisation des durées de vie de systèmes mécaniques.
  • La loi de Planck s'utilise en physique statistique.
    • La loi de Davis la généralise en décalant son mode et a été utilisée pour modéliser des distributions de revenus.
  • La loi log-Cauchy est la distribution d'une variable dont le logarithme suit une distribution de Cauchy.
  • La loi log-Laplace est la distribution d'une variable dont le logarithme suit une distribution de Laplace.
  • La loi de Mittag–Leffler est un cas particulier de loi géométrique stable ou loi géo-stable.

Sur la droite des réels

Fonctions de densité de lois stables.
Fonctions de densité de lois de Cauchy.
Fonctions de densité de lois de Laplace.

Lois qui portent le nom de leur forme fonctionnelle :

Domaine variable

  • La loi d'extremum généralisée, ou GEV (pour generalized extreme value) ou loi de Fisher-Tippett, a comme cas particuliers les distributions de Gumbel (ou type I) de domaine égal à l'ensemble des réels, de Fréchet (ou type II) de borne inférieure finie et de Weibull renversée (ou type III) de borne supérieure finie.
  • La loi de Pareto généralisée peut être bornée inférieurement (k≤0) ou bornée des deux côtés (k>0).
  • La loi de Tukey-Lambda a pour domaine la droite des réels ou un intervalle borné selon la valeur d'un de ses paramètres. Elle se définit par ses quantiles ; sa fonction de densité n'a pas de forme close.

Distributions mixtes discrète/continues

Ces distributions ont des points de masse parmi les valeurs continues. L'exemple le plus courant est celui du temps d'attente (à un feu de circulation, à un guichet) : il y a une probabilité que le temps soit égal à zéro s'il ne faut pas attendre (point de masse), puis une distribution continue s'il y a attente.

Distribution singulière

  • La loi de Cantor a un domaine qui n'est ni discret, ni continu, mais fractal.

Distributions multivariées

Lorsque les variables aléatoires sont indépendantes, la fonction de densité de leur distribution conjointe est le produit des fonctions de densité individuelles.

Vecteur de variables aléatoires de domaines indépendants

Vecteur aléatoire de domaine contraint

Simplexe

  • La loi multinomiale généralise la loi binomiale à plus de deux résultats possibles.
    • La loi multihypergéométrique fait de même pour la loi hypergéométrique.
    • La distribution catégorielle, ou multi-Bernoulli, n'est autre que la loi multinomiale lorsque le nombre de tirages N vaut 1. C'est une généralisation de la Bernoulli à une expérience présentant plus de deux résultats possibles. N.B. : elle est parfois présentée comme « distribution à support non numérique » ou « qualitatif », parce qu'elle dénombre la présence de tels critères, par exemple les nationalités dans un sondage.
  • La distribution d'Ewens (en) est une distribution de probabilité sur l'ensemble des partitions d'un entier N, utilisée en génétique des populations.

Disque

  • La distribution d'Airy est uniforme sur un disque.

Sphère

  • La loi de Kent, ou de Fisher-Bingham, est une sorte de normale bivariée sur la sphère tridimensionnelle.
  • La loi de von Mises-Fisher généralise la loi de von Mises sur la sphère N-dimensionnelle.

Matrices aléatoires

Familles

Certaines distributions ont des propriétés utiles qu'elles partagent avec d'autres. Parfois, ces « sœurs » peuvent être formulées comme des cas particuliers d'une expression générale.

Pour une description plus précise de la notion de famille, voir famille exponentielle.

Adaptations

Voir aussi

Articles connexes