Toute fonction f(x), définie, intégrable et non négative sur un domaine A, peut servir de distribution de probabilité d'une variable aléatoireX prenant des valeurs dans le domaine A. Il faut et il suffit qu'elle soit multipliée par un facteur a qui assure que la « probabilité totale » — la somme ou l'intégrale des f(x) sur le domaine — soit égale à 1 (100 % de probabilité).
Lorsque la fonction f(x|θ) dépend d'un paramètre, le facteur a(θ) est appelé fonction de partition.
Une définition plus exacte et rigoureuse existe, valable également lorsque le domaine n'est pas simplement dénombrable ou continu.
Il y a donc une infinité de distributions possibles.
Cependant, certaines sont plus courantes, plus utiles dans les applications pratiques ou plus importantes dans la théorie. Celles-ci ont en général reçu un nom particulier.
Convention de terminologie et notations
L'intersection du langage scientifique avec la langue vernaculaire a obscurci le sens rigoureux des termes « probabilité », « distribution » ou « loi ». En toute rigueur,
Fonction de répartition : FX(x) signifie la probabilité P(X ≤ x).
Fonction de probabilité : fX(k) ou pX(k) signifie la probabilité de masse discrèteP(X=k).
Fonction de densitéfX(x) signifie la dérivée (continue) de la fonction de répartition.
Distribution (de probabilité) signifie le modèle auquel répond la variable (discret ou continu ou autre, fonctions de répartition et de densité/probabilité, fonctions génératrices, etc.).
Loi est un terme indûment[réf. nécessaire] utilisé par les Français (pas les francophones de Belgique ou du Canada) au lieu de « distribution ». En science, « loi » signifie un modèle théorique, une affirmation, comme les lois de Kepler ou de la thermodynamique. Ainsi, par exemple, la loi de Zipf (Zipf's Law) énonce que les fréquences de mots d'un texte suivent la distribution de Zipf (Zipf Distribution). Un Français dirait «Selon la loi de Zipf, les fréquences (…) suivent la loi de Zipf», ce qui n'est manifestement pas très compréhensible[non neutre].
On donne pour certaines distributions la forme fonctionnelle : il s'agit de la structure de dépendance de f(.) par rapport à la v.a., dépouillée de sa fonction de partition. Pour la formule complète, se référer à l'article correspondant. On a choisi d'utiliser k pour les valeurs d'une v.a. discrète et x pour une v.a. continue.
Distributions discrètes
Ces lois sont définies sur un support dénombrable, non continu (en général, des entiers). Le mot « discret » signifie « non continu ».
Domaine fini
La loi uniforme discrète décrit un tirage aléatoire à n résultats possibles équiprobables : pile ou face, dé, roulette de casino, tirage d'une carte.
La loi triangulaire discrète décrit la somme de deux uniformes indépendantes de même paramètre : résultat du jet de deux dés.
La loi de Bernoulli décrit un tirage aléatoire à deux résultats possibles, de probabilités respectives p et 1-p. Des exemples courants : pile ou face (probabilité p=1/2), homme ou femme, produit valable ou défectueux, etc.
La loi de Rademacher est une Bernoulli équiprobable (p=1/2) où le succès vaut 1 et l'échec −1.
La loi de Markov-Pólya (à ne pas confondre avec la loi binomiale négative généralisée à un paramétrage non entier qui peut parfois aussi s'appeler loi de Pólya), qui compte de nombre de boules blanches tirées dans une urne contenant des boules blanches et noires après un certain nombre de tirages.
La loi binomiale correspond à la loi de Markov-Pólya dans le cas de tirages avec remise simple (on remet la boule que l'on vient de piocher dans l'urne). Elle compte ainsi le nombre de succès d'une série de n tirages Bernoulli indépendants de probabilité de succès p connue.
La loi Poisson binomiale décrit le résultat d'une série de tirages de Bernoulli indépendants dont la probabilité de succès p n'est pas constante.
La loi hypergéometrique correspond à la loi de Markov-Pólya pour des tirages sans remise. Ainsi elle décrit le résultat d'une série de tirages de Bernoulli dépendants.
La loi bêta-binomiale correspond à la loi de Markov-Pólya dans le cas de tirages avec remise double (on remet la boule que l'on vient de piocher dans l'urne à laquelle on ajoute une autre boule de la même couleur). Elle décrit également le résultat d'une série de tirages de Bernoulli indépendants de probabilité de succès p aléatoire de loi bêta. Plus précisément la loi bêta-binomiale est un mélange de lois Bernoulli-bêta.
Il existe des variantes (« généralisations ») de la loi hypergéométrique qui modifient la probabilité relative de tirage des boules :
La loi de Zipf est une distribution puissance, appliquée à la distribution des tailles ou des fréquences en fonction du rang, par exemple dans le calcul des fréquences relatives de mots dans un texte, ou celui des tailles relatives des villes d'un pays.
La loi de Benford décrit la fréquence relative des chiffres initiaux d'un ensemble de nombres. Elle est utilisée pour identifier le caractère artificiel de certains ensembles de données (fraudes économiques ou scientifiques).
Domaine infini
La loi géométrique décrit le nombre d'essais nécessaires, dans une suite de tirages de Bernoulli, avant d'obtenir un succès.
La loi binomiale négative, ou loi de Pascal, généralise la loi géométrique pour l'obtention de n succès. On l'appelle parfois loi de Pólya lorsqu'elle est généralisée à un paramètre n non entier (à ne pas confondre avec la loi de Markov-Pólya).
La loi de Poisson décrit la probabilité d'observer un certain nombre d'événements aléatoires dans un intervalle continu (durée, longueur). Elle connaît une série de distributions dérivées :
la loi de Poisson décalée pour x > m.
la loi hyper-Poisson
la loi de Conway-Maxwell-Poisson, une extension à deux paramètres de la loi de Poisson permettant un taux de survenance ajustable en fonction des événements déjà produits (files d'attente, grossesses).
La loi de Skellam, distribution de la différence de deux variables de Poisson indépendantes.
La loi logarithmique est basée sur le développement en série de la fonction logarithme. Elle a été utilisée dans la description de populations d'espèces.
La loi zêta, ou loi de Pareto discrète, basée sur la fonction zeta de Riemann, est la distribution de Zipf étendue à un nombre infini d'éléments. Elle a des applications en mécanique statistique et en théorie des nombres.
La loi de Yule-Simon apparaît dans des modèles biologiques. Asymptotiquement elle ressemble à la loi de Zipf.
La loi logit-normale, sur (0,1), est la distribution d'une variable dont la transformée logit est une v.a. normale.
La normale peut bien sûr être tronquée sur un domaine fini [c, d].
La loi de von Mises ou de Tikhonov ou loi normale circulaire établit la distribution d'angles ou de directions sur le cercle [0, 2π]. N.B.: cette loi peut être vue comme une distribution bivariée sur le cercle. Voir ci-dessous.
Sur un intervalle semi-fini
La loi exponentielle mesure le temps d'attente avant la survenance d'un événement aléatoire dans un processus de Poisson (ou, alternativement, la durée entre deux événements consécutifs). C'est un cas particulier de la loi Gamma.
La loi du χ² — prononcé « khi-carré » ou, parfois en France, « khi-deux » — est la distribution de la somme des carrés de n variables aléatoires Normales Standard indépendantes. Elle sert à décrire la distribution d'une variance d'échantillon. Elle a des applications dans les tests d'ajustement de données de comptage. C'est un cas particulier de la loi Gamma.
La loi du χ² non centrée est la distribution de la somme des carrés de n variables aléatoires normales (µ,1) indépendantes.
La loi inverse-χ² est la distribution d'une variable X dont l'inverse 1⁄X suit une distribution Khi-carré.
La loi gamma composée est la distribution d'une v.a. Gamma dont le paramètre (λ) est distribué selon une Gamma. C'est un cas particulier (p=1) de la Bêta prime généralisée.
La loi log-logistique, ou distribution de Fisk, est la loi d'une variable aléatoire dont le logarithme est distribué selon une Loi logistique. Elle est utilisée pour modéliser des durées de vie, des débits de cours d'eau, des distributions de revenus.
La loi de Burr, ou de Singh-Maddala, ou loi log-logistisque généralisée, est communément utilisée pour étudier les revenus des ménages.
La loi de Dagum, ou Burr inverse, est la distribution de l'inverse d'une v.a. de distribution Burr. Il existe une loi de Dagum de type I à trois paramètres et une loi de Dagum de type II à quatre paramètres, qui ajoute un point de masse en zéro.
La loi F ou loi de Fisher ou de Fisher-Snedecor est la distribution du ratio de deux variables suivant une loi khi-2 indépendantes normalisées (c.-à.-d. divisées par leur degré de liberté). Elle s'utilise pour effectuer des tests en régression multiple et en analyse de la variance (ANOVA). Le carré d'une variable T de Student est une variable F de paramètre (1,m).
Le T² de Hotelling est la distribution d'une transformée de F, qui s'utilise pour effectuer des tests d'analyse de variance.
La loi F non centrée généralise la loi F au ratio de deux v.a. khi-carrées non centrées indépendantes normalisées.
La distribution du ratio de deux v.a. khi-carrées indépendantes non normalisées (c.-à.-d. non divisées par leur degré de liberté) est la loi bêta prime.
Distributions dérivées de la normale
La loi log-normale est la distribution d'une variable dont le logarithme suit une distribution Normale. D'après le théorème central limite, elle décrit des phénomènes aléatoires qui sont le produit de plusieurs variables positives indépendantes.
La loi de Pareto a des applications dans l'étude de la répartition des richesses, entre autres. Elle a quatre types.
La Pareto (type I), ou « distribution puissance ».
La Pareto type II.
La loi de Lomax est un cas particulier de Pareto type II.
La Pareto type III.
La Pareto type IV.
La loi de Feller-Pareto est une généralisation supplémentaire de la type IV, à 5 paramètres.
La loi de Pareto généralisée a pour support [µ,∞[ si c > 0 et [µ,µ-b⁄c[ si c > 0. Elle se réduit à une exponentielle si c tend vers 0.
Distributions d'extrema (voir GEV ou loi de Fisher-Tippett)
La loi de Weibull ordinaire, ou de Rosin-Rammler, est la distribution d'un minimum. Elle décrit la durée de vie de composants techniques, ou la distribution des tailles des particules produites par des opérations de concassage. Elle a pour cas particuliers la loi exponentielle (a=1) et la loi de Rayleigh (a=2).
La poly-Weibull est la distribution du minimum de plusieurs Weibull de paramètres différents.
La Weibull exponentiée est une généralisation.
La loi de Weibull renversée, ou loi de Fisher-Tippett de type III, est la distribution d'un maximum. Elle a pour domaine x<m.
La loi de Fréchet, ou loi de Fisher-Tippett de type II, est aussi une distribution de maximum. Son domaine est x>0.
La loi de Gumbel (de type 2) généralise la loi de Fréchet.
La loi de Gompertz, une Gumbel renversée, décrit des extrema et des taux de mortalité.
La loi Exponentielle-Logarithmique est la distribution du minimum d'un nombre N de variables exponentielles, où N a une distribution logarithmique.
La loi de Birnbaum–Saunders, ou loi du temps d'usure, est construite à partir de la normale, appliquée à une transformation . Elle a des applications en contrôle de qualité et modélisation des durées de vie de systèmes mécaniques.
La loi normale, ou courbe de Gauss ou courbe en cloche (« bell curve »), est extrêmement fréquente dans la nature comme dans les applications statistiques, du fait du théorème central limite : tout phénomène modélisable comme une somme de nombreuses variables indépendantes, de moyenne et variance finies, a une distribution asymptotiquement normale.
La loi normale standard (ou centrée réduite) en est le cas le plus simple.
La loi normale généralisée de type I, ou loi de puissance exponentielle ou loi d'erreur généralisée, a été utilisée pour modifier la forme de la normale, sans affecter la symétrie.
La loi de Laplace a pour cas particulier, quand m=0, la Double Exponentielle, qui est la distribution de la différence de deux Exponentielles. C'est une loi stable.
Distributions sans moments
La loi de Cauchy, ou de Breit-Wigner, est la distribution du ratio de deux normales centrées, autrement dit de la tangente de l'angle formé par ces deux Normales dans le plan. C'est un exemple de distribution sans espérance ni variance finies. En physique, elle porte le nom de fonction de Lorentz. C'est une loi stable.
La loi de Voigt, ou profil de Voigt, est la convolution d'une Normale et d'une Cauchy. Elle trouve des applications en spectroscopie.
La loi de Holtsmark est un exemple de distribution à espérance finie mais variance infinie. C'est une loi stable.
La loi de Landau est aussi une loi stable. Les moments de la loi de Landau ne sont pas définis, en particulier la moyenne et la variance. Elle est utilisée en physique pour décrire les fluctuations des pertes d'énergie de particules chargées traversant une fine couche de matière.
Distributions d'extrema (voir GEV ou loi de Fisher-Tippett)
La loi de Gumbel (de type 1), ou loi de Fisher-Tippett de type I, est aussi appelée log-Weibull, parce qu'elle est la distribution du logarithme d'une loi de Weibull. Elle est la distribution du maximum observé parmi plusieurs données.
La loi d'extremum généralisée, ou GEV (pour generalized extreme value) ou loi de Fisher-Tippett, a comme cas particuliers les distributions de Gumbel (ou type I) de domaine égal à l'ensemble des réels, de Fréchet (ou type II) de borne inférieure finie et de Weibull renversée (ou type III) de borne supérieure finie.
La loi de Tukey-Lambda a pour domaine la droite des réels ou un intervalle borné selon la valeur d'un de ses paramètres. Elle se définit par ses quantiles ; sa fonction de densité n'a pas de forme close.
Distributions mixtes discrète/continues
Ces distributions ont des points de masse parmi les valeurs continues. L'exemple le plus courant est celui du temps d'attente (à un feu de circulation, à un guichet) : il y a une probabilité que le temps soit égal à zéro s'il ne faut pas attendre (point de masse), puis une distribution continue s'il y a attente.
La loi de Dagum de type II ajoute un point de masse en zéro à la loi de Dagum de type I.
Distribution singulière
La loi de Cantor a un domaine qui n'est ni discret, ni continu, mais fractal.
Distributions multivariées
Lorsque les variables aléatoires sont indépendantes, la fonction de densité de leur distribution conjointe est le produit des fonctions de densité individuelles.
Vecteur de variables aléatoires de domaines indépendants
La distribution catégorielle, ou multi-Bernoulli, n'est autre que la loi multinomiale lorsque le nombre de tirages N vaut 1. C'est une généralisation de la Bernoulli à une expérience présentant plus de deux résultats possibles. N.B. : elle est parfois présentée comme « distribution à support non numérique » ou « qualitatif », parce qu'elle dénombre la présence de tels critères, par exemple les nationalités dans un sondage.
Certaines distributions ont des propriétés utiles qu'elles partagent avec d'autres. Parfois, ces « sœurs » peuvent être formulées comme des cas particuliers d'une expression générale.
Pour une description plus précise de la notion de famille, voir famille exponentielle.
La famille exponentielle est une (famille de) distributions dont la forme fonctionnelle est factorisable, de façon à générer une série d'avantages pour les applications en inférence statistique ou en analyse bayesienne. Elle comprend un très grand nombre des distributions décrites dans cet article. La sous-famille exponentielle naturelle exige une factorisation encore plus dépouillée. Elle comporte les lois binomiale, Poisson, binomiale négative, Gamma, normale et une sixième sans nom propre. Elles ont pour propriété que la somme de deux variables indépendantes a une distribution de même forme (appelée la convolution).
La loi stable, ou distribution de Lévy tronquée, est une famille de distributions continues dont la convolution est une distribution de la même forme ; elle a pour cas particuliers :
La loi de Lévy (paramètres α=1/2 et β=1) sur le domaine [μ,∞[
La loi géométrique stable, ou géo-stable, est une famille de distributions telles que la somme d'un nombre N d'entre elles, où N a une distribution géométrique, a une distribution de la même forme ; elle a pour cas particuliers la loi de Linnik (cas symétrique, droite des réels), la loi de Laplace et la loi de Mittag-Leffler (sur [0,∞[).
Les distributions de Pearson (12 types à l'origine) sont les formes variées de solutions d'une équation différentielle établie par Karl Pearson en 1894, afin d'obtenir des propriétés statistiques souhaitables. Plusieurs de ces solutions ont reçu un nom par la suite. On y retrouve notamment les distributions suivantes :
Normale (cas-limite des types I, III, IV, V et VI)
Les lois tronquées, ou conditionnelles, limitent le domaine de définition considéré (p.ex. une distribution normale sachant que x est positive).
Les loi mélangées ou mixtures donnent la distribution globale d'une variable dans une 'population' dont chaque sous-groupe a sa propre loi (p.ex. la distribution des tailles dans une population mixte : bimodale).