Soit deux mesures de probabilité sur un espace probabilisable. La distance en variation totale entre et est la quantité
.
Il arrive que le facteur 2 n'apparaisse pas chez certains auteurs.[réf. nécessaire]
Soit et deux variables aléatoires à valeurs dans le même espace. On peut aussi définir la distance en variation totale entre et comme la distance en variation totale entre la loi de et celle de . Autrement dit, on pose
.
Propriétés
Propriétés basiques
La distance en variation totale entre deux mesures de probabilité est une distance dont la valeur est toujours incluse dans [0,2].
La distance en variation totale entre deux mesures de probabilité vaut 2 si et seulement si les supports des deux mesures sont disjoints.
Définitions équivalentes
On trouve parfois d'autres définitions pour la distance en variation totale.
La formule suivante donne une définition équivalente à la première[1]
où le supremum est pris sur l'ensemble des fonctions mesurables à valeurs dans [-1,1].
En d'autres termes, la distance en variation totale entre et correspond à la distance entre et pour la norme .
Lorsque est dénombrable la formule suivante donne aussi une définition équivalente[2]
.
Couplage
Pour tout couple de variables aléatoires tel que suit la loi et suit la loi , on a l'inégalité
.
De plus, il existe un couple tel que et qui satisfait[3]
.
Autrement dit, on a la caractérisation suivante de la distance en variation totale
.
Si est une famille de mesures de probabilité toutes absolument continues par rapport à une mesure commune -finie, alors il existe des variables aléatoires telles que pour tout , et pour tout [4]
.
Lien avec la norme en variation totale d'une mesure signée
La distance en variation totale est aussi reliée à la distance de Hellinger par l'encadrement[7] :
.
Convergence en variation totale
La convergence d'une suite de mesures pour la distance en variation totale implique la convergence faible (et les limites sont les mêmes le cas échéant). De manière équivalente, si une suite de variables aléatoires converge pour la distance en variation totale, alors elle converge en loi (et les limites sont les mêmes)[8].
↑(en) Imre Csiszár et János Körner, Information Theory: Coding Theorems for Discrete Memoryless Systems, Cambridge University Press, (ISBN9781139499989, lire en ligne), p. 44