La fonction de masse f possède la propriété suivante, pour k suffisamment grand :
Ceci signifie que la queue de la loi de Yule-Simon est une réalisation de la loi de Zipf : la fonction f peut être utilisée pour modéliser, par exemple, les fréquences relatives du k-ième mot le plus fréquent dans de grands textes qui, selon la loi de Zipf, est inversement proportionnel à la puissance typique de k.
La loi de Yule-Simon apparait initialement en tant que loi limite d'un cas particulier de processus stochastique étudié par Yule pour modéliser la répartition de taxons biologiques[3]. Simon baptisa ce processus le processus de Yule, il est cependant plus connu aujourd'hui comme processus d'attachement préférentiel. Ce processus est problème d'urne dans lequel chaque boule est ajoutée à un nombre croissant d'urnes suivant une probabilité dépendant linéairement du nombre de boules déjà dans l'urne.
Cette loi apparait également comme mélange continu de lois géométriques. Plus spécifiquement, si W suit une loi exponentielle de paramètre ρ : avec densité , alors la variable aléatoireK de loi géométrique de paramètre e–W suit la loi de Yule-Simon :
La fonction de masse de la loi de Yule–Simon est alors le mélange exponentiel-géométrique suivant :
où est la fonction de masse de la loi géométrique.
Généralisation
Une généralisation possible de la loi de Yule-Simon consiste à introduire un nouveau paramètre en remplaçant fonction bêta par la fonction bêta incomplète. La fonction de masse de la loi de Yule-Simon généralisée de paramètres ρ > 0 et 0 ≤ α < 1 est donnée par :
Pour α = 0 , on retrouve la loi de Yule-Simon standard.
Références
↑H. A. Simon, « On a class of skew distribution functions », Biometrika, vol. 42, nos 3–4, , p. 425-440 (DOI10.1093/biomet/42.3-4.425)
↑Juan Manuel Garcia Garcia, « A fixed-point algorithm to estimate the Yule-Simon distribution parameter », Applied Mathematics and Computation, vol. 217, no 21, , p. 8560–8566 (DOI10.1016/j.amc.2011.03.092)
↑G. U. Yule, « A Mathematical Theory of Evolution, based on the Conclusions of Dr. J. C. Willis, F.R.S », Philosophical Transactions of the Royal Society of London, Ser. B, vol. 213, nos 402–410, , p. 21-87 (DOI10.1098/rstb.1925.0002)
(en) Colin Rose et Murray D. Smith, Mathematical Statistics with Mathematica : Mathematical Statistics with Mathematica, New York, Springer, , 107 p. (ISBN0-387-95234-9)