George Kingsley Zipf (API : [zɪf]), né en 1902 et mort en 1950, est un linguiste et philologueaméricain qui étudia la statistique appliquée aux différentes langues. Son nom a été donné à la loi de Zipf, qui soutient que la fréquence d'emploi du n-ième mot le plus employé d'une langue varie en 1/n. Cette loi a connu de nombreux emplois dans divers domaines des sciences humaines.
Biographie
Zipf a fait sa scolarité et a travaillé à l’université Harvard. Ses recherches sur la fréquence des mots (anglais) dans l’Ulysse de James Joyce, l'amènent[1] à formuler la « loi de Zipf » (1935) :
où Pn est la fréquence du ne mot le plus utilisé du livre, et l'exposant est voisin de 1. Cette loi exprime que le 2e mot le plus utilisé apparaît deux fois moins souvent que le premier, le troisième mot le plus utilisé, trois fois moins souvent que le premier, etc. L'étude de Zipf est la première étude systématique sur la textométrie[2]. Elle annonce l'étude des propriétés statistiques de grands ensembles de données, tels qu'Internet.
Zipf s'intéressa par la suite à l'application de la loi puissance aux autres sciences humaines comme la distribution des villes par leur taille dans un pays, ou la courbe de répartition des revenus dans une population. En particulier, dans son essai National unity and disunity (1941), il avance que les tensions sociales s'exacerbent lorsque la distribution des revenus s'écarte de la loi puissance.
Publications
1932 : (en) Selected Studies of the Principle of Relative Frequency in Language, Cambridge, États-Unis.
1949 : (en) Human Behaviour and the Principle of Least-Effort, Addison-Wesley, Cambridge, États-Unis. Ce livre est considéré par Benoît Mandelbrot comme un exemple rare d'ouvrage où « tant d'éclairs de génie […] se perdent dans une gangue aussi épaisse d'élucubrations »[3].
Philippe Bully, « Zipf, créateur de la linguistique statistique », Communication et langages, vol. 2, , p. 23–28 (DOI10.3406/colan.1969.3726, lire en ligne, consulté le )
Claudia Prün: Das Werk von G.K. Zipf. In: Reinhard Köhler, Gabriel Altmann, Rajmund G. Piotrowski (Hrsg.): Quantitative Linguistik – Quantitative Linguistics. Ein internationales Handbuch. de Gruyter, Berlin/ New York 2005, p. 142–152 . (ISBN3-11-015578-8). En allemand.
Ronald Rousseau: George Kingsley Zipf: life, ideas, his law and informetrics. In: Glottometrics 3, 2002, 11–18 (PDF ram-verlag.eu).
Notes et références
↑Cf. George K. Zipf, Selected Studies of the Principle of Relative Frequency in Language, Cambridge (Mass.), .
↑Cf. R. Harald Baayen, Word Frequency Distributions, vol. 18, Springer, coll. « Text, Speech and Language Technology », , 335 p. (ISBN978-1-4020-0927-3, lire en ligne), p. 13.