La logométrie (logos = discours ; métrie = mesure) est une méthode d’analyse et d'interprétation des discours utilisée dans les sciences humaines et sociales (linguistique, histoire, littérature, sociologie). Cette méthode d'analyse, assistée par ordinateur, combine lecture qualitative et lecture quantitative des corpus numériques. Elle combine aussi lecture globale (tout le discours) et lecture locale (les unités du discours) pour construire l'interprétation.
La logométrie se présente comme un prolongement naturel de la lexicométrie (mesure du lexique) et de la textométrie (mesure du texte). Seulement, c’est le discours ou logos (discours politique, discours littéraire, discours médiatique, discours scientifique) dans ses dimensions linguistiques et sociales qui est son objet. Depuis le début des années 2020, la logométrie intègre des algorithmes d'Intelligence artificielle et de Deep learning pour affiner sa prédiction et sa description des textes.
Son développement actuel bénéficie de la multiplication et de la disponibilité des corpus numérisés, du développement et de l'usage de logiciels appropriés (Alceste[3], Hyperbase, Iramuteq, Lexico, TXM, etc.), et de la maturation scientifique de l'analyse des discours en SHS (linguistic turn, tournant herméneutique, sémantique de corpus).
Définition
Pour Francine Mazière dans son Que sais-je ? sur l'analyse du discours, la logométrie est avant tout un « retour » assisté par ordinateur vers les unités du discours afin de consolider l'interprétation[4]. Pour Laurent Rouveyrol, il s'agit d'une méthode ouverte et « intégrative » dont « l'objet essentiel est de rendre compte de la relativité des stratégies » discursives mise en place par les locuteurs[5]. Pour le linguiste Pierre Fiala, la logométrie est un prolongement ambitieux de la textométrie mais « encore loin d'un traitement transversal des textes »[6]. Damon Mayaffre définit pour sa part la logométrie dans sa thèse d'Habilitation à diriger des recherches comme une méthode interprétative (articulation global/local ; objectivation des parcours interprétatifs) dont il met en valeur l'outillage linguistique, informatique et statistique dans la continuité mais le dépassement de la lexicométrie traditionnelle :
« Ensemble de traitements documentaires et statistiques du texte et des discours qui ne s'interdit rien pour tout s'autoriser ; qui dépasse le traitement des formes graphiques sans les exclure ou les oublier ; qui analyse les lemmes ou les structures grammaticales sans délaisser le texte natif auquel on est toujours renvoyé. C'est finalement un traitement (semi-)automatique global du texte dans toutes ses dimensions : graphiques, lemmatisées, grammaticalisées. L'analyse ainsi portera sur toutes les unités linguistiques de la lettre aux isotopies, en passant par les n-grams, les mots, les lemmes, les co-occurrences, les codes grammaticaux, les bi-codes ou les enchaînements syntaxiques.[7] »
Périmètre et soutien institutionnel
La logométrie se distingue d'un côté du traitement automatique du langage naturel (TAL), de la fouille de textes ou de l'analyse de contenu par son souci philologique et linguistique pointu des textes et des discours : les corpus analysés recueillent des discours dument identifiés et critiqués par l'analyste qui entend produire une analyse socio-linguistique fine.
La logométrie prolonge la lexicométrie et la textométrie en définissant le discours (logos), après le lexique et le texte, comme son objet.
Présente dans plusieurs universités, la logométrie bénéficie à l'université de Nice Sophia Antipolis d’une équipe de recherche du CNRS et d'un site qui lui est dédiée : Logométrie et corpus politiques, médiatiques et littéraires (UMR 7320, Bases, Corpus, Langage)[8].
Principes et valeurs
La logométrie affiche deux principes fondateurs : la contextualisation des unités et la mesure de leur régularité dans le corpus ; il s'agit donc aussi bien de lire que de compter.
Contextualisation : le sens des unités du discours nait de leurs contextes d'utilisation. C'est par l'usage que l'on définit le sens des mots. La convocation des passages du corpus et le retour au texte, outillés par l'informatique (indexation et moteur de recherche), deviennent ainsi une priorité des analyses logométriques.
Régularité et saillance : la valeur des unités du discours nait de leur régularité ou irrégularité d'emploi dans le corpus. L’absence, la fréquence, la répétition, la répartition sont des indices quantitatifs essentiels (tableau de fréquences, approche probabiliste du vocabulaire, analyse factorielle des correspondances de tables lexicales, calcul de cooccurrences, etc.) dans le parcours interprétatif.
La logométrie prétend avoir deux valeurs : descriptive et heuristique ; il s'agit donc aussi bien d'attester que d'interpréter, de trouver que de chercher.
Description : l'ordinateur est convoqué pour produire une description la plus systématique et exhaustive possible de gros corpus numériques [9]. Dans le meilleur des cas, cette description exhaustive peut prendre valeur probatoire.
Heuristique : la lecture numérique et le traitement statistique doivent permettre de fournir des chevilles interprétatives différentes et inattendues par rapport à la lecture naturelle et oculaire des textes. Le plus souvent, la lecture logométrique a donc une valeur heuristique, herméneutique, suggestive.
Domaines d’application
Parce que le discours est lui-même un objet interdisciplinaire selon les théoriciens de l'analyse du discours[10], le champ des études logométriques est varié :
Les logiciels universitaires pour l'analyse des discours sont nombreux. Ceux que convoque la logométrie permettent à la fois le traitement statistique et le retour au texte. Ils doivent offrir la panoplie des outils développés depuis les années 1980 jusqu'à aujourd'hui[11] pour rendre compte du corpus (index fréquentiel, dictionnaire, calcul du vocabulaire spécifique, concordancier, traitement des occurrences et des cooccurrences, statistiques multidimensionnelles (AFC) outils de classification, graphes et réseaux de mots, etc.). Par exemple :
Ce qui compte. Tome 2. Méthodes statistiques, textes édités par Céline Poudat, préface de Ludovic Lebart, Paris, Champion, 2011, 376 p. (ISBN2745322257 et 978-2745322258).
Au bout du compte. Tome 3. Questions linguistiques, textes édités par Bénédicte Pincemin, préface de François Rastier, Paris, Champion, 2015.
Jacques Guilhaumou, "L’historien du discours et la lexicométrie", Histoire & Mesure, 1986, vol I, 3/4, p. 27-46.
Margareta Kastberg-Sjoblom, L'écriture de J.M.G. Le Clézio, Des mots aux thèmes, Paris, Champion, 2006, 304 p. (ISBN2745314122 et 978-2745314123)
Benoit Habert, Adeline Narazenko et André Salem, Les linguistiques de corpus, Paris, Colin, 1997, 240p. (ISBN2200017758 et 9782200017750)
Dominique Labbé et Denis Monière, Le discours gouvernemental. Canada, Québec, France (1945-2000), Paris, Champion, 2003, 181 p. (ISBN2745307495 et 9782745307491)
Véronique Magri-Mourgues, Voyage à pas comptés.Pour une poétique du récit de voyage au XIXe siècle, Paris, Champion, 2009, 328 p. (ISBN2745319418 et 9782745319418)
Pascal Marchand, Le grand oral. Les discours de politique générale de la Ve République, Bruxelles, De Boeck, 2007, 215 p. (ISBN2804153371 et 9782804153373)
"De la lexicométrie à la logométrie", Astrolabe, 2005, p. 1-11[2]
"Analyse du discours politique et Logométrie : point de vue pratique et théorique", Langage et société, 2005, no 114, p. 91-121[3]
Le discours présidentiel sous la Ve République. Chirac, Mitterrand, Giscard, Pompidou, de Gaulle, Paris, Presses de Sciences Po, 2012, 384 p. (ISBN2724612442)
Sylvie Mellet and Dominique Longrée (Editor), New Approaches in Text Linguistics, Amsterdam, John Benjamins Pub Co, 2009, 206 p. (ISBN9027226830 et 9789027226839)
Émilie Née, L'insécurité en campagne électorale, Paris, Champion, 2012, 257 p. (ISBN2745324551 et 978-2745324559)
André Salem, Méthodes de la statistique textuelle, Thèse pour le doctorat d'État ès lettres et sciences humaines, Université de la Sorbonne nouvelle - Paris 3, , 3 vol, 998 p.
Maurice Tournier
Propos d'étymologie sociale. Tome 1. Des mots sur les grèves, rééd, Lyon, ENS-LSH Éditions, 2002, 290 p. (ISBN2847880089 et 9782847880083)
Propos d'étymologie sociale. Tome 2. Des mots en politique, rééd, Lyon, ENS-LSH Éditions, 2002, 307 p. (ISBN2847880097 et 9782847880090)
Propos d'étymologie sociale. Tome 3. Des sources du sens, Lyon, ENS-LSH Éditions, 2002, 306 p. (ISBN2847880100 et 9782847880106)
Jean-Marie Viprey, Dynamique du vocabulaire des Fleurs du mal, Paris, Champion, 1997, 416 p. (ISBN2852038099 et 9782852038097)
Références
↑Bernd Kortmann et Johan van der Auwera, The Languages and Linguistics of Europe: A Comprehensive Guide, vol. 2, Walter de Gruyter, , p. 833-834
↑Jean-Paul Metzger, « L’analyse du discours », dans Le discours: Un concept pour les sciences de l’information et de la communication : Volume 4 de Des concepts pour penser la société du XXIe siècle, ISTRE, (ISBN9781784055325, lire en ligne), p. 33-65.
↑ Francine Mazière, L'Analyse du discours, Paris, PUF, 2005, p. 110.
↑Laurent Rouveyrol, Vers une logométrie intégrative des corpus politiques médiatisés. L’exemple de la subjectivité dans les débats-panel britanniques, Corpus, no 4, 2005
↑Damon Mayaffre, Vers une herméneutique matérielle numérique. Corpus textuels, Logométrie et Langage politique. Thèse d'habilitation à diriger des recherches, soutenue à Nice, 30 avril 2010, sous la direction de Sylvie Mellet, vol. 1, p. 22 (http://tel.archives-ouvertes.fr/tel-00655380).
↑Cf. par exemple les index et concordances publiés par Étienne Brunet, Le Vocabulaire de Proust, avec l’Index complet et synoptique de À la recherche du temps perdu, 3 vol., 1918 p., Genève-Paris, Slatkine-Champion, 1983. (ISBN2051004749 et 9782051004749). Le Vocabulaire de Zola, suivi de l’Index complet et synoptique des Rougon-Macquart, 3 tomes, 472 p., 646 p., 357 p. et 5500 pages sur microfiches normalisées, Genève-Paris, Slatkine-Champion, 1985 (ISBN2-05-100670-9).
Le Vocabulaire de Victor Hugo, vol. 1, 484 p., vol. 2, 637 p., vol. 3, 556 p., + 27 microfiches normalisées contenant l’Index synoptique des œuvres de Hugo (6878 p.), Genève-Paris, Slatkine-Champion, 1988. (ISBN2051010048 et 9782051010047). index
↑P. Charaudeau et D. Maingueneau (dir.), Dictionnaire d'analyse du discours, Paris, Seuil, 2002 (ISBN2020378450)