Wikipédia:Nouvelles du Wikilab/2013-03-08

Compte-rendu hebdomadaire des travaux scientifiques sur Wikipédia
Nouvelles du Wikilab

Les Nouvelles du Wikilab visent à présenter des études scientifiques ayant Wikipédia pour objet de recherche.

La sélection reprend généralement les travaux mentionnés dans la Research Newsletter de Meta-Wiki. Elle apporte pour chacun d'entre eux des précisions complémentaires.

Les Nouvelles du Wikilab complètent la future revue de recherche Wikilogie, qui publiera essentiellement des travaux inédits.

Dans le cerveau des wikipédiens… (2/2)

La dernière livraison des nouvelles du Wikilab recensait un numéro spécial de la revue American Behavioral Scientist sur les mécanismes cognitifs de la collaboration wikipédienne. Il ne s'agit pas d'un cas isolé : de nombreux articles en sciences cognitives s'intéressent à l'encyclopédie en ligne. On tentera ici de faire un petit tour d'horizon des publications les plus récentes.

Devenir administrateur

Une étude polonaise s'est intéressée à un élément non négligeable de la vie communautaire : l'élection des administrateurs. Elle vise à tester deux hypothèses souvent évoquées :

  1. Les administrateurs sont élus sur la base d'une reconnaissance sociale et d'affinités mutuelles. Cette première hypothèse représente d'emblée un certain risque à terme : que la communauté se coagule autour de certaines cliques ou clans, découlant d'une généralisation de certains réseaux d'affinités intersubjectives.
  2. Les administrateurs sont élus sur la base d'une similarité d'expérience. La participation à une tâche commune sert de base à une confiance rationalisée. On est ici dans le cadre d'une communauté de pratiques : les usages déterminent le sentiment de communauté.

Pour vérifier ces deux hypothèses (qui ne s'excluent pas forcément), les rédacteurs de l'étude ont mis en place une sorte de modélisation des relations sociales. Ils mettent en perspective les avis donnés lors des élections et les thématiques des éditions réalisées antérieurement. Le test porte ainsi essentiellement sur la seconde hypothèse, clairement la plus facile à tester. Un examen plus détaillé des profils de 100 contributeurs majeurs permet également d'évaluer le rôle éventuel de la première hypothèse. <Note d'Alexander Doria : les affinités sont d'autant plus difficiles à déterminer qu'elles peuvent se construire en dehors du cadre du wiki stricto sensu. Il arrive fréquemment de se lier d'amitié avec un contributeur suite à une réunion in real life.>

L'étude présente ensuite toute une série de données très bien détaillées sans doute pour servir à d'autres études. Leur conclusion est sans ambiguïté : elle confirme la seconde hypothèse. Les administrateurs sont essentiellement élus sur la base de leur nombre et de la diversité des éditions. Dans la mesure où les votes tendent à devenir assez prévisibles, l'impact des relations amour-haine semble finalement assez marginal. La communauté wikipédienne semble ainsi fonctionner sur des ressorts intellectuels plutôt qu'affectuels. Les rédacteurs en viennent à se demander si cette prime à la rationalité n'a pas joué un rôle essentiel dans le succès de Wikipédia.

S'informer sur un utilisateur

Un article américain tente d'appliquer certains éléments de la théorie algorithmique de l'information aux comportements wikipédiens. Ses auteurs mettent en évidence que la situation optimale d'information wikipédienne est obtenue lorsqu'un contributeur A qui édite de nombreux articles s'intéresse à un contributeur B qui édite peu d'articles. Le système wiki privilégie en effet les interactions de pages à pages et non de profils à profils (comme le ferait Facebook…). Ainsi, on réunit plus facilement des informations sur un contributeur qui se cantonne à un petit lot d'articles, voire se spécialise dans une thématique précise, que sur un contributeur généraliste <Note d'Alexander Doria : la terminologie employée est assez spécifique. Je me suis contenté de résumer ses conclusions les moins complexes.>

Les règles du consensus

Plusieurs chercheurs hongrois ont tenté de déterminer les diverses formes possibles de consensus sur Wikipédia. Leur étude n'est pas disponible en ligne, mais une version antérieure a été publié sur ArXiv il y a quelques mois. La valeur épistémologique de Wikipédia pour l'analyse des comportements collaboratifs est soulignée avec force : « Wikipédia est tout particulièrement adapté à ce genre d'étude, dans la mesure où tous les changements et les discussions sont archivés et accessibles ». Utilisant une vaste gamme d'algorithmes et de modélisations graphiques, les auteurs développent deux conclusions assez stimulantes :

  1. Plus un sujet controversé attire de contributeurs qui en font le sujet premier de leur préoccupation, plus le conflit est appelé à durer. L'arrivée de nouveaux intervenants retarde en effet le processus de résolution et accentue les tensions.
  2. Inversement, les conflits parviennent à se résorber, dès lors que suffisamment de contributeurs non spécialisés dans le sujet de la controverse s'en mêlent. Les intervenants dominants (mainstream) permettent en effet soit d'esquisser un compromis, soit de renforcer l'un des positionnements au détriment de l'autre. Le résultat importe moins que la méthode. Grâce à l'intervention de regards extérieurs, on sort de la spirale obsessionnelle entretenue par les principaux participants au conflit.

Varia

  • Un chercheur en programmation appelle à remplacer le principe de neutralité du point de vue (NPOV) par un principe de tous les points de vue (every point of view). Selon lui, l'épistémologie de Wikipédia repose sur des bases relativement fallacieuses : l'idée qu'il existerait un point de vue objectif sur un phénomène. C'est une conception que l'on retrouverait fréquemment dans les sciences naturelles, mais pas dans de nombreux champ de recherches, tels que la physique quantique, la psychologie ou les sciences sociales. L'auteur relève notamment que l'article sur Oussama ben Laden change assez radicalement d'une version linguistique à l'autre. Les qualificatifs pour le désigner sont connotés beaucoup plus positivement sur la version arabe que sur la version germanophone. La NPOV n'est pas seulement une illusion mais constitue une dissonance cognitive : plutôt que d'admettre qu'ils ont un point de vue sur un sujet, les contributeurs le déguisent sous des atours rationnels. Face à cela, l'auteur propose une solution technique : créer un réseau de neutralités, en dissociant plusieurs versions de l'article selon le point de vue adopté — quelque chose qui rappelle plutôt Knol. <Note d'Alexander Doria : cette analyse appellerait un commentaire assez détaillé. Il me semble assez manifeste que l'auteur a une vision assez curieuse de l'épistémologie, invoquant notamment Thomas Kuhn pour soutenir que les paradigmes scientifiques résultent essentiellement de postures subjectives. Par ailleurs, Wikipédia ne prétend pas refléter la réalité, mais refléter l'avis de la communauté scientifique (ou, à défaut, des sources fiables) sur la réalité. L'encyclopédie a d'ailleurs plus souvent été rattachée au paradigme constructiviste (la réalité est une construction sociale) qu'à un positivisme forcené. On peut se demander dans quelle mesure cette analyse assez insatisfaisante sert surtout à valoriser un nouveau dispositif technique>.
  • Un groupe de recherche catalan a créé une compilation des jumelages de nombreuses villes du monde. Leur corpus a été réuni à partir de la Wikipédia anglophone, « il s'agit apparemment de la collection la plus importante, quoiqu’incomplète, de ce type de relations ». Ce travail est relativement inédit : il existe déjà des modélisations des relations entre les villes, mais elles ne prennent jamais en compte les partenariats institutionnels. Les auteurs ont déduit notamment un classement des villes les plus jumelés, dominé par Saint-Pétersbourg (78 jumelages) et des pays hébergeant le plus de jumelages (les États-Unis occupent la première place suivis par la France). L'une des informations les plus intéressantes est d'ordre spatial : la proximité ne joue aucun rôle dans la détermination du jumelage. Il semblerait que ce soit un signe fort de la « mort de la distance […] suite à la diminution des coûts de la communication humaine ».

Le carnet du Wikilab

Bibliographie

  • (en) Michal Jankowski-Lorek, Lukasz Ostrowski, Piotr Turek et Adam Wierzbicki, « Modeling Wikipedia admin elections using multidimensional behavioral social networks », Social Network Analysis and Mining,‎ (lire en ligne) Accès libre
  • (en) Travis L. Bauer, Rich Colbaugh, Kristin Glass et David Schnizlein, « Use of Transfer Entropy to Infer Relationships from Behavior », Working paper,‎ (lire en ligne) Accès libre
  • (en) Janis Török et al., « Opinions, Conflicts and Consensus: Modeling Social Dynamics in a Collaborative Environment », ArXiv,‎ (lire en ligne) Accès libre
  • (en) Clemens H. Cap, « Towards Content Neutrality in Wiki Systems », Future Internet, vol. 4, no 4,‎ (lire en ligne) Accès libre
  • (en) Andreas Kaltenbrunner, Pablo Aragón, David Laniado et Yana Volkovich, « Not all paths lead to Rome: Analysing the network of sister cities », ArXiv,‎ (lire en ligne) Accès libre

Discussion

N'hésitez pas à discuter ci-dessous les informations publiées sur cette page (ou à apporter des compléments aux études scientifiques présentées) :

Remarques de Gentil Hibou (d · c · b)

  • Cela m'a amusé de constater que les études polonaise et hongroise s'accordent assez bien avec ce que j'écrivais il y a deux ans sur mon blog, à savoir que Wikipédia a une force intrinsèque qui marginalise les « clans » et qu'elle est une meta-encycolpédie dans le sens où elle donne à voir son processus d'élaboration et qu'elle « enregistre » sa propre histoire.
  • Sur mon blog je m'étais aussi intéressé aux rapports entre Wikipédia et la géographie, aussi je me suis précipité sur l'étude catalane. Deux remarques : 1) certes le premier PF affirme que Wikipédia n'est pas une base de données, mais elle en fait office ici (ce qui suppose qu'on considère comme fiables ses informations !), ce qui en dit long sur le décalage entre la vision de certains contributeurs de la version francophone et les usages qui sont faits de WP ; 2) La sémiologie graphique est sérieusement malmenée dans la figure 4 de l'étude, laquelle me rappelle une carte élaborée par un célèbre réseau social pour montrer les liens entre ses membres et dont le cartographe Thierry Joliveau a montré les faiblesses (en trois temps : [1], [2] et [3]). Sur Wikipédia comme lieu réticulaire, il y a l'excellent article de Boris Beaude.

Gentil Hibou mon arbre 8 mars 2013 à 16:01 (CET)[répondre]

Chouettes remarques !
  • C'est aussi mon point de vue. Wikipédia fonctionne comme un système très ouvert, au point que l'on a maintenu une sorte d'ambiguïté stratégique sur sa visée exacte afin de garantir une participation suffisamment large. Comme dans toutes les sociétés humaines il y a pontuellement des cristallisation autour de tendances plus ou moins affirmées, mais ça finit rapidement par s'étioler. Le fait que la plupart des contributeurs soient en transit, alternant des phases de contribution actives et des phases de wikibreak, n'encourage pas les clivages durables.
  • Oui, les usages ne concordent pas véritablement avec l'idée que s'en font les contributeurs. Pour les chercheurs, Wikipédia est surtout intéressante en tant que base de données et en tant que lieu d'une communauté de pratiques (ce que rappelle d'ailleurs l'étude hongroise). Je viens d'ailleurs de boucler une étude à paraître prochainement dans une revue en science politique ; je mets justement en avant le fait que les relations sociales sont assez lisibles sur Wikipédia en raison de leur traçabilité. Cela permet de s'en servir comme analogie pour d'autres objets plus complexes. Sinon je ne connaissais pas l'article de Beaude : je le rajoute de suite à mon calepin.
Alexander Doria (d) 8 mars 2013 à 16:14 (CET)[répondre]