Wikipédia:RAW/2019-03-01
Brèves▲ POTY — Du 3 au 17 février s'est tenue la première étape pour la sélection de l'image de l'année Commons (POTY). Le concours en est à sa treizième édition. ▲ Wikipédia en orbite ? — En juin 2018, nous vous parlions du projet d'envoyer Wikipédia sur la Lune porté par l'Arch Mission Foundation (AMF). Si on en croit les sources [1] et [2], l'AMF, en collaboration avec SpaceChain, aurait placé en orbite une copie de Wikipédia (sans autre précision sur le contenu concerné). Le lanceur transportant le (nano)satellite aurait décollé en octobre 2018 de la base de lancement de Taiyuan et la réussite de la mission a été confirmée en février 2019. Cette mise en orbite s'inscrirait dans le projet de bibliothèque orbitale de l'AMF. ▲ Olivia Colman — Dans un billet publié sur The Conversation, le wikipédien d'expérience Alexandre Hocquet se penche sur une déclaration d'Olivia Colman reprise dans plusieurs médias anglo-saxons. Bénéficiant d'une certaine visibilité depuis qu'elle a gagné un Golden Globe Award, l'actrice a affirmé dans une entrevue qu'elle a eu des démêlés avec Wikipédia, qui l'aurait vieillie de huit ans. L'accusation est sans fondement. ▲ Définitions de Wikipédia — L'encyclopédie Larousse en ligne publie sa définition de ce qu'est Wikipédia ; elle utilise 180 mots, sur un total de 280 mots, pour critiquer les contenus et le fonctionnement de l'encyclopédie en ligne. (fr)[3] L’Encyclopedia Britannica en ligne publie aussi sa définition de Wikipédia ; au moins la moitié de l'entrée, qui comporte 1 450 mots, critique les contenus et le fonctionnement de Wikipédia. [4]. Des wikipédiens ont critiqué la qualité du Larousse ; par exemple, à la remarque « que l'anonymat des rédacteurs ne permet pas de s'assurer de leur domaine réel d'expertise et de leurs véritables mobiles », un wikipédien fait observer que les auteurs des articles du Larousse ne sont pas clairement identifiés. (fr)[5] ▲ Le journal Le Devoir... — ... publie un article sur les moyens qu'utilise Wikipédia pour diffuser des « clichés » libres. L'article mentionne à quelques reprises les contributeurs Letartean, Lea-Kim et Benoit Rochon, le premier ayant vu plusieurs de ses photos primées dans Wikimedia Commons. Il déclare : « Je fais de la photo encyclopédique [...] C’est un style qui représente et illustre sans nécessairement avoir une visée artistique. » Quant à Benoit Rochon, il est cité en lien avec le sujet du copyright canadien. Il fait entre autres observer que les photos des salariés du gouvernement fédéral américain sont automatiquement placées dans le domaine public, au contraire des pays du Commonwealth dont le Canada fait partie. L'article se penche ensuite sur la qualité des photos publiées, certaines étant médiocres ; on apprend que des organisations collaborent avec Commons pour publier leurs photos, souvent de meilleure qualité, sous une licence libre. (fr)[6] ▲ Genres — La journée internationale des femmes se tient le 8 mars. Nous profitons de l'occasion pour établir des statistiques sur le pourcentage de contenu selon les genres dans 55 publications (dictionnaires et encyclopédies) dont une partie du contenu est associé à Wikidata à l'aide d'identifiants uniques. ▲ Wayback Machine et Wikipédia — Les pages Web sont évanescentes. Le but de la Wayback Machine (WM) est de copier les contenus de plusieurs sites Web, ce qui permet de les consulter quelques années plus tard. Depuis la signature d'un partenariat avec la Wikimedia Foundation voici trois ans, ce service, en collaboration avec les communautés wikipédiennes, aurait restauré « pas moins de 9 millions de liens morts », ce qui permet de pérenniser les pages du Web qui étayent les articles et ce, dans 22 éditions linguistiques de Wikipédia. (fr)[7], [8] ▲ Moins de crypto ? — Alex Stamos, ancien CISO de Facebook, affirme que les gouvernements exercent de plus en plus de pressions sur les réseaux sociaux pour qu'ils modèrent les commentaires. Selon lui, les réseaux sociaux, dont fait partie Wikipédia, seront tentés d'abandonner le chiffrement des communications parce qu'il est plus simple de retracer un internaute qui communique sans chiffrement. Cette voie, si elle était empruntée, ne ferait qu'augmenter le pouvoir des gouvernements. [9] ▲ Celette — Non, ce n'est pas le nom d'un être vivant récemment découvert par des zoologistes, mais plutôt le pseudonyme d'une contributrice de la Wikipédia qui s'est taillée une réputation « encyclopédique » pour ses interventions dans les pages des députés français. À ses débuts, elle avoue avoir été impulsive. (fr)[10] Aujourd'hui, dix ans plus tard, elle est respectée et appréciée pour son œuvre sur les articles politiques. Si vous désirez en savoir plus sur cette femme qui affirme rédiger sur le féminisme, lisez ce long billet.
▲ Croissance des wikis — FDans a créé un outil mesurant la croissance des Wikipédias linguistiques de 2018 à 2019, qui sont au nombre de 288. <On en parle au Bistro du 20 février>.
Plus grosses croissances relatives :
▲ Wikipédia par les images — Depuis des années, les chercheurs s'attardent aux contenus écrits des Wikipédias linguistiques. En janvier 2017, des chercheurs ont étudié les images diffusées dans les Wikipédias linguistiques. Avant de commencer leur recherche, ils ont spéculé que les images présenteraient peu de diversité d'une Wikipédia à l'autre puisqu'elles sont en majorité stockées dans Wikimedia Commons, qui sert d'entrepôt commun. Ils ont plutôt constaté que beaucoup d'images sont seulement utilisées dans une seule Wikipédia. [11] Ils avancent de plus que 73,5 % des sujets n'existent que sur une seule Wikipédia linguistique. [vidéo] de 1 min 45 à 2 min 45 Dans les coulisses de la Wikimedia▲ Problèmes techniques majeurs — À la mi-février, des problèmes techniques majeurs rendent dysfonctionnels plusieurs outils, tels quickstatements, mix'n'match, ListeriaBot, hébergés ou utilisant en partie l'infrastructure wmflabs.org. Les outils présent sur tools.wmflabs.org sont particulièrement impactés. La correction des problèmes prend quelques jours et ralentit fortement l'activité sur, notamment, Wikidata, qui subit une baisse des contributions de X %[2],[3]. De nombreux bots de Wikipédia en français n'ont pas fonctionné correctement. <On en parle au Bistro du 16 février> ▲ Comm — « La Fondation Wikimédia programme actuellement une consultation globale sur la communication. Le but est d’amener les wikimédiens et les autres personnes préoccupées par Wikimédia à améliorer ensemble les outils de communication. [...] Nous cherchons l’intervention d’un maximum de parties différentes de la communauté Wikimédia. Il faut de multiples projets, de multiples langues et de multiples perspectives. » Le projet en est à sa phase organisation. (fr)[12] ▲ Marques de la WMF — Si j'écris Wikimedia, vous savez que je parle du mouvement, à moins que ce ne soit de l'écosystème des wikis ou encore de la Wikimedia Foundation (WMF). Qu'en est-il des internautes lambdas ? Connaissent-ils Wiktionnaire ? Savent-elles que Wikimedia Commons est une médiathèque ? Peu probable. En Amérique du Nord et en Europe, presque tous les internautes connaissent Wikipédia. Cette marque est donc mieux connue que Wikimedia. Dans le cadre de Wikimedia 2030, la WMF envisage de mettre la marque Wikipédia en avant, les autres wikis seraient en quelque sorte positionnés à sa remorque. Dans la foulée, le nom de Wikimedia Commons changerait pour WikiCommons et d'autres wikis seraient peut-être renommés. Pour en savoir plus sur ce projet et comment vous exprimer, lisez Leading with Wikipedia: A brand proposal for 2030. ▲ Top 20 de Wikidata — Des contributeurs de la Wikipédia en français font partie du top 20 de Wikidata par le nombre de contributions [13] :
▲ Plan d'action Wikimédia France — L'association Wikimédia France souhaite consulter la communauté wikimédienne sur son plan d'action 2019-2020. ▲ Requêtes SPARQL — Wikidata a pour mission, entre autres, de structurer les données de diverses origines. Le site propose des requêtes SPARQL sur différents sujets : film sorti en NNNN, liste des présidents de la Finlande, liste d'écrivains soviétiques. Voyez cette liste d'éléments qui comprennent des requêtes SPARQL, liste susceptible de grandir au gré des souhaits des utilisateurs. ▲ Cartes de la 2GM — Un contributeur, qui semble avoir quitté le projet en 2010, a produit des cartes du monde montrant les pays selon leur allégeance pendant la Seconde Guerre mondiale à raison d'une carte par mois pendant le conflit. Voyez le tableau des cartes mensuelles dans cette page. ▲ Un million de contributions — Le contributeur Polmars a dépassé un million de contributions dans la Wikipédia en français au mois de septembre 2018. [14] ▲ Hors Wikipédia — Le collège des administrateurs a discuté d'un thème récurrent : Comment agir face à des contributeurs « délinquants » (négationnistes, homophobes, misogynes, etc.) qui s'expriment hors des « murs » de Wikipédia ? En général, un internaute qui publie sur une autre plateforme ne peut être clairement relié à un contributeur enregistré de Wikipédia. Il serait donc futile et improductif de s'attarder à ces cas. De temps à autre, cependant, un internaute peut être relié, avec certitude, à un compte Wikipédia. Est-ce que la communauté devrait sanctionner le contributeur enregistré ? Il est par exemple tentant d'interdire sa participation ici, mais est-ce que la personne va cesser d'agir en « délinquant » ? Probablement pas, il serait donc inutile de la sanctionner. À cet argument, on peut opposer le fait que la communauté devrait faire tout ce qui est en son pouvoir pour interdire ces nuisances, ce qui peut apporter une satisfaction aux personnes lésées (sentiment de justice, application des règles de savoir-vivre, respect des lois, etc.) Par ailleurs, si le « délinquant » collabore constructivement ici, est-on moralement justifié de le punir ? Il y a matière à débat. Ahilyabai Holkar
En lien avec la brève sur le genre du contenu de différents dictionnaires et encyclopédies, de prime abord, on pourrait croire que le débalancement des genres au niveau des sources encyclopédiques engendre inévitablement un débalancement des genres sur Wikipédia puisque cette dernière se doit d'être le reflet des sources. Cependant, cette croyance doit être fortement nuancée pour deux raisons. ▲ Quiz du mois —
D'après vous, quels sont les 10 noms de famille les plus communs sur Wikidata ?
▲ Comment discutez-vous ? — La Fondation a lancé un appel à participer à une consultation sur la communication et les outils qui s'y rattachent. Elle est prévue pour durer de février à juin 2019 afin de rassembler les wikipédiens et les personnes impliquées dans un wiki pour définir de meilleurs outils de communication. La consultation a pour objectif premier de collecter les avis du plus grand nombre possible de wikipédiens sur les différents projets dans de multiples langues pour établir une orientation et un ensemble de caractéristiques à partir desquelles une équipe de le Fondation Wikimedia pourra travailler. La phase 1, visant à recueillir vos retours argumentés quant aux outils, est ouverte jusque fin mars . SPARQL du mois
Le SPARQL permet de trier selon divers critères les plus de 50 millions d'éléments de Wikidata. À chaque mois, vous êtes invités à dénicher la requête SPARQL qui vous semble la plus intéressante pour les lectrices et lecteurs des RAW.
Parmi les plus de 6 000 propriétés de Wikidata, plus de la moitié sont consacrées aux identifiants uniques de publications externes. Il est possible de faire la liste de ces propriétés à l'aide de la requête suivante, qui retrace les propriétés dont la nature est Q6545185 (« identifiant unique ») ou une sous-classe de cet élément : SELECT DISTINCT ?property ?propertyLabel ?propertyDescription
WHERE
{
?property rdf:type wikibase:Property ; wdt:P31/wdt:P279* wd:Q6545185 .
SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en" }
}
Nous obtenons ainsi plus de 3 700 propriétés liées à des sources externes de contenu. Puisque le contenu de Wikipédia dépend des SOURCES, il semble pertinent de voir de quoi sont constituées ces dernières. En liant ces identifiants uniques aux éléments Wikidata correspondants, il devient très facile de faire des statistiques sur le contenu des ressources correspondantes. Ainsi, par exemple, de telles statistiques ont été faites sur le contenu de l'Encyclopaedia Universalis (EU) et l'Encyclopaedia Britannica (EB), dont les identifiants sont gérés par les propriétés P3219 (« identifiant Encyclopædia Universalis d'un article ») et P1417 (« identifiant Encyclopædia Britannica »). Puisque le 8 mars marque la journée internationale des femmes, profitons de l'occasion pour établir des statistiques sur le nombre de biographies dédiées à des femmes dans différentes ressources dont une majorité du contenu est associé à Wikidata à l'aide d'identifiants uniques. Tout d'abord, établissons la liste des identifiants associés à des personnes (Q36218176 (« identifiant de personne »)) : SELECT DISTINCT ?property ?propertyLabel ?propertyDescription
WHERE
{
?property rdf:type wikibase:Property ;
wdt:P31/wdt:P279* wd:Q36218176.
SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en" }
}
Nous obtenons plus de 1 300 résultats. Pour trouver les ressources qui sont en grande partie associées, nous pouvons visiter mix'n'match, un outil développé par Magnus Manske et dédié à l'association d'éléments Wikidata avec des identifiants externes. Cet outil possède justement une page dédiée aux identifiants d'autorité de personnalités qui permet de filtrer ces derniers par ordre de complétude. Cependant, en visitant cette page, on peut constater que faire des statistiques sur des ressources d'autorité n'est peut-être pas ce qui est le plus intéressant. Choisissons un autre chemin. Reprenons notre requête SPARQL précédente, mais cette fois en adaptant cette dernière pour ne garder que les identifiants liés à des encyclopédies. Pour ce faire, nous pouvons filtrer les propriétés dont la nature est Q55452870 (« propriété Wikidata relative aux encyclopédies ») : SELECT DISTINCT ?property ?propertyLabel ?propertyDescription
WHERE
{
?property rdf:type wikibase:Property ;
wdt:P31/wdt:P279* wd:Q55452870 .
SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en" }
}
Cela nous donne 60 résultats. Nous trions parmi eux 55 publications reconnues. Nous pouvons maintenant recenser et classer en ordre décroissant le nombre d'éléments associés à ces publications : SELECT DISTINCT ?property #?propertyLabel #?propertyDescription
(COUNT(?person) AS ?total)
WHERE
{
?property rdf:type wikibase:Property ;
wdt:P31/wdt:P279* wd:Q55452870 ;
wikibase:directClaim ?propertyMainValue .
?person ?propertyMainValue [] .
SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en" }
}
GROUP BY ?property #?propertyLabel #?propertyDescription
ORDER BY DESC(?total)
On peut ensuite ne garder que les humains : SELECT DISTINCT ?property ?propertyLabel #?propertyDescription
(COUNT(?person) AS ?total)
WHERE
{
?property rdf:type wikibase:Property ;
wdt:P31/wdt:P279* wd:Q55452870 ;
wikibase:directClaim ?propertyMainValue .
?person ?propertyMainValue [] ;
wdt:P31 wd:Q5 .
SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en" }
}
GROUP BY ?property ?propertyLabel #?propertyDescription
ORDER BY DESC(?total)
On constate ainsi, notamment, que l'EB est celle qui possède le plus d'entrées associées sur Wikidata (47 151) et que l'EU arrive au sixième rang (17 788). Ajoutons maintenant P21 (« sexe ou genre ») à la requête et regroupons les résultats par propriété et par genre : SELECT DISTINCT ?property ?sexe (count(?person) as ?total)
WHERE
{
?property rdf:type wikibase:Property ;
wdt:P31/wdt:P279* wd:Q55452870 ;
wikibase:directClaim ?propertyMainValue .
?person ?propertyMainValue [] ;
wdt:P31 wd:Q5 ;
wdt:P21 ?sexe .
SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en" }
} group by ?property ?sexe
order by ?property ?sexe
Avec beaucoup de travail supplémentaire, on peut obtenir le % du contenu qualifié de Q6581072 (« féminin ») et de Q6581097 (« masculin ») pour chacune des ressources externes listées : #Évaluer le contenu de genre masculin et féminin d'encyclopédies diverses
select ?property ?propertyLabel ?propertyDescription
(group_concat(concat(str(?sexe_label_final),
": ",
str(?effectif), " ",
"(", str(round(?effectif / sum(?effectif) * 100)), "%",")") ; separator=" - ") as ?sexes)
(sum(?effectif) as ?total)
with {
select ?property ?sexe (count(?person) as ?effectif)
{
?property rdf:type wikibase:Property ;
wdt:P31/wdt:P279* wd:Q55452870 ;
wikibase:directClaim ?propertyMainValue .
?person ?propertyMainValue [] ;
wdt:P31 wd:Q5 .
optional {
?person wdt:P21 ?sexe2 .
bind(if(isBlank(?sexe2), "inconnu", ?sexe2) as ?sexe3)
}
bind(if(!bound(?sexe3), "non specifié", ?sexe3) as ?sexe)
} group by ?property ?sexe
order by ?property ?sexe
} as %dataset
where {
{
select ?property ?propertyLabel ?propertyDescription ?sexe ?sexe_label_final ?effectif{
include %dataset .
optional { ?sexe rdfs:label ?label_sexe filter langmatches(lang(?label_sexe), "fr") }
SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en". }
bind (if(bound(?label_sexe), ?label_sexe, ?sexe) as ?sexe_label_final)
}
}
bind( (?effectif / ?total ) as ?pourcent)
} group by ?property ?propertyLabel ?propertyDescription
Enfin, pour trouver les équivalents pour Wikidata, Wikipédia en anglais et Wikipédia en français, on devrait utiliser la requête suivante en enlevant les dièses (#) pour le genre et le wiki désirés : SELECT DISTINCT (COUNT(?item) AS ?count) WHERE {
#Pour frwiki et enwiki, remplacez la ligne précédente par : SELECT DISTINCT (COUNT(?article) AS ?count) WHERE {
?item wdt:P31 wd:Q5 .
#féminin ?item wdt:P21 wd:Q6581072 .
#masculin ?item wdt:P21 wd:Q6581097 .
#Wikipédia en anglais : OPTIONAL {?article schema:about ?item ; schema:isPartOf <https://en.wikipedia.org/> .}
#Wikipédia en français : OPTIONAL {?article schema:about ?item ; schema:isPartOf <https://fr.wikipedia.org/> .}
}
Malheureusement, en ce qui concerne le contenu de Wikipédia en anglais et en français, ces requêtes ne fonctionnent que pour le genre féminin. Les autres dépassent le temps de calcul alloué pour l'outil. Il faut donc se contenter des statistiques déjà publiées à ce niveau[1],[7],[8]. Enfin, si quelqu'un arrivait à adapter les requêtes précédentes pour établir des statistiques de personnalités provenant de l'hémisphère nord vs. sud, ça serait cool. Je pense qu'il faudrait remplacer P21 par un Courrier du lectoratIl nous fera plaisir de lire les messages déposés ici et, si nécessaire, d'y répondre dans les plus brefs délais.
Citations originales
Notes
Références
|