Wikipédia:RAW/2018-08-01


Brèves

          2 000 000 — Wikipédia en français a atteint les deux millions d'articles vers h CEST le 8 juillet 2018 à la suite de la création par bot (programme d'édition automatique de l'encyclopédie) d'environ 300 articles sur des formations géologiques de la planète Vénus. Le deux millionième article serait Xcacau Corona.
  • Wikipédia:Deux millions d'articles en français
  • Wikimedia France souligne ce passage en publiant des textes sur des contributeurs de la Wikipédia en français. La contributrice Tsaag Valren, qui détient le record du nombre d'articles labellisés en français (et peut-être de toutes les Wikipédias linguistiques), est mise en valeur. Le wikicartographe Sémhur est également à l'honneur : « Quand je dis autour de moi que je crée des cartes pour Wikipédia, je vois souvent la réaction suivante : « Mais pourquoi faire ? Y a Google Maps ! » Il faut alors que j’explique que les cartes de Google sont tout sauf libres, et de plus, ne présentent que la situation actuelle. Or, une grande part des demandes concerne la création de cartes historiques, et là Google Maps ne peut pas les fournir… » Selon le wikiphotographe Rama, « l’écriture d’une encyclopédie est l’un des projets les plus politiques qui soient. »

POTY 2017Le second tour du vote pour l'image de l'année 2017 Commons (POTY) s'est déroulé jusqu'au 22 juillet. Les 3 832 votants pouvaient sélectionner jusqu'à trois images parmi 59 images, elles-mêmes pré-sélectionnées parmi 1 260 images lors du premier tour. Les résultats ont été annoncés le 30 juillet.

Valeurs des données — [NdE : Wikipédia est une banque de données, notamment par ses articles. Si ses données étaient fausses, peu d'internautes se fieraient à l'encyclopédie libre et devraient se tourner vers d'autres sources d'informations fiables qui sont, pour la plupart, payantes. Les données de Wikipédia ont donc une valeur monétaire.] Deux économistes américains proposent que les données personnelles soient compensées monétairement, à l'image du travail rémunéré. Ils rappellent que les systèmes d'intelligence artificielle ont besoin de données pour produire des résultats et des comportements pertinents. Alors que voici quelques décennies, ces données étaient issues de quelques personnes (par exemple, un mécanicien de locomotive transmettait son savoir de façon orale, qui était alors traduit en système expert), les systèmes contemporains analysent des centaines de milliers de données pour en dégager un modèle statistique (par exemple, après avoir « observé » un million de photos, un système reconnaît le sexe d'une personne à partir d'une seule photo du visage). « À moins de connaître la bonne réponse (fournie par des humains), les algorithmes sont incapables de traduire les langues, comprendre le discours ou reconnaître les objets dans les images. »[trad 1] En conséquence, les données peuvent être vues comme une forme de travail [NdE : si l'humain donnait n'importe quelle réponse, le système serait incapable de fournir la bonne réponse ; la collaboration honnête de l'humain est donc essentielle à la réussite du système.] L'un des auteurs envisage même la création d'un syndicat (ou d'un ordre professionnel) des travailleurs des données. [1] [NdE : En passant, quelle est la valeur financière de Wikipédia ? Vous hésitez entre centaines de millions et centaines de milliards de dollars ? Consultez cette brève de 2013.]

Dossier 2016/0280 (suite) — La proposition de directive sur le droit d'auteur dans le marché unique numérique a suscité la controverse parmi plusieurs acteurs d'Internet, notamment les GAFAM. La Wikipédia en italien a aussi exprimé son opposition au projet de loi en affichant en page d'accueil, le 4 juillet 2018, l'affiche ci-dessous.

D'autres wikis ont protesté contre cette proposition, dont les Wikipédias en anglais, en espagnol et en portugais. Voyez ces captures d'écran. La proposition a été rejetée le 5 juillet, mais elle peut être modifiée et présentée à nouveau le 5 septembre 2018. Selon Wikimédia France, la « position française n’est pas du tout représentative de la position qui prévaut dans le reste de l’Union européenne. La France est de loin le pays qui a le plus soutenu ce projet de directive. » L'association craint « que les exigences excessives du projet de directive ne conduisent en fin de compte à accroître la domination d’internet par les grandes entreprises qui disposent des ressources nécessaires pour mettre en place des systèmes de filtrage lourds. Cela va à l’encontre de la vision d’un internet ouvert qui a favorisé la création de Wikipédia. » [2]

Économie circulaire et libre diffusion des connaissances — Un billet du blog anglophone de Wikimedia relatait en juin dernier le projet équatorien Offline-Pedia, développé par deux étudiants ingénieurs et une équipe de la Yachay Tech University, de la province d'Imbabura. Leur idée était de réutiliser de vieux téléviseurs pour créer des bornes multimédia dans des villages privés d'accès à internet, pour leur apporter les connaissances de Wikipédia.

Un des étudiants, Joshua Salazar, raconte comment il a grandi dans une petite communauté rurale de la cordillère des Andes, passionné dès son plus jeune âge par les encyclopédies multimédia, mais sans le moindre accès à internet. De cette frustration est née plus tard l'envie de trouver un moyen simple et économique pour permettre l'accès aux connaissances à partir d'un lieu sans accès internet.

Une autre façon de recycler un vieux téléviseur. Il ne manque plus qu'un arrosage automatique géré par le contrôleur Arduino !
Une autre façon de recycler un vieux téléviseur. Il ne manque plus qu'un arrosage automatique géré par le contrôleur Arduino !

Le prochain passage de l'Équateur à la télévision numérique prévu pour fin 2018, rendant les téléviseurs à tube cathodique bientôt obsolètes, les a alors amenés à combiner tous ces éléments pour créer une borne d'accès numérique, hors ligne et bon marché.

Le système est basé sur les logiciels libres Kiwix pour le contenu enregistré sur une carte microSD, Raspbian pour le système d'exploitation, Raspberry Pi pour le matériel informatique, des matériaux peu chers et recyclables comme du bois pour le boîtier, et un vieux téléviseur recyclé en guise d'écran, le tout pour un coût d'environ 100 dollars américains.

Une fois la première borne terminée et installée, les concepteurs ont été surpris par l'intérêt des jeunes habitants de ce village rural pour le texte de Roméo et Juliette et son auteur William Shakespeare ! Passée cette surprise, étant eux-mêmes plutôt intéressés par les sciences et la technologie, ils ont démarré une seconde phase du projet, avec l'aide d'un professeur de sociologie, pour mieux comprendre les besoins des utilisateurs de cette borne d'accès à Wikipédia et aux autres contenus de Raspbian et Kiwix. Les concepteurs souhaitent aussi travailler avec le ministère de l'Éducation d'Équateur pour développer de tels projets, économiques et éducatifs, et faciliter l'accès à l'incroyable diversité thématique et linguistique des connaissances librement diffusées grâce à Wikipédia. [3]

Le contenu de l'encyclopédie Wikipédia entre le pouce et l'index.

Partenariat avec Kiwix — La fondation Wikimedia a annoncé en juillet un partenariat avec le logiciel libre Kiwix, qui permet l'accès aux contenus des Wikipédias et d'autres projets (Wiktionnaire, Wikivoyage, Wikisource, Vikidia, Gutenberg, conférences TED), sans avoir besoin de connexion internet. La solution Kiwix est disponible pour les principaux systèmes d'exploitation : Windows, Linux, iOS et Android. Elle est actuellement utilisée par 3 millions de personnes réparties dans plus de 200 pays, qui peuvent ainsi accéder aux connaissances de Wikipédia disponibles dans 291 langues.

Cette nouvelle étape de la stratégie Wikimedia pour 2030 permettra le développement de l'accès aux connaissances des Wikipédias envers les populations qui ne disposent pas d'accès à internet. [4]

Discuter (les commentaires sont automatiquement inclus ici)

Dans les coulisses de la Wikimedia

Abus des ressources — Les développeurs de la WMF ont décidé de créer un groupe, nommé « administrateurs d'interface », dont seuls les membres auront le droit de modifier le code CSS et le code JavaScript qui influence l'ensemble d'un wiki. Cette mesure entrera en vigueur à la fin août 2018. La WMF souhaite appliquer cette mesure pour contrer l'abus des ressources informatiques de l'écosystème, affirmant que les comptes d'administrateurs sont régulièrement volés. Le cas d'abus le plus problématique semble l'exécution clandestine de programmes JavaScript sur les appareils des lecteurs d'un wiki dans le but de faire du « cryptominage ». La WMF mentionne également que le code CSS pourrait servir à relier un compte utilisateur à son propriétaire IRL. (fr)[5] En ce qui concerne la Wikipédia en français, puisque le temps de discuter de son application et de son implantation sur le site est de deux semaines, le collège des administrateurs a décidé que n'importe quel administrateur pourrait déposer une demande sur le bulletin des administrateurs ou le bulletin des bureaucrates, la décision d'octroyer le statut revenant au collège des administrateurs. Dans la pratique, des administrateurs jugent qu'environ 10 contributeurs feront partie de ce groupe. Cette procédure, simple, pourra être remplacée par une procédure décidée par la communauté wikipédienne. (fr)[6]

Bases — Depuis quelque mois, une dizaine de modèles créant automatiquement des liens externes vers des bases de données à partir des éléments Wikidata associés aux articles sur lesquels ils sont apposés ont été créés (voir, par exemple, Modèle:Bases littérature, Modèle:Bases recherche et Modèle:Bases vie publique, tous trois créés en juin 2018). Pour un exemple de rendu, voyez par exemple Simone Veil, à la suite des notices d'autorité.
Les discussions concernant ces modèles ont été centralisées sur Discussion Projet:Bases.

ACREQ — Il s'agit de l'acronyme d'une nouvelle règle de la Wikipédia en anglais qui interdit aux comptes qui ne sont pas auto-confirmed de créer des articles. Cette règle, qui ne peut être appliquée qu'avec la « collaboration » du moteur de Wikipédia, était demandée depuis six ans. Dès son application, le nombre de nouveaux articles est descendu au niveau observé lors d'une période d'essai de six mois. Cette règle semble justifiée par deux raisons : trop d'articles à l'état d'ébauche qui sont abandonnés par leur créateur et pas assez de contributeurs pour améliorer ces ébauches (en y ajoutant notamment des sources). [7]

NPP — Un acronyme de l'équipe de la Wikipédia anglophone chargée de valider le caractère encyclopédique d'articles identifiés comme potentiellement hors du périmètre encyclopédique. Créé en 2016, le groupe New pages patrol est parvenu à réduire le nombre d'articles à valider de 22 000 à 700 aujourd'hui. Ses prochaines missions ? Trouver et éliminer « les violations de copyright, les spams de plus en plus nombreux et les contributeurs black hat »[trad 2]. [8]

DBLPWikidata a aussi été adopté par le Digital Bibliography & Library Project (DBLP), catalogue de bibliographies en informatique publié en Allemagne depuis les années 1980. Par exemple, naviguez à [9] et survolez les icônes en vis-à-vis de « David H. Evans », le lien Wikidata se « cache » sous l'icône qui représente une personne.

De SVG à PNG — Vous serez parfois tenté de reprendre une illustration de Wikimedia Commons. Quant il s'agit d'une photo, il suffit de la télécharger sur votre ordinateur, de l'insérer dans un texte, d'attribuer correctement la source et l'auteur, et voilà ! Toutefois, des logiciels refusent d'insérer des illustrations au format SVG (tel Microsoft Word). Il est alors tentant de recourir à un logiciel pour convertir au format PNG, par exemple, mais certains sont payants, d'autres lourds à utiliser. Que faire ? La solution se trouve, littéralement, sous votre nez ;-). Par exemple, naviguez à cette page et observez sous l'illustration le texte : « Cette image restituée en PNG dans d’autres tailles : 200px, 500px, 1000px, 2000px. » Ce service est offert pour tous les fichiers au format SVG. Donc, pas besoin de logiciel tiers, le moteur de Wikimedia Commons se charge de la conversion :-).

Au moins toutes les encyclopédies classiques — Quand Wikipédia en français atteindra-t-elle 3 000 000, 5 000 000 ou 10 000 000 d'articles ? Est-ce que la version en français de l'encyclopédie doit avoir un nombre maximum d'articles et, si oui, quel est-il ? Est-ce que le nombre d'articles actuel est près ou loin de cela ?
Dans tous les cas, Wikipédia se doit d'avoir des entrées sur tous les sujets traités par d'autres encyclopédies reconnues. Voici une liste des éléments de Wikidata possédant un lien vers L'Encyclopédie canadienne (EC) et ne possédant pas d'article sur frwiki, par ordre décroissant de versions linguistiques dans lesquelles ces articles sont présents :

Discuter (les commentaires sont automatiquement inclus ici)
« Wikipedia est peut-être le meilleur exemple de connaissance par production participative,
mais ses pages sont susceptibles d'abus, d'erreur de caractérisation et de modifications arbitraires[trad 3],[1].
 »

— Issie Lapowsky
Rédigé/traduit par Cantons-de-l'Est, Simon Villeneuve et Djiboun.
Citations originales
  1. (en) « Unless they know what the right answers (provided by humans) are meant to be, algorithms cannot translate languages, understand speech or recognise objects in images. »
  2. (en) « copyright infringements, ever increasing spammers, and black-hat users »
  3. (en) « Wikipedia may be the world's most successful attempt at crowdsourcing knowledge, but its pages are also susceptible to abuse, mischaracterization, and arbitrary changes. »
Notes
Références
  1. (en) Issie Lapowsky, « The Real Reason Google Search Labeled the California GOP as Nazis », Wired,‎ (lire en ligne).
    Article publié dans la foulée d'une accusation malveillante contre le parti républicain américain.